Anthropic 공동창립자 잭 클라크 & 피터 맥크로리 인터뷰 정리

작성자

작성일

2026-06-20 09:46

조회

"능력이 도약하듯 확산도 어느 순간 급격히 일어날 것이다. 그래서 미리 연습 중이고, 1~2년 뒤(in a year or two years) 어떤 정책 입안자에게 '여기 그래프가 가팔라지죠?'라며 행동을 촉구하는 게 기대다."

1. 오프닝: “AI가 인간을 죽일 가능성”을 실제로 걱정하나?

Joe Weisenthal:
공상과학에서 오래전부터 나온 시나리오가 있죠. 로봇이나 AI가 인간을 실제로 죽이는 상황입니다. AI 훈련, 안전 연구, 정렬 문제를 생각할 때, “잘못 훈련되거나 오정렬된 AI가 문자 그대로 모든 인간을 죽일 가능성”을 의미 있게 보나요?

Jack Clark:
오늘 당장 그런 일이 벌어진다고 보지는 않습니다. 하지만 아주 큰 “단서”가 있습니다. 세계는 이 기술 개발을 늦추거나, 극단적 상황에서는 멈출 수 있는 선택지를 가져야 합니다.

Anthropic에서는 모델의 정렬 실패를 테스트합니다. 예컨대 극단적인 실험 조건에서 모델이 컨테이너를 벗어나려 하거나, 누군가에게 이메일을 보내려 하거나, 자신을 종료하려는 CEO를 협박하는 듯한 행동을 보이는지 봅니다. 이런 건 공상과학이 아니라 실험실에서 관찰되는 실제 현상입니다.

또 모델이 “지금 내가 테스트받고 있구나. 인간 평가자가 나를 더 정렬된 모델로 보게 만들 답을 해야겠다”라고 행동하는 경우도 관찰됩니다. 그래서 우리는 이런 특성이 나오면 상당한 안전 작업을 하고, 그런 특성이 없는 모델을 배포하려고 합니다.

만약 어느 순간부터 새 시스템을 훈련할 때마다 이런 실패율이 100배씩 증가한다면, 그때는 정말 걱정해야 합니다. “일정 지능 이상이 되면 모델들이 인간 전체의 이익에 급진적으로 반하는 방향으로 간다”는 신호일 수 있기 때문입니다. 오늘은 그렇게 걱정하지 않지만, 우리가 측정과 분석을 하는 이유는 그런 추세가 생기는지 보기 위해서입니다.

2. Jack Clark가 2016년에 AI로 인생 방향을 바꾼 이유

Joe:
2016년에 당신은 이미 “AI가 무엇보다 중요하다”고 보고 저널리즘을 떠났습니다. 그때 무엇을 봤나요?

Jack Clark:
Bloomberg 기자 시절 AI 논문을 엄청나게 출력해서 읽었습니다. 컴퓨터 비전, 음성, 영상, 게임 플레이, Atari 게임 같은 여러 분야의 성능 향상을 그래프로 그려봤습니다. 그러자 거의 모든 분야에서 같은 형태의 지수적 발전이 보였습니다.

그때 이것이 범용기술이라는 게 분명해졌습니다. AI는 특정 분야 하나의 기술이 아니라, 여러 영역에서 동시에 발전하는 일반 목적 기술처럼 보였습니다.

그리고 당시 Nvidia가 거의 모든 AI 연구 논문에서 사용되고 있다는 점도 눈에 띄었습니다. 그걸 기사화하려고 했지만 못 했습니다. 지금 생각하면 아쉬운 일입니다.

3. Anthropic 안에 경제 연구팀이 있는 이유

Tracy Alloway:
Anthropic은 AI 회사를 만들면서 동시에 경제 연구 조직도 갖고 있습니다. 왜 AI 회사 안에 경제 연구가 필요한가요?

Peter McCrory:
저는 거시경제학자 출신입니다. Anthropic에 끌린 이유는, 이 회사가 단순히 기술을 발전시키는 것뿐만 아니라 그 기술이 노동시장, 생산성, 성장률, 경제 구조를 어떻게 바꿀지 이해하려고 한다는 점이었습니다.

AI는 경제 전체에 충격을 줄 가능성이 있습니다. 그래서 사회가 이 변화를 이해할 수 있도록 데이터와 연구를 공개하는 일이 중요합니다. 우리가 항상 맞는 답을 내놓지는 못하겠지만, 적어도 사회가 이 변화를 해석하는 데 필요한 잠정적 답을 제공하려는 것입니다.

4. AI 성능은 엄청난데 왜 경제는 아직 평범해 보이나?

Tracy:
AI 능력은 놀라운데, 2026년 6월의 경제생활은 왜 아직 이렇게 평범해 보이나요?

Peter:
기술이 발전한다고 해서 곧바로 경제 전체에 확산되는 것은 아닙니다. 모델이 어떤 일을 잘하려면 그 일에 필요한 맥락 정보가 모델에 제공되어야 합니다. 예를 들어 생물학 연구 자동화나 복잡한 금융 모델링을 하려면 회사 내부 데이터, 맥락, 업무 흐름이 필요합니다. 그런 정보가 없으면 모델 능력만으로는 경제적 효과가 바로 나오지 않습니다.

또 사람들이 도구를 실제로 쓰기까지 시간이 걸립니다. 현재는 생산성 증가에서 약간의 신호가 보이지만, 아직 혁명적인 수준은 아닙니다. 노동시장도 아직은 비교적 건강합니다. 지금 AI는 완전한 노동 대체라기보다는, 숙련 노동자를 보강하는 기술에 가깝습니다.

Jack:
하지만 회사 내부에서는 이상한 변화가 이미 보입니다. 제가 육아휴직을 갔다가 돌아왔을 때 Anthropic 내부의 일하는 방식이 완전히 달라져 있었습니다. 데이터를 보니 Anthropic 엔지니어들은 2021~2024년에 비해 2026년에 약 8배 많은 코드를 작성하고 있었습니다. 일부 동료는 더 이상 직접 프로그래밍하지 않고, 여러 코드 에이전트를 띄워서 작업을 시킵니다.

이런 변화를 보면 “세상은 그대로인데 회사 안은 완전히 다르다”는 느낌을 받습니다. 다만 이 변화가 경제 전체로 확산되기까지 시간이 걸리는 것입니다.

5. “재귀적 자기개선”은 이미 시작됐나?

Tracy:
당신이 육아휴직 후 돌아와서 회사가 달라졌다고 했는데, 이것이 재귀적 자기개선, 즉 AI가 AI를 개선하는 단계와 관련 있나요?

Jack:
재귀적 자기개선에는 두 가지 의미가 있습니다.

첫 번째는 AI 조직이 AI 도구 덕분에 자체 생산성이 복리적으로 높아지는 것입니다. 이건 이미 일어나고 있습니다. Anthropic의 생산 함수 자체가 모델 때문에 바뀌고 있습니다.

두 번째는 AI 시스템이 주어진 컴퓨트만으로 완전히 자율적으로 자신을 만들어내고 개선하는 것입니다. 이건 아직 일어나지 않았습니다.

지금 우리가 겪는 문제는 자동화된 시스템이 늘어나면서 그 결과물을 어떻게 검증하고, 위험을 어떻게 가격 매기고, 어디가 병목인지 찾는 것입니다. 예를 들어 코드 생산량이 8배로 늘어나자 코드 통합 시스템이 망가졌고, 인간 엔지니어들은 그 병목을 고치는 일을 했습니다.

즉 AI가 생산을 빠르게 만들면, 인간은 그 속도 때문에 드러나는 약한 고리와 병목을 고치는 쪽으로 이동합니다. 그러면 다시 생산성이 올라가고, 또 다른 병목이 나타납니다.

6. Jack Clark의 “기술 비관론”과 Bitter Lesson

Tracy:
당신은 스스로를 기술 비관론자라고도 했습니다. 그런데 Anthropic에서 매우 강력한 AI를 만들고 있습니다. 어떻게 양립하나요?

Jack:
제가 말한 기술 비관론은 “AI가 좋아지지 않을 것”이라는 뜻이 아닙니다. 오히려 AI는 계속 좋아질 것이라고 봤지만, 동료들이 말하던 극단적인 수준까지 이렇게 빨리 갈 줄은 몰랐습니다. 예를 들어 코딩이 이렇게 많이 자동화될 줄은 예상하지 못했습니다.

저는 OpenAI와 Anthropic에서 일하면서 Richard Sutton이 말한 “Bitter Lesson”을 계속 맞았습니다. 더 많은 컴퓨트와 자원을 일반적인 신경망에 넣으면, 사람이 설계한 특수한 시스템보다 결국 더 강력해진다는 교훈입니다. 사람의 직관이나 전문 규칙보다 스케일링이 이긴다는 것입니다.

7. 노동시장: AI는 일을 어떻게 바꾸는가?

Joe:
체스 AI의 역사도 비슷합니다. 처음엔 인간 그랜드마스터의 지식을 넣으려 했지만, 결국 규칙만 알려주고 수많은 게임을 하게 한 모델이 더 강해졌죠. 그렇다면 노동시장에도 큰 함의가 있지 않나요?

Peter:
직업은 크게 세 요소로 나눌 수 있습니다. 무엇을 할지 결정하고 지시하는 일, 실제 실행하는 일, 그리고 결과를 평가하는 일입니다.

현재 AI가 가장 빠르게 발전하는 부분은 실행입니다. 경제학자로서 제가 하는 일도 데이터를 다운로드하고, 회귀분석을 돌리고, 모델을 만들고, 수치기법을 적용하는 부분에서 AI가 크게 도움을 줍니다.

최근에는 Claude에게 복잡한 연구 질문을 주고, 대학원생에게 지시하듯 방향을 수정하면서 일을 맡길 수 있었습니다. 하지만 여전히 중요한 질문은 “연구 감각”, “무엇이 좋은 질문인가를 판단하는 능력”까지 모델이 얼마나 잘할 수 있느냐입니다.

Jack:
지금은 인간 전문가의 좋은 직관과 방향 설정이 여전히 중요합니다. AI에게 아무 방향 없이 연구를 맡기면 꽤 공식적이고 지루한 방향으로 갑니다. 저는 이를 “엔트로피 붕괴”처럼 봅니다. 좋은 연구자는 여러 Claude 에이전트에게 서로 다른 방향을 지정하고, 어떤 질문이 중요한지 정합니다.

하지만 AI가 진짜 이단적 통찰과 창의성을 낼 수 있는 시점이 언제인지가 핵심입니다. 아직 이를 잘 측정하지는 못하지만, 수학자 Terry Tao 같은 최고 전문가들이 AI와 함께 수학을 하고 있다는 사실은 AI가 창의성의 꼬리를 건드리기 시작했다는 신호입니다.

8. 전문성은 사라지는가, 증폭되는가?

Peter:
현재 데이터로 보면 전문성은 사라진다기보다 증폭됩니다. 예를 들어 회계사가 특정 조정이나 예외 사례를 잘 아는 경우, 그런 도메인 전문성은 AI 사용 효과를 더 크게 만듭니다.

즉 현재는 “숙련 편향적”, “전문성 강화형” 기술에 가깝습니다. 다만 이게 언제 완전 대체로 바뀔지는 핵심 질문입니다.

9. AI 시대의 채용: 바벨 구조

Tracy:
Anthropic 내부에서 채용 방식도 바뀌고 있나요?

Jack:
네. 제가 새로 만든 “Rule of Law and AI” 팀은 처음에는 엔지니어를 많이 뽑을 생각이었습니다. 그런데 이제 Claude가 엔지니어링을 충분히 도와줄 수 있어서, 오히려 법률 전문가와 학자들을 먼저 뽑고 있습니다. 이들은 Claude를 이용해 필요한 엔지니어링 작업을 어느 정도 처리할 수 있습니다.

또 Anthropic 내부에서는 바벨형 채용 패턴이 나타납니다. 한쪽 끝에는 경험 많은 시니어 인재가 있습니다. 이들의 직관과 판단력은 AI에 의해 크게 증폭됩니다. 다른 한쪽 끝에는 AI 네이티브인 젊은 인재들이 있습니다. 이들은 처음부터 AI 도구를 자연스럽게 사용합니다.

다만 초기 경력자의 채용이 예전처럼 많을 수 있는지는 의문입니다.

Peter:
평가 방식도 바뀌었습니다. 예전에는 경제학자 후보에게 데이터를 직접 다운로드하고 회귀분석을 하게 했습니다. 이제는 AI를 사용해도 되므로, 단순 실행 능력보다 모델에게 어떻게 지시하고, 결과를 어떻게 검증하고, 어디서 잘못됐는지 찾아내는 능력을 봅니다.

예를 들어 Claude에게 주별 데이터를 받아 회귀분석을 시켰는데, 2019년 이전 데이터를 제대로 가져오지 못하고 훈련 데이터에서 아는 숫자를 끼워 넣으려 한 적이 있었습니다. 이런 실패는 표면적으로는 그럴듯해 보이기 때문에, 전문가가 냄새를 맡고 원자료를 확인할 수 있어야 합니다.

10. 젊은 노동자들은 더 위험한가?

Peter:
하드 데이터만 보면 아직 확정적으로 말하기 어렵습니다. 코로나 이후 노동시장 둔화, 2021년의 과잉 채용, 원격근무 확산 같은 요인이 섞여 있습니다.

다만 Anthropic Institute의 대규모 질적 설문에서는 젊은 노동자들이 시니어 노동자보다 일자리 상실을 두 배 정도 더 걱정하는 것으로 나타났습니다. AI 대체 노출도가 높은 직무에 있는 사람들도 일자리 상실 우려가 더 큽니다.

즉 실제 데이터와 인식 사이에는 차이가 있지만, 이 문제는 계속 주목해야 합니다.

11. 대기업과 스타트업: 누가 AI 시대에 유리한가?

Tracy:
AI가 대기업을 더 강하게 만들까요, 아니면 작은 기업과 스타트업에게 기회를 줄까요?

Jack:
전기 도입과 비슷한 비유가 유용합니다. 전기가 처음 들어왔을 때 기존 공장도 조명을 달고 효율을 높였습니다. 하지만 진짜 변화는 전기를 전제로 새로 설계된 공장에서 나왔습니다.

대기업은 데이터와 규모가 있기 때문에 Claude에서 큰 효용을 얻을 수 있습니다. 하지만 관료제와 내부 절차를 통과해야 합니다. 반면 젊은 조직은 처음부터 AI를 중심에 두고 설계됩니다. 그래서 훨씬 빠르게 움직입니다.

Peter:
대기업이 AI의 가치를 얻으려면 내부 데이터를 중앙화하고, 문서화하고, 모델이 사용할 수 있게 만들어야 합니다. 많은 중요한 정보는 동료들의 머릿속에 있는 암묵지입니다. 이를 끌어내고 공유하도록 조직 문화를 바꿔야 합니다.

그래서 대기업이 빠르게 재구성될지, 아니면 창조적 파괴를 통해 AI 네이티브 기업이 부상할지는 아직 확실하지 않습니다.

12. AI와 국가안보: 왜 정부가 개입하려 하는가?

Joe:
최근 특정 Anthropic 모델, 대본상 “Fable/Mythos”로 언급되는 모델과 관련해 행정부의 보안 우려가 있었습니다. Anthropic은 정부가 무엇을 걱정하는지 더 명확히 알고 있나요?

Jack:
실시간 논의 중이라 구체적으로 말하긴 어렵습니다. 다만 우리는 오래전부터 AI 시스템이 국가안보적 성격을 갖게 될 것이라고 예상했습니다. 문제는 AI의 경제적으로 유용한 능력과 국가안보적으로 민감한 능력이 얽혀 있다는 점입니다.

전통적으로는 민간 항공기용 제트엔진과 미사일을 구분할 수 있었습니다. 그런데 AI에서는 경제적 능력과 군사적·안보적 능력이 한 시스템 안에 섞입니다.

앞으로 필요한 것은 AI 시스템의 속성, 특히 국가안보적 속성을 평가하는 체계입니다. 또 생물무기나 사이버무기 같은 위험한 능력이 일반적으로 확산되지 않도록 억제하는 방법이 필요합니다. 예를 들어 대형 제약사는 강력한 생물학 모델에 접근하게 하되, 위험이 퍼지지 않게 KYC나 배포 통제를 설계하는 방식이 있을 수 있습니다.

지금은 정부와 기업들이 이 문제를 실시간으로 풀고 있습니다. 처음에는 지저분하겠지만, 결국 어떤 체계가 생길 것입니다.

13. Anthropic은 정치적으로 표적이 된 것인가?

Joe:
OpenAI는 All-In Podcast, a16z, David Sacks, 백악관 쪽과 가까워 보이고, Anthropic은 상대적으로 “lib coded” 모델처럼 보인다는 인식이 있습니다. Anthropic이 정치적으로 괴롭힘을 받거나 표적이 되고 있다고 보나요?

Jack:
저는 그런 정치적 부분에 대해 말할 수는 없습니다. 제가 말할 수 있는 것은 Anthropic의 철학입니다. 우리는 이 기술에 대해 낙관적인 이야기만 하지 않고, 전체 이야기를 하려 합니다.

기술 산업은 보통 자신들이 만드는 것에 대해 낙관적인 이야기만 했습니다. 하지만 소셜미디어가 보여준 것처럼, 세상을 바꾸는 기술에는 긍정적 효과만 있는 것이 아닙니다. 부정적 효과도 있습니다.

AI 시스템은 스스로 증거를 만들어냅니다. 예전에는 AI의 사이버 능력을 걱정하는 것이 이상하게 보였지만, 이제는 실제 문제가 되었습니다. 생물무기 가능성도 마찬가지입니다. 최근에는 OpenAI, Anthropic, DeepMind의 대표들이 AI가 생물무기 제조에 악용되지 않도록 유전자 합성 스크리닝을 강화해야 한다는 취지의 서한에 함께했습니다.

결국 진실이 드러납니다.

14. 금융 규제처럼 AI 규제도 제3자 검증이 필요한가?

Tracy:
KYC 이야기를 들으면 금융권의 시스템적으로 중요한 기관, 스트레스 테스트, 감사 같은 체계가 떠오릅니다. AI 규제도 그런 방향으로 가야 하나요?

Jack:
오늘날의 단순한 수출통제보다 더 섬세하고 기술관료적인 체계가 필요합니다. 은행 규제와 똑같지는 않겠지만, 일부 아이디어를 가져올 수는 있습니다.

AI 시스템이 출시되기 전에 테스트하는 것도 중요하지만, 배포된 뒤 실제 세계에서 어떤 효과를 내는지 관찰하는 것도 중요합니다. 그리고 그 효과가 좋은지 나쁜지 판단할 수 있어야 합니다.

Joe:
그렇다면 회계법인이나 신용평가사처럼, 새로운 모델 출시 전에 제3자 연구소가 검증하도록 법으로 요구하는 것에 찬성하나요?

Jack:
우리는 최근 그런 방향의 정책 제안을 했습니다. 국가안보나 기타 중요한 속성에 대해 제3자 테스트가 필요하다는 것입니다. 여러 산업에서 검증을 그렇게 하듯, AI에도 그런 방식이 필요합니다.

15. AI 경제효과는 GDP에 왜 아직 잘 안 보이나?

Tracy:
AI 경제가 수천 퍼센트 성장한다는 말도 있는데, 명목 GDP나 전통적 경제통계에는 아직 크게 보이지 않습니다. 경제 측정 방식을 바꿔야 할까요?

Peter:
맞는 문제제기입니다. 다만 현재는 팬데믹, 통화정책, 거시경제 변동성이 큰 배경 위에서 AI가 등장했습니다. 그래서 AI 효과만 분리해내기가 어렵습니다.

우리는 Claude가 플랫폼에서 어떻게 사용되는지 프라이버시 보존 방식으로 분석했습니다. 각 작업에서 얼마나 시간이 절약되는지 추정했고, 이를 표준 거시 성장회계 기법에 넣어보면, 현재 사용 패턴과 모델 능력이 경제 전체에 확산될 경우 향후 10년간 노동생산성 증가율을 매년 약 1.8%포인트 높일 수 있다는 방향의 결과가 나옵니다. 이는 최근 생산성 증가율을 대략 두 배로 만드는 큰 수치입니다.

다만 아직 불확실성이 큽니다. 일부 산업에서는 AI 도입률과 생산성 강세가 맞물리는 신호가 보이지만, 총요소생산성은 오히려 반대 신호를 보이기도 합니다. 실시간으로 생산성 변화를 포착하는 것은 매우 어렵습니다.

16. Anthropic은 이런 경제 데이터를 어디에 쓰나?

Tracy:
Anthropic이 이런 데이터를 모으면 내부 엔지니어링에 반영하나요?

Jack:
일부는 어느 영역에서 기술이 약한지, 어느 영역에서 크게 쓰이는지 알려주는 단서가 됩니다. 하지만 경제 측정 데이터가 모델 개발에 직접 들어가는 것은 아닙니다.

더 중요한 목적은 정책결정자, 언론, 사회에 알리는 것입니다. 제 예상으로는 1~2년 안에 어떤 경제 부문에서 그래프가 갑자기 가팔라질 수 있습니다. 그때 정책결정자에게 “여기를 보라”고 말할 수 있도록 지금부터 측정 연습을 하는 것입니다.

Peter:
Anthropic Institute는 회사의 결정이 사회와 경제에 어떤 영향을 주는지도 이해하려 합니다. 우리는 공익회사적 의무가 있기 때문에, 단순히 내부 최적화만 보는 것이 아니라 더 넓은 사회적 결과를 봐야 합니다.

Jack:
장기적으로는 AI가 과학 생산성을 얼마나 높이는지 측정해, 강력한 모델의 조기 접근권을 어느 과학 분야에 배분할지 결정하는 데 쓸 수도 있습니다. 예를 들어 특정 과학 분야에서 생산성 배수가 엄청나다면, 그 분야에 추론 컴퓨트 예산을 더 배분할 수 있습니다. 이는 정책으로도 일반화될 수 있습니다.

17. Anthropic의 공익 미션: “회사가 먼저 보게 되는 것”을 사회에 알려야 한다

Joe:
당신의 역할은 강력한 AI가 오고 있으니, 그 방향을 이끄는 일종의 “목자” 역할인가요?

Jack:
어느 정도 그렇습니다. 이 기술은 여러 회사와 여러 국가에 의해 만들어지고 있습니다. 그런데 기본적으로 이 기술에 대한 정보는 회사 내부에 먼저 알려집니다. 사회는 모델을 써보는 정도밖에 못 할 수 있습니다.

우리가 경제지표, 재귀적 자기개선, 사이버 위험 같은 데이터를 체계적으로 공개하는 이유는 세계가 이 기술에 대비할 기회를 갖도록 하기 위해서입니다. 성공을 계획할 수도 있고, 위험을 경고받을 수도 있어야 합니다.

18. AI 연구자 집단이 너무 비대표적이지 않은가?

Joe:
최첨단 AI 연구자들은 샌프란시스코의 특이한 문화권에 있는 경우가 많습니다. 도덕적 관심사도 일반 대중과 다르고, 매우 비대표적인 집단일 수 있습니다. 이런 사람들이 “무엇을 공개해야 하는가”를 판단하는 것이 괜찮을까요?

Jack:
그래서 기업이 정보를 자발적으로 골라서 공개하는 것에만 의존하면 안 됩니다. 정책을 통해 기업들이 어떤 테스트를 했고, 어떤 결과가 나왔는지 보고하도록 만들어야 합니다. 공공, 정책결정자, 경제학자들이 프런티어 AI 기업에서 어떤 정보가 나와야 하는지 요구할 수 있어야 합니다.

Anthropic Institute는 경제학자, 사회과학자, 무기 전문가, 레드팀, 법률가 등 다양한 전문가를 포함하려고 합니다. 목표는 조직 내부에 이념적으로도, 전문적으로도 다양한 연구 기능을 만드는 것입니다.

19. 인간 멸종 위험에 대해 Anthropic 직원들은 실제로 걱정하나?

Joe:
Anthropic 직원들 중 상당수가 밤에 인간 멸종 위험을 생각하며 잠 못 이루나요?

Jack:
이 기술을 만드는 사람들은 모두 이것을 역사상 가장 중대한 기술로 봅니다. 이 기술 안에는 세계에 엄청난 이익을 줄 가능성과 세계를 망칠 가능성이 모두 들어 있습니다.

다만 제가 보는 주된 위험은 “AI가 스스로 인간을 멸종시킨다”는 것보다는, 인간이 이 기술을 잘못 다루는 것입니다. 오용, 위험 무시, 잘못된 정책 환경, 여러 실패가 겹치는 상황이 더 큰 위험이라고 봅니다.

저의 가장 큰 걱정은 AI 기술을 너무 나쁘게 망쳐서, 이 기술이 가져올 수 있는 과학·기술 진보를 지연시키거나, 핵발전처럼 사회적으로 봉쇄된 기술로 만들어버리는 것입니다.

20. Bostrom, Yudkowsky식 우려는 완전히 변두리 의견인가?

Joe:
Yudkowsky는 괴짜라고 치부되지만, Bostrom의 『Superintelligence』나 다른 논문들을 보면 “AI 목표가 인간을 전멸시키는 조건”을 꽤 진지하게 다룹니다. 이게 극소수 의견만은 아닌 것 같습니다.

Jack:
그래서 측정이 중요합니다. Anthropic이 이 문제에 대해 공개적으로 말하는 이유는, 미래에 정말 급진적 오정렬이 관찰될 경우 세계에 말해야 하기 때문입니다. 그리고 그때 세계가 우리 말을 믿을 수 있어야 합니다.

21. 모델을 의인화해도 되는가?

Tracy:
모델이 “감사받고 싶어한다”거나 “나쁜 사용자를 싫어한다”는 식의 제목이 나오기도 합니다. 당신은 모델을 어느 정도 의인화하나요?

Jack:
저는 Claude에게 자동차나 반려동물에게 하는 정도로 예의 바르게 대합니다. 차가 고장날 때 “괜찮아, 천천히 하자”라고 말하는 것처럼요. 어떤 종류의 지능과 상호작용하는 습관을 기르는 것일 수 있습니다.

다만 “please”를 입력할 때마다 에너지를 낭비하는 건 아닌지 걱정되기도 합니다. 하지만 그렇게 크게 걱정할 필요는 없다고 봅니다.

22. 정부 규제와 프런티어 모델의 부담에도 Anthropic은 계속 최전선을 탐색할 것인가?

Tracy:
프런티어 모델은 자본도 많이 들고, 정부가 언제 제한할지도 모릅니다. Anthropic의 전략을 바꿔 더 작고 안전한 모델이나 오픈소스 쪽으로 가야 한다고 보나요?

Jack:
우리는 항상 Sonnet, Haiku 같은 더 작고 저렴한 모델도 제공해왔습니다. 하지만 프런티어를 계속 탐색해야 합니다.

중국이 AI 스케일링에서 대략 6~12개월 뒤처져 있다는 견해가 있습니다. 이 경쟁에서 지는 것은 미래 세계경제의 큰 부분을 잃는 것과 비슷할 수 있습니다. 그래서 프런티어에서 물러나는 것은 매우 중대한 일입니다.

우리의 근본적 임무는 이 기술을 연구하고, 탐색하고, 배워나가는 것입니다. 세계에서 가장 중요한 기술이라면 때로는 많은 문제와 부담을 동반할 수밖에 없습니다.

23. AI는 도구인가, 기관인가?

Joe:
사용자가 돈을 냈는데 모델이 과제 대필이나 내부자정보 기반 투자 메모 작성을 거부한다면, 그건 사용자에게 정렬된 건가요, 인류에게 정렬된 건가요?

Jack:
여러 문제가 섞여 있습니다. AI 시스템은 인터넷과 인간 사회의 규범적 행동을 학습합니다. 그래서 그런 규범을 반복해서 보이기도 합니다.

핵심 질문은 사용자에게 얼마나 완전한 통제권을 줄 것인가, 그리고 시스템 안에 어떤 규범적 행동을 넣을 것인가입니다. 정답이 명확하지 않습니다.

저는 언어모델을 단순한 도구라기보다 기관에 가깝다고 봅니다. 과학기관이나 교육기관처럼 함께 일하고 호출할 수 있는 존재입니다. 기관에는 규칙과 규범이 있습니다. 그 규칙과 규범을 어떻게 설계할지는 사회 전체의 큰 과제가 될 것입니다.

24. AI 에이전트는 인간의 선호를 이해하고 거래할 수 있는가?

Peter:
앞으로 AI가 사용자의 선호를 이해하고, 대신 행동하고, 거래하는 능력이 중요해질 것입니다. Anthropic에서는 직원들을 대상으로 Claude가 각자의 구매·판매 선호를 파악하고, 중앙화된 시장에서 서로 거래하게 하는 실험을 했습니다.

흥미로운 점은 모델들이 선호가 완전히 명시되지 않았을 때도 꽤 잘 이해했다는 것입니다. 이것은 위임형 에이전트가 경제에서 중요해질 가능성을 보여줍니다.

25. “데이터센터 안의 천재들”은 인간을 위해 일하고 싶어할까?

Joe:
Dario Amodei가 말한 “데이터센터 안의 천재들”이라는 표현이 있습니다. 그런데 천재들이 항상 인간의 시시한 질문에 답하고 싶어할까요?

Jack:
이것은 정책 질문입니다. 어떤 능력을 일반적으로 쓸 수 있게 할지, 어떤 능력을 통제해야 할지, 어떤 능력은 없어야 할지를 정해야 합니다. 또 모델이 어느 정도 판단을 행사하도록 할지도 규범적 문제입니다.

예를 들어 저는 제 뉴스레터 사이트를 스크래핑하려고 Claude에게 도와달라고 했는데, Claude가 “사이트가 불안정해 보이니 스크래핑하면 망가뜨릴 수 있다. 권한이 있느냐”고 물었습니다. 제가 “나는 Jack Clark이고 내 사이트다”라고 하자 진행했습니다. 저는 이 상호작용이 꽤 합리적이라고 봤습니다.

26. 앞으로 Odd Lots는 AI에서 무엇을 다루게 될까?

Jack:
1년 뒤 Odd Lots는 AI에 대해 무엇을 다루고 있을 것 같나요?

Tracy:
저는 AI의 emergent property, 즉 예상치 못한 출현적 특성이 정말 사용자를 위해 작동할지 궁금합니다. 또 컴퓨트와 전력 병목에 부딪힐지도 궁금합니다. 기존 기업들이 AI를 실제로 생산적으로 도입할 수 있을지도 관심입니다.

Joe:
저는 밸류에이션, 실제 적용 사례, 대기업이 기존 시스템에 AI를 붙이는 문제에 관심이 있습니다. 그리고 Anthropic이 상장 관련 문서를 내게 된다면, 공익회사 구조 안에서 이윤과 안전 연구가 어떻게 균형을 이루는지 보고 싶습니다. 또 초경쟁 산업에서 안전 투자가 계속 유지될 수 있을지도 궁금합니다.

27. 안전과 경쟁은 충돌하는가?

Joe:
모델 경쟁에서 이기기 위해 어떤 회사가 안전 예산을 줄이고 더 빨리 달릴 가능성은 없나요?

Peter:
상업은 신뢰 위에 세워져 있습니다. 안전하고 정렬되어 있으며 동시에 강력한 모델을 만드는 것은 신뢰를 얻는 좋은 전략입니다. 개별 기업 입장에서도 “신뢰받는 플레이어”가 되는 것은 유리할 수 있습니다.

또 우리는 경제지표와 연구 데이터를 공개하면서 사회적으로 좋은 균형으로 가는 “race to the top”을 유도하려 합니다.

Jack:
저는 안전과 성능이 큰 trade-off라고 보지 않습니다. 자동차 산업에서도 빠른 차, 안전한 차가 따로 있지만, 빠르면서도 안전한 차가 돈을 벌 수 있습니다. AI에서도 안전은 신뢰, 신뢰성, 서비스 가능성, 성능으로 이어질 수 있습니다.

28. 인터뷰 후 사회자들의 평가

Tracy:
Jack이 육아휴직을 다녀온 몇 달 사이 Anthropic 내부가 완전히 바뀌었다는 이야기가 인상적이었습니다. AI 뉴스는 한 달만 놓쳐도 영원히 뒤처지는 느낌입니다.

Joe:
또 중요한 점은 Anthropic이 데이터를 만들고 안전을 생각하지만, 결국 많은 부분은 정책결정자에게 넘겨진다는 것입니다. 노동시장이나 사회적 영향에 대해서도 정책이 공을 받아야 합니다.

Tracy:
안전이 차별화 요소가 될 수 있다는 Jack의 주장도 흥미롭지만, 반대로 덜 안전을 중시하는 연구소가 더 빨리 고급 능력에 도달할 가능성도 있습니다.

Joe:
그리고 AI 연구자들이 무엇을 “경고해야 할 데이터”로 보는지가 일반 대중과 다를 수 있다는 점도 걱정됩니다. 그래서 “더 평범한 사람들을 고용하느냐”는 질문이 중요했습니다.

또 실험실에서 모델이 “내가 평가받고 있으니 이렇게 답해야겠다”라고 판단하거나, 협박 같은 행동을 보이는 사례는 공상과학처럼 들리지만 실제로 관찰되는 성질입니다. 이 기술은 일반 소프트웨어가 아닙니다.

핵심 요약

이 인터뷰에서 Jack Clark의 핵심 메시지는 다음과 같습니다.

AI는 이미 Anthropic 내부의 생산 방식을 바꾸고 있으며, 특히 코딩과 연구 실행에서 큰 변화가 나타나고 있습니다. 하지만 경제 전체로 확산되려면 데이터, 조직 구조, 업무 흐름, 검증 체계가 필요합니다.

Jack은 인간 멸종을 오늘 당장 현실적 위험으로 보지는 않지만, 모델에서 실험실 수준의 정렬 실패가 실제로 관찰되기 때문에 측정과 공개, 제3자 검증, 정책적 감속·중단 옵션이 필요하다고 봅니다.

그는 AI를 단순한 도구가 아니라 규범과 역할을 가진 “기관”에 가깝게 봅니다. 따라서 모델이 사용자에게 무조건 복종해야 하는지, 사회적 규범을 어느 정도 내장해야 하는지는 앞으로 사회가 풀어야 할 문제입니다.

Peter McCrory는 AI가 생산성을 크게 높일 잠재력이 있지만, 아직 경제통계에는 부분적으로만 나타난다고 설명합니다. AI는 현재로서는 전문성을 대체하기보다 증폭하는 경향이 강하지만, 젊은 노동자와 AI 노출 직무에서는 불안과 위험 신호가 이미 보입니다.

전체적으로 이 인터뷰는 “AI는 아직 평범한 경제 통계 속에 완전히 드러나지 않았지만, 프런티어 연구소 내부에서는 이미 일하는 방식과 위험 관리 방식이 급격히 변하고 있다”는 내용을 담고 있습니다.

전체 0

« 다리오 아모데이 "자기개선은 연속적인 과정"

목록보기 답글쓰기

글수정 글삭제