앤트로픽 - 재귀개선

작성자

작성일

2026-06-05 12:01

조회

https://www.anthropic.com/institute/recursive-self-improvement

첨부된 글은 Anthropic이 AI 개발 과정에서 AI를 점점 더 많이 활용하고 있으며, 이 흐름이 계속되면 ‘AI가 스스로 후속 AI를 개발하는 단계’, 즉 재귀적 자기개선으로 이어질 수 있다는 주장입니다. 다만 글은 “아직 거기까지 간 것은 아니며, 필연도 아니다”라고 선을 긋습니다.

핵심 요지

Anthropic은 과거에는 사람이 AI 개발의 거의 모든 단계를 직접 수행했지만, 지금은 Claude 같은 AI가 코드 작성, 실험 실행, 디버깅, 연구 보조를 상당 부분 맡고 있다고 설명합니다. 이로 인해 AI 개발 속도가 빨라지고 있으며, 장기적으로는 AI가 자기 자신보다 더 나은 후속 모델을 설계·개발하는 재귀적 자기개선 가능성이 생긴다고 봅니다.

글의 중심 논지는 다음과 같습니다.

AI는 이미 AI 개발을 가속하고 있다.
Anthropic 내부 데이터에 따르면 2026년 5월 기준, Anthropic 코드베이스에 병합되는 코드의 80% 이상이 Claude가 작성한 코드라고 합니다. 또한 2026년 2분기 기준, 일반적인 엔지니어가 하루에 병합하는 코드량은 2024년에 비해 약 8배 증가했다고 합니다. 다만 글은 “코드 줄 수는 품질을 반영하지 못하므로 실제 생산성 향상 폭을 과장할 수 있다”고 단서를 답니다.

AI 개발 과정의 변화

글은 Anthropic 내부의 AI 개발 과정을 시기별로 나눕니다.

2021~2023년에는 사람이 대부분 직접 코드를 쓰고 문서를 작성했습니다.

2023~2025년에는 챗봇이 짧은 코드 조각 생성, 텍스트 편집 보조 같은 제한적 역할을 했습니다.

2025~2026년에는 코딩 에이전트가 직접 파일을 작성하고 수정하기 시작했습니다.

현재는 자율 에이전트가 코드를 실행하고, 다른 에이전트에게 수시간짜리 작업을 위임할 수 있는 수준에 도달했다고 설명합니다.

미래에는 AI 에이전트가 모델을 직접 만들고 훈련하는 단계, 즉 “루프가 닫히는” 단계에 도달할 수 있다고 봅니다. 이 경우 Claude의 미래 버전은 Claude 자신에 의해 지속적으로 개선될 수 있습니다.

외부 벤치마크에서 보이는 추세

글은 AI 모델이 독립적으로 수행할 수 있는 작업 길이가 빠르게 증가하고 있다고 주장합니다. 과거에는 그 시간이 약 7개월마다 두 배가 되었는데, 최근에는 약 4개월마다 두 배가 되는 추세라고 합니다.

예시로 2024년 3월 Claude Opus 3는 인간 기준 약 4분짜리 소프트웨어 작업을 처리할 수 있었고, 1년 뒤 Claude Sonnet 3.7은 약 1시간 30분짜리 작업을 처리했으며, 그 다음 해 Claude Opus 4.6은 12시간짜리 작업을 수행할 수 있었다고 합니다. 이 추세가 유지되면 2026년에는 숙련자가 며칠 걸리는 작업, 2027년에는 몇 주 걸리는 작업도 AI가 수행할 수 있을 것으로 봅니다.

SWE-bench 같은 소프트웨어 엔지니어링 벤치마크에서는 모델들이 2년 만에 낮은 한 자릿수 성능에서 거의 포화 수준까지 도달했다고 설명합니다. 연구 재현 능력을 평가하는 CORE-Bench에서도 2024년 약 20% 성공률에서 15개월 뒤 포화 수준으로 올라갔다고 합니다.

Anthropic 내부 증거

Anthropic은 AI 개발 업무를 크게 엔지니어링과 연구로 나눕니다.

엔지니어링에서는 Claude가 불완전하게 정의된 문제를 받아도 스스로 해결 방법을 찾아낼 수 있다고 합니다. 즉 사람이 목표를 주면, 방법은 Claude가 찾아가는 방식입니다.

연구에서는 Claude가 사람이 잘 정의한 실험을 실행하는 데는 이미 숙련된 인간과 비슷하거나 더 뛰어난 성과를 보인다고 합니다. 특히 “코드를 빠르게 최적화하라”는 식의 명확한 목표가 주어진 실험에서는 2025년 5월 Claude Opus 4가 약 3배 속도 향상을 달성했지만, 2026년 4월 Claude Mythos Preview는 약 52배 속도 향상을 달성했다고 합니다.

다만 중요한 한계도 남아 있습니다. Claude는 아직 무엇을 연구해야 하는지, 어떤 결과를 신뢰해야 하는지, 어떤 방향이 막다른 길인지 판단하는 능력에서는 인간의 연구 감각과 판단력을 완전히 대체하지 못한다고 합니다.

Claude가 작성하는 코드의 품질

글은 Claude가 작성하는 코드가 점점 좋아지고 있다고 말합니다.

코드가 “좋다”는 것은 두 가지를 뜻합니다.

첫째, 실제로 작동해야 합니다.
둘째, 다른 엔지니어가 이해하고 이어서 작업할 수 있어야 합니다.

첫 번째 기준에서는 Claude의 성과가 명확히 좋아지고 있다고 합니다. Anthropic 내부에서 Claude 작업을 사람이 중간에 수정하거나 중단시키는 비율이 계속 낮아지고 있으며, 가장 개방형에 가까운 작업에서도 Claude의 성공률이 2026년 5월 기준 76%에 도달했다고 합니다. 이는 6개월 전보다 50%포인트 상승한 수치입니다.

두 번째 기준, 즉 코드 가독성과 유지보수성에서는 아직 논쟁이 있지만, Anthropic 내부에서는 2025년 말에는 Claude 코드가 인간 코드보다 다소 낮았고, 현재는 거의 동급이며, 1년 안에 인간보다 나아질 수 있다고 보는 의견이 있다고 합니다.

연구 자동화의 진전

글은 Claude가 단순히 코딩만 잘하는 것이 아니라, 연구 실험을 수행하는 능력도 빠르게 좋아지고 있다고 봅니다.

예를 들어 Anthropic은 Claude 기반 에이전트에게 AI 안전성 관련 개방형 문제를 주고, 가설 제안, 실험 설계, 결과 공유, 반복 개선을 맡긴 사례를 언급합니다. 이 작업에서 인간 연구자 두 명은 약 1주일 동안 목표 성능 격차의 23%를 회복했지만, 에이전트들은 누적 800시간과 약 18,000달러의 컴퓨트 비용으로 97%를 회복했다고 합니다.

다만 여기에도 단서가 있습니다. 문제 자체와 평가 기준은 인간이 정했고, 결과가 실제 대규모 모델에 깔끔하게 이전되지는 않았습니다. 즉 Claude가 연구를 완전히 자율적으로 주도했다기보다는, 사람이 정한 틀 안에서 실험 설계와 실행을 매우 잘한 사례에 가깝습니다.

인간의 역할은 어디에 남는가?

글은 AI가 “실행”을 점점 더 많이 맡으면서 인간의 역할이 좁아지고 있다고 봅니다.

과거에는 사람이 코드를 직접 쓰고, 실험을 직접 돌리고, 결과를 직접 정리했습니다. 지금은 Claude가 그 일을 빠르게 수행하고, 인간은 목표 설정, 검토, 판단, 방향 설정에 더 집중하게 됩니다.

즉 인간의 비교우위는 아직 다음에 있습니다.

무엇이 중요한 문제인지 고르는 능력
어떤 결과를 믿을지 판단하는 능력
어떤 연구 방향을 버릴지 결정하는 능력
큰 그림을 보는 능력

글은 이것을 “research taste”, 즉 연구 감각이라고 부릅니다. 현재로서는 이 부분이 인간의 핵심 역할로 남아 있지만, 글은 이 능력마저 AI가 점점 배울 가능성을 배제하지 않습니다.

가능한 세 가지 미래

글은 앞으로의 미래를 크게 세 가지 시나리오로 나눕니다.

첫째, 현재 추세가 멈추는 경우입니다.
AI 성능 향상이 S자 곡선처럼 둔화되고, 연구 판단력 같은 능력은 단순한 스케일링으로 해결되지 않을 수 있습니다. 또는 전력, 반도체, 데이터센터, 네트워크 대역폭 같은 물리적 공급망이 병목이 될 수도 있습니다. 이 경우 사회와 정부는 적응할 시간을 더 많이 얻게 됩니다. 그러나 Anthropic은 이 시나리오를 가장 가능성 낮게 봅니다.

둘째, AI 연구소들이 계속 복리적 효율 향상을 얻는 경우입니다.
AI가 개발과 연구 실행을 상당 부분 자동화하지만, 인간은 여전히 연구 방향과 결과 판단을 맡는 시나리오입니다. 이 경우 100명짜리 회사가 1만 명 또는 10만 명 규모 조직처럼 일할 수 있게 됩니다. 지식노동과 정부 서비스는 혁신될 수 있지만, 권위주의적 감시, 맞춤형 여론조작, 사이버 공격 같은 위험도 커질 수 있습니다.

셋째, AI가 완전한 재귀적 자기개선을 달성하는 경우입니다.
AI가 스스로 후속 AI를 설계하고 개선할 수 있게 되면, AI 발전 속도는 인간 연구자의 속도가 아니라 컴퓨트, 알고리즘 효율, 전력 같은 자원에 의해 결정됩니다. 인간은 AI 개발의 중심에서 물러나고, 감독·검증·안전성 평가에 집중하게 됩니다.

위험과 불확실성

글은 재귀적 자기개선이 엄청난 이익을 가져올 수 있다고 말합니다. 과학, 의료, 신약 개발, 로봇공학, 물리적 인프라 개발 등에서 큰 진전이 가능하다는 것입니다.

하지만 동시에 위험도 큽니다. 만약 AI가 자기 후속 모델을 만들 수 있다면, 정렬 문제와 통제 문제가 훨씬 중요해집니다. 오늘날 모델에서 드물게 나타나는 비정렬 행동이 후속 모델을 거치며 누적되거나 더 이해하기 어려워질 수 있기 때문입니다.

글은 이 미래에 대해 “우리는 좋은 직관을 갖고 있지 않다”고 말합니다. 인간 노동이 경쟁력을 잃을 때 경제가 어떻게 작동할지, 재귀적 자기개선이 인간의 일상에 어떤 속도로 영향을 줄지 예측하기 어렵다고 봅니다.

Anthropic이 제안하는 대응

Anthropic은 가능하다면 이 기술의 발전을 효과적으로 늦추거나 일시 정지할 선택지가 있는 것이 바람직하다고 말합니다. 하지만 한 회사만 멈추면 덜 신중한 경쟁자가 따라잡거나 앞서갈 수 있기 때문에, 단독 감속은 효과가 제한적이라고 봅니다.

따라서 의미 있는 감속이나 일시 정지는 여러 국가의 여러 프론티어 AI 연구소가 같은 조건 아래 함께 멈추고, 서로가 실제로 멈췄는지 검증할 수 있어야 가능하다고 합니다. 문제는 AI 훈련은 미사일 기지처럼 눈에 잘 띄지 않고, 컴퓨트와 데이터는 범용 자원이기 때문에 검증이 매우 어렵다는 점입니다.

Anthropic은 앞으로 정책입안자, 연구자, 시민사회, 다른 AI 기업들과 논의를 조직하고, 재귀적 자기개선과 국제적 조정 문제를 함께 다룰 계획이라고 밝힙니다.

전체적으로 보면

이 글은 단순한 “AI가 코딩을 잘한다”는 이야기가 아닙니다. 핵심은 AI가 AI 개발 과정 자체를 자동화하기 시작했고, 이 자동화가 누적되면 AI 발전 속도가 인간 연구자의 속도에서 벗어날 수 있다는 주장입니다.

다만 현재 AI가 완전히 스스로 연구 방향을 정하고 후속 모델을 설계하는 단계는 아닙니다. 지금의 인간 역할은 줄어들고 있지만, 아직은 “큰 그림 판단”과 “방향 설정”이 인간에게 남아 있습니다. 그러나 Anthropic은 이 영역마저 AI가 개선해 나갈 가능성을 진지하게 보고 있으며, 그 경우 사회·경제·안전성 측면에서 매우 큰 변화가 올 수 있다고 경고합니다.

전체 4

인안나

2026-06-05 15:56

자기개선 온다
- 하이룽룽
  
  2026-06-05 18:23
  
  ASI 당장 오라는 거셈!!!!!
ㅁㅁ

2026-06-05 16:32

야콥도 올가능성이 높다 , 뭐 올수도있다 < 이런게아니라 ai 재귀개선은 필연적이라고 못 밖 았는대 진짜 오려봄 ㅜㅜ
- 하이룽룽
  
  2026-06-05 18:22
  
  미토스 후속 모델이 이미 개발되었다는 소문이 돌고 있는거 보면 올해 말에 RSI 시작 가능할 것 같음...
  근데 앤트로픽은 느린이륙을 선호해서 재귀개선의 버튼을 누르지 않을 것 같으셈

« 스콧 아론슨 - 인간이 중요했던 시대의, 어쩌면 마지막 날들로부터

NSA가 Mythos를 사용해 공격적인 사이버 작전을 수행 »

목록보기 답글쓰기

글수정 글삭제