인터뷰/예측

Anthropic 공동 창립자 Jared Kaplan "현재 과학계 전체가 수행하는 종류의 일을 할 수 있게 될 것"

작성자
하이룽룽
작성일
2025-07-30 21:48
조회
503




Agent-0 (Late 2025 - Early 2026): Capable of completing tasks that would take a human approximately one week.
번역: 에이전트-0 (2025년 말 - 2026년 초): 인간에게 약 1주일이 걸리는 작업을 수행할 수 있는 수준.

Agent-1 (Late 2026): Capable of completing tasks that would take a human approximately one month.
번역: 에이전트-1 (2026년 말): 인간에게 약 1개월이 걸리는 작업을 수행할 수 있는 수준.

Agent-2 (Mid-2027 and beyond): Capable of completing tasks that would take a human 16 months to 5 years.
번역: 에이전트-2 (2027년 중반 이후): 인간에게 16개월에서 5년이 걸리는 작업을 수행할 수 있는 수준.

"그리고 이 그래프는 앞으로 몇 년 안에 AI 모델이 단지 몇 분이나 몇 시간이 걸리는 작업이 아니라, 며칠, 몇 주, 몇 달, 몇 년 등이 걸리는 작업을 수행할 수 있는 시점에 도달할 수 있음을 시사합니다. 궁극적으로 우리는 AI 모델이나 어쩌면 수백만 개의 AI 모델이 협력하여 하나의 인간 조직 전체가 하는 일을 해낼 수 있을 것이라고 상상합니다. 현재 과학계 전체가 수행하는 종류의 일을 할 수 있게 될 겁니다."

Q: 간단히 자기소개 부탁드립니다.
A: 안녕하세요, 저는 Jared Kaplan입니다. 원래 이론 물리학자로 오랫동안 연구했지만, 6년 전부터 AI 분야에 뛰어들어 지금은 Anthropic의 공동 창립자로 활동하고 있습니다.



Q: 현대 AI 모델 훈련은 어떤 단계로 진행되나요?
A: 크게 두 단계로 나뉩니다.
  1. 사전학습(Pre‑training): 대규모 텍스트·멀티모달 데이터에서 “다음 단어 예측”을 통해 언어와 패턴을 학습합니다.
  2. 강화학습(Reinforcement Learning, RL): 사람(크라우드워커)이 평가한 ‘도움이 되고, 정직하며, 무해한’ 응답을 보상(signal)으로 삼아 모델을 최적화합니다.



Q: 스케일링 법칙(Scaling Laws)이란 무엇인가요?
A:
  • 사전학습과 강화학습 단계 모두에서 연산량, 데이터량, 파라미터 수를 키우면 모델 성능이 예측 가능하게 향상되는 경험적 법칙입니다.
  • 단일 실험실에서 수십억→수천억→수조 단위까지 확대해도 거듭제곱(power‑law) 추세가 5개 이상 규모(order of magnitude)에 걸쳐 유지되는 것이 확인됐습니다.



Q: 모델이 처리할 수 있는 작업 길이는 어떻게 변하나요?
A:
  • 연구 결과에 따르면, AI 모델이 다룰 수 있는 과제의 “시간적 범위(task horizon)”는 약 7개월마다 두 배로 늘어납니다.
  • 예를 들어 오늘 몇 시간짜리 작업을 할 수 있으면, 7개월 뒤에는 하루짜리, 14개월 뒤에는 이틀짜리, 21개월 뒤에는 사흘짜리 작업이 가능해진다는 의미입니다.



Q: 인간 수준 AI에 도달하려면 무엇이 남아 있을까요?
A:
  1. 조직적 지식(Organizational Knowledge): 기업이나 기관의 맥락과 절차를 이해하고 활용할 수 있어야 합니다.
  2. 메모리(Memory): 장시간 과제의 중간 결과와 진행 상황을 기록·참조하는 능력이 필요합니다.
  3. 감독(Oversight): “좋은 농담”이나 “훌륭한 시”처럼 모호한 과제를 다룰 수 있도록 섬세한 보상(signal)을 설계해야 합니다.
  4. 도메인 확장: 텍스트를 넘어 멀티모달, 로보틱스 등 다양한 분야에서 스케일 효과를 이어가야 합니다.



Q: 앞으로 AI를 활용해 빠르게 가치 있는 결과를 내려면 어떻게 준비해야 하나요?
A:
  • 경계 실험: 현재 조금 부족해 보여도, 곧 나올 차세대 모델(Claude 5 등)로 해결될 수 있으니 과감히 제품·서비스에 도입해 보세요.
  • AI로 AI 통합: AI를 활용해 다른 시스템·제품에 AI를 통합하는 ‘메타 통합’ 역량이 중요합니다.
  • 빠른 수용 분야 모색: 이미 코딩 분야에서 AI가 폭발적으로 채택됐듯, 금융(엑셀), 법률, 고객지원 등 새로운 분야를 찾아 적용해 보세요.
  • 인간‑AI 협업 설계: 초기에는 인간 검수(휴먼 인 더 루프)를 결합하되, 점차 자동화 비율을 높여 가는 전략이 효과적입니다.



Q: 스케일링 법칙이 갑자기 깨졌다고 느껴지면 어떻게 진단하나요?
A:
  • 경험상 “스케일링이 실패”하는 경우는 대부분 훈련 방식, 아키텍처, 정밀도 문제 등이 잘못됐기 때문입니다.
  • 법칙이 깨졌다고 생각되면, 먼저 데이터·모델 구조·학습 파이프라인을 꼼꼼히 점검해야 합니다.



Q: 연산 효율을 위해 FP4 같은 저정밀 연산은 언제 도입하나요?
A:
  • 현재는 프론티어 모델 성능 확보에 집중하지만, AI가 대중화되고 비용·효율성이 중요해질수록 FP4, ternary 연산 같은 저정밀 기법을 적극 도입할 전망입니다.
  • 연간 3×~10× 수준의 알고리즘·하드웨어 이득을 기대하며, 중장기적으로는 저정밀을 통한 대폭적인 비용 절감이 핵심이 될 것입니다.



Q: AI 시대에 커리어 경쟁력을 유지하려면 무엇을 공부해야 할까요?
A:
  • AI 내부 메커니즘 이해: 모델이 어떻게 학습·추론하는지, 특히 스케일링 법칙과 메모리 관리 기법을 깊이 공부하세요.
  • AI 통합 역량: 다양한 도메인(코딩, 금융, 법률 등)에 AI를 효율적으로 접목하는 ‘제품 기획·엔지니어링’ 능력이 중요합니다.
  • 경계 실험 경험: 빠르게 변화하는 AI 경계에서 직접 프로젝트를 기획·실행하며 학습 곡선을 단축하세요.



Q: 모델이 처리할 수 있는 과제 시간 범위(task horizon)는 어떻게 변화하나요?
A: 연구 결과에 따르면 AI 모델이 다룰 수 있는 작업 길이는 약 7개월마다 두 배로 늘어납니다.



Q: 스케일링 법칙(scaling laws)의 유효 범위는 어느 정도인가요?
A: 사전학습(pre‑training)과 강화학습(RL) 단계 모두에서 5개 이상의 규모(order of magnitude)—즉 10배씩 커지는 구간이 다섯 번 이상 반복되는 범위—에 걸쳐 일관된 power‑law 추세가 관찰되었습니다.



Q: 알고리즘 및 추론 효율(algorithmic/inference efficiency)은 연간 얼마나 개선되나요?
A: 현재는 연간 약 3×에서 10× 수준의 성능·효율 향상이 보고되고 있습니다.



Q: 앞으로 AI 모델이 수행 가능한 과제의 시간 단위는 어떻게 확장될까요?
A:
  • 현재: 수시간(hour)
  • 단기(1–2년): 수일(day)
  • 중기(3–4년): 수주(week)
  • 장기(5년 이상): 수개월(month) 이상, 궁극적으로 수년(year) 단위 과제 처리도 가능할 것으로 예측됩니다.
전체 0