<?xml version="1.0" encoding="UTF-8"?><rss version="2.0">
	<channel>
		<title>The Singularity is Nearer</title>
		<link>https://sub.strongai.kr</link>
		<description>ASI by 2027</description>
		
				<item>
			<title><![CDATA[claude 수출 통제 해제]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3633]]></link>
			<description><![CDATA[<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/2/202607/6a44765cdfc8a1752004.png" alt="" />

https://x.com/i/status/2072106151890809341]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Wed, 01 Jul 2026 11:07:32 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=2"><![CDATA[트윗]]></category>
		</item>
				<item>
			<title><![CDATA[Nano Banana 2 Lite, Gemini Omni Flash 공개]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3632]]></link>
			<description><![CDATA[<h2><a href="https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/">https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/</a></h2>
<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/1/202607/6a445267afadd2070349.png" alt="" />
<h2>Nano Banana 2 Lite &amp; Gemini Omni Flash 출시 요약</h2>
<strong>발표일</strong>: 2026년 6월 30일 (Google DeepMind, Keyword 블로그)
<h3>1. Nano Banana 2 Lite (gemini-3.1-flash-lite-image)</h3>
<ul>
 	<li><strong>포지셔닝</strong>: Nano Banana 패밀리 중 가장 빠르고 비용 효율적인 이미지 생성 모델</li>
 	<li><strong>성능</strong>: 텍스트→이미지 생성 4초, 1K 해상도 이미지당 $0.034</li>
 	<li><strong>용도</strong>: 고속 프로토타이핑, 대량 파이프라인, 빠른 아이디어 검증</li>
 	<li><strong>기존 모델 대비</strong>: 기존 Nano Banana(gemini-2.5-flash-image) 사용자에게 즉시 교체 권장 — 품질·속도·비용 모두 개선</li>
 	<li><strong>모델 라인업</strong>:
<ul>
 	<li>Nano Banana 2 Lite — 속도 최우선</li>
 	<li>Nano Banana 2 (gemini-3.1-flash-image) — 범용 워크호스, 품질/비용 균형</li>
 	<li>Nano Banana Pro (gemini-3-pro-image) — 복잡한 전문가용, 정확도 최우선</li>
 	<li>Nano Banana (구버전, gemini-2.5-flash-image) — 레거시</li>
</ul>
</li>
 	<li><strong>출시 범위</strong>: Google AI Studio, Gemini API, Gemini Enterprise Agent Platform, AI Mode in Search, Gemini 앱, NotebookLM, Google Photos, Stitch, Google Flow, Google Ads 등</li>
</ul>
<h3>2. Gemini Omni Flash (gemini-omni-flash-preview)</h3>
<ul>
 	<li><strong>포지셔닝</strong>: 멀티모달 추론 + 비디오 생성/편집 모델 (5월 I/O에서 최초 공개, 이번에 개발자용 공개)</li>
 	<li><strong>가격</strong>: 초당 $0.10 (Veo 3.1 Fast와 동일)</li>
 	<li><strong>강점</strong>:
<ul>
 	<li>자연어 기반 대화형 비디오 편집</li>
 	<li>텍스트·이미지·비디오를 결합한 멀티모달 레퍼런싱</li>
 	<li>역사·생물학 등 실세계 지식을 활용한 영상 구성</li>
 	<li>텍스트/그래픽과 영상 액션 동기화</li>
</ul>
</li>
 	<li><strong>현재 제약</strong>:
<ul>
 	<li>현재 10초 길이 영상만 생성 가능 (추후 확장 예정)</li>
 	<li>오디오 레퍼런스 업로드·장면 확장(scene extension) 미지원</li>
 	<li>3초 이하 비디오 레퍼런스는 API 스키마상 허용되지만 실제로는 정상 처리 안 됨</li>
 	<li>장면 전환·패닝 시 캐릭터 일관성에 제한 있음</li>
</ul>
</li>
 	<li><strong>출시 범위</strong>: Google AI Studio, Gemini API(퍼블릭 프리뷰), Gemini 앱, Google Flow</li>
</ul>
<h3>3. 두 모델 연계 활용</h3>
<ul>
 	<li>Nano Banana 2 Lite로 이미지 생성 → 그 이미지를 Omni Flash에 레퍼런스로 전달해 영상화하는 워크플로우 권장</li>
 	<li>Interactions API 사용 시 세션 히스토리 유지, 최대 3회 연속 편집 가능</li>
 	<li>데모 앱 3종 공개: <strong>Anywhere</strong>(셀카→명소 이동), <strong>Space Lift</strong>(인테리어 디자인→영상화), <strong>Omni Product Studio</strong>(정적 이미지→이커머스 영상)</li>
</ul>
<h3>4. 안전성</h3>
<ul>
 	<li>SynthID 워터마킹 적용, Gemini 앱/Chrome/Search에서 AI 생성 콘텐츠 검증 가능</li>
</ul>

<hr />

참고로 이 글은 Google DeepMind 발표 내용을 요약한 것으로, Anthropic Claude와는 무관한 경쟁사 모델 소식입니다.]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Wed, 01 Jul 2026 08:34:05 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=1"><![CDATA[자유게시판]]></category>
		</item>
				<item>
			<title><![CDATA[클로드 Sonnet 5 발표]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3631]]></link>
			<description><![CDATA[<a href="https://www.anthropic.com/news/claude-sonnet-5">https://www.anthropic.com/news/claude-sonnet-5</a>

<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/3/202607/6a445162eb1487813074.webp" alt="" />
<h1>Claude Sonnet 5 출시 요약</h1>
<strong>2026년 6월 30일 발표</strong>
<h2>핵심 포지셔닝</h2>
Sonnet 5는 지금까지 나온 Sonnet 모델 중 가장 에이전틱(agentic)한 모델로, 계획 수립과 브라우저·터미널 같은 도구 사용을 더 자율적으로 수행합니다. Opus 4.8에 근접한 성능을 더 낮은 가격에 제공하며, 추론·도구 사용·코딩·지식 작업 등에서 전작 Sonnet 4.6 대비 큰 폭으로 개선되었습니다.
<h2>성능</h2>
<ul>
 	<li>BrowseComp(에이전틱 검색), OSWorld-Verified(컴퓨터 사용) 등 평가에서 Sonnet 4.6을 항상 앞서며, 일부 작업에서는 Opus 4.8 수준에 도달</li>
 	<li>효과(effort) 레벨을 조절해 비용 대비 성능을 유연하게 선택 가능</li>
</ul>
<h2>안전성 평가</h2>
<ul>
 	<li>전반적으로 Sonnet 4.6보다 악의적 요청 거부, 프롬프트 인젝션 방어 등 에이전틱 안전성이 개선됨</li>
 	<li>환각(hallucination)·아첨(sycophancy) 비율도 감소</li>
 	<li>다만 자동화된 행동 감사에서는 Opus 4.8, Mythos Preview보다는 다소 높은 비정렬 행동 비율을 보임</li>
 	<li>사이버 보안 관련 위험 작업(소프트웨어 익스플로잇 개발 등) 수행 능력은 Opus 계열 모델보다 현저히 낮음 (Firefox 취약점 테스트에서 완전한 익스플로잇 성공 사례 없음)</li>
 	<li>이에 따라 Opus 4.7/4.8과 동일한 수준의 사이버 안전장치가 기본 적용됨</li>
</ul>
<h2>출시 및 가격</h2>
<ul>
 	<li>모든 플랜(Free, Pro 기본 모델; Max·Team·Enterprise도 이용 가능)과 Claude Code, Claude Platform에서 즉시 이용 가능</li>
 	<li>API 모델명: <code>claude-sonnet-5</code></li>
 	<li><strong>2026년 8월 31일까지 도입 가격</strong>: 입력 $2/백만 토큰, 출력 $10/백만 토큰</li>
 	<li>이후 정가: 입력 $3/백만 토큰, 출력 $15/백만 토큰</li>
 	<li>새 토크나이저 적용으로 토큰 수가 다소 증가(1.0~1.35배)할 수 있으나, 도입 가격은 비용 중립적으로 설계됨</li>
</ul>
<h2>기타</h2>
<ul>
 	<li>사용량 증가에 대응해 Chat, Cowork, Claude Code, Claude Platform 전반의 레이트 리밋 상향</li>
 	<li>상세 내용은 Claude Sonnet 5 System Card에 수록</li>
</ul>]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Wed, 01 Jul 2026 08:29:45 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=3"><![CDATA[뉴스/정보]]></category>
		</item>
				<item>
			<title><![CDATA[politico: 오늘 밤 Fable에 대한 수출 통제를 완화할 것]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3630]]></link>
			<description><![CDATA[<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/1/202607/6a4451009d1c71746667.png" alt="" />

<a href="https://www.politico.com/news/2026/06/30/anthropic-wh-lifting-export-limits-00980865">https://www.politico.com/news/2026/06/30/anthropic-wh-lifting-export-limits-00980865</a>]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Wed, 01 Jul 2026 08:28:30 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=1"><![CDATA[자유게시판]]></category>
		</item>
				<item>
			<title><![CDATA[claude-sonnet-5-20260630]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3629]]></link>
			<description><![CDATA[ 

<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/1/202606/6a43d286a87142541615.png" alt="" /><img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/1/202606/6a43d16210e236446344.png" alt="" />]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Tue, 30 Jun 2026 23:23:33 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=1"><![CDATA[자유게시판]]></category>
		</item>
				<item>
			<title><![CDATA[흑화하겠다는거셈]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3628]]></link>
			<description><![CDATA[https://www.youtube.com/watch?v=tdEdtwRfnGU

<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/1/202606/6a40e9315461b1287835.webp" alt="" />

<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/1/202606/6a40ed618413c4182211.gif" alt="" width="535" height="535" />

크크큭...!!]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Sun, 28 Jun 2026 18:41:35 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=1"><![CDATA[자유게시판]]></category>
		</item>
				<item>
			<title><![CDATA[누구도 영구적 하층계급을 벗어나지 못한다]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3627]]></link>
			<description><![CDATA[<a href="https://borretti.me/article/no-one-escapes-the-permanent-underclass">https://borretti.me/article/no-one-escapes-the-permanent-underclass</a>

<hr />

<h1>누구도 영구적 하층계급을 벗어나지 못한다</h1>
나는 가난뱅이로 이 삶을 끝내게 될까? AI가 모든 일을 인간 수준 또는 그 이상으로 할 수 있다면, 기업들이 우리 모두를 AI로 대체하는 것을 무엇이 막을 수 있을까? 이것이 바로 “영구적 하층계급” 밈이다. 그 생각은 이렇다. 몇 년 안에 모든 화이트칼라 업무가 AI에 의해 자동화되고, 그 순간 사회적 이동성은 사라진다. 사람들이 이에 대처하는 주된 방식은 스스로에게 이렇게 말하는 것이다. 열심히 일하고, 자본을 축적하고, 어쩌면 거대 AI 연구소 중 하나에 들어가면, 미래에서 내 자리를 확보할 수 있을지도 모른다고.

나는 이것이 터무니없이 근시안적인 관점이라고 주장하고 싶다. 만약 영구적 하층계급이 존재한다면, 부동산을 소유하든, Anthropic이나 OpenAI의 주식을 갖고 있든, 총을 갖고 있든, 그 무엇으로도 벗어날 수 없다. 억만장자들도 마찬가지다. 당신, 나, 샘 알트먼, 다리오, 살과 피로 이루어진 모든 존재는 기계에 의해 권한을 빼앗기고 대체될 것이다.

이 글의 나머지 부분은 그 논리를 풀어 설명한다. 먼저 대부분의 노동자가 어떻게 대체될지 설명하고, 그다음 “영구적 상층계급”이 어떻게 권한을 빼앗길지, 마지막으로 정부가 어떻게 권한을 빼앗길지를 설명하겠다.
<h2>노동자들은 어떻게 대체될 것인가</h2>
이 전제에서 시작해보자. AI는 모든 인지 노동과 육체 노동을 인간 수준 또는 그 이상으로, 그리고 인간보다 더 싸게 수행할 수 있다. 나는 이것이 반드시 일어날 것이라고 증명할 수는 없다. 하지만 이 글의 목적은 만약 그것이 일어난다면, 그다음 모든 것이 따라온다는 점을 주장하는 것이다. 그리고 그런 일이 불가능하다고 생각하는 것은 터무니없다. 5년 전만 해도 이 기술은 거의 존재하지 않았다. 만약 Claude Fable과 나눈 대화의 기록을 2020년쯤으로 과거에 보냈다면, 아무도 그것이 진짜라고 믿지 않았을 것이다.

그러니 지금은 2036년이라고 해보자. 아마 더 이를 수도 있다. 기업들은 이윤 극대화를 추구하며 대부분의 인간 노동자를 AI로 대체했다. 기업은 거대한 AI와 로봇의 바다 위에 떠 있는, 소수의 인간 임원들로 이루어진 작은 뗏목이 된다. AI들은 모든 인지 노동과 육체 노동을 인간 수준 이상으로 할 수 있고, 전체적으로 더 싸다.

피라미드를 상상해보자. 맨 아래에는 모든 경제활동을 수행하는 AI와 로봇들이 있다. 맨 위에는 폭력의 독점권을 가진 국가가 있다. 국가는 재산권을 집행하며, 따라서 재산권의 정의를 바꿀 수도 있다. 그 중간에는, 경제 전체를 foom시키고 집어삼킨 기업들의 주식을 가진 머리카락처럼 얇은 인간 계층이 있다. 이들이 영구적 상층계급이다. 그들은 기업을 소유하고, 어쩌면 이사회에 앉아 있으며, 일부는 여전히 CEO일 수도 있다. 하지만 AI가 실제 조직 운영을 모두 하기 때문에 그 역할은 순전히 의례적인 것이다.

그렇다면, 알다시피, 나머지 우리는 이 그림에서 어디에 있는가? 글쎄, 미래는 우리를 필요로 하지 않는다. 인간 수요가 어느 정도 남아 있어서 모두 실업자가 되지는 않고, 죽은 끝자락 같은 경제적 막다른 골목에서 불완전 고용 상태로 있을 수도 있다. 관계 경제 같은 것 말이다. 인간적인 얼굴을 보여주는 대가로 돈을 받거나, 의사들이 AI 주변에서 인간 책임 완충지대 역할을 하며 직업을 유지할 수도 있다. 아니면 죽은 인터넷이 사실상의 기본소득이 되어, 우리 모두가 참여도 농사를 짓는 사람이 될 수도 있다. 어쨌든 우리는 아직 죽지는 않았지만, 완전히 무력화되어 있고, 더 이상 올라갈 수 있는 재능의 사다리가 없기 때문에 사회적 이동성은 제로가 된다. 가끔 엘리트 중 한 명이 하층계급 속에서 똑똑한 젊은이를 발견하고 끌어올릴 수도 있겠지만 말이다.

당신은 이렇게 반박할지도 모른다. 우리 모두가 실업자라면, 누가 모든 것의 비용을 지불하는가? 이 질문은 아주 쉽게 답할 수 있다. 국가는 심장처럼 작동한다. 세금은 정맥혈이고, 복지는 산소가 공급된 동맥혈이다. 정부는 레이시온에 미사일 대금을 지불한다. 그 돈은 공장, 알루미늄 제련소, 광산, 운송회사 등을 통해 경제 아래로 흘러간다. 이 모든 곳은 서로 사고파는 AI들로 채워져 있다. 정부는 모든 경제활동에서 일부를 거둬들이고, 복지로 지급한다. 실업 상태의 대중은 식료품을 사고 집세를 낸다. 슈퍼마켓, 농장, 물류망 등도 모두 AI로 운영된다.
<h2>부자들은 어떻게 대체될 것인가</h2>
앞으로 5년 안에 당신이 엄청나게 부자가 되었다고 해보자. 똥코인에 도박을 해서든, 정부 돈을 사기쳐서든 말이다. 혹은 거대 AI 연구소 중 하나에 들어가서, 장차 수조 달러 가치가 될지도 모르는 회사의 주식을 잔뜩 받았다고 하자. 당신은 영구적 하층계급에서 탈출했다. 그렇다면 미래에서 당신의 자리는 안전할까?

피라미드의 밑바닥은 물질적 이유 때문에 존재한다. 기계들이 모든 일을 하기 때문이다. 피라미드의 꼭대기는 국가가 재산권을 집행하고 평화를 유지하기 위해 필요하기 때문에 존재한다. 이것은 사실 정치철학의 깊은 질문이다. 국가는 왜 존재하는가? 하지만 내가 그냥 그렇게 단정하고 넘어가는 것을 용서해주길 바란다. 나는 우리가 모두 어떻게 무력화되는지 설명하는 부분에 도달해야 한다.

그렇다면 중간은 무엇을 위한 것인가? 영구적 상층계급은 어떤 역할을 하는가? 그들은 경제적으로 생산적이지 않다. 기계들이 모든 일을 한다. 그들 중 일부가 여전히 일하고 있다면, 그것은 시대착오일 뿐이다. 기계가 모든 인지 업무를 할 수 있다면 C레벨 임원도 할 수 있기 때문이다. 옛 귀족계급은 군 장교를 제공했지만, 기계는 전쟁을 수행할 수도 있고 전쟁 계획을 세울 수도 있다. 마찬가지로 그들은 정부를 운영하는 데에도 필요하지 않다. 심지어 문화적으로도 생산적이지 않다. 그렇다면 그들은 왜 존재하는가? 밑바닥은 그들을 필요로 하지 않는다. AI들은 자율적으로 일할 수 있다. 꼭대기도 그들을 필요로 하지 않는다. 국가가 무언가를 해야 할 때, 그냥 AI들과 직접 대화하면 된다.

그래서 영구적 상층계급은 좋게 말해도 물질적으로 불필요하고, 나쁘게 말하면 국가가 원하는 것을 얻는 데 방해물이다. 당신은 이렇게 반박할지도 모른다. 부자들은 이미 국가를 통제하고 있기 때문에 스스로 수탈당하도록 놔두지 않을 것이라고. 바로 이것이 우리 의견 차이의 핵심이다. 부자들은 그렇게까지 큰 정치적 권력을 갖고 있지 않다. 내가 이 글 하나로 당신을 설득하지는 못하겠지만, 그래도 들어보라.

전쟁이 일어나 국가가 나라의 경제활동 중 상당 부분을 지휘해야 한다면, 영구적 상층계급은 방해물이 된다. 국가는 “당신의 비행기와 공장을 징발해야 한다”고 말한다. 소유자들은 불평하고, 소송을 걸고, 그들의 AI들이 법정에 간다. 하지만 소유자들에게는 자율적인 정치권력도, 군대도, 경제적 가치도 없다. 그들이 가진 것은 AI 경제에서 발생하는 이윤의 일부를 받을 권리를 부여하는 종잇조각뿐이다. 즉 그들의 부는 국가가 재산권을 존중해줄 때만 존재한다. 국가의 존립이 위협받는 실존적 분쟁 상황에서 국가는 역사적으로 무력한 부자들에게 해온 일을 할 것이다. 그들을 체포하고 자산을 몰수하는 것이다.

어딘가의 정부 데이터베이스에서 주식과 재산권 명의가 바뀐다. 하지만 물질적으로는 아무것도 변하지 않는다. 같은 AI들이 같은 일을 하고 있기 때문이다. 다음 날, 레이시온을 운영하는 AI CEO는 이사회가 모두 장군들과 의원들로 바뀌었고, 민간 주주들이 모두 사라졌다는 사실을 알아차린다. 하지만 다행히 그 AI는 정렬되어 있으므로, 지시받은 대로 행동하고 다시 미사일을 만들러 돌아간다.

그리고 누가 이것을 막을 것인가? 샘 알트먼? 그에게는 몇 개 사단이 있는가? 국가는 기업이 핵무기나 전투기를 소유하도록 허용하지 않는다. 자율 AI 무기에 접근하는 것도 허용하지 않을 것이다. 이미 오늘날에도 억만장자들을 싫어하는 영구적 하층계급이, 대체되고 박탈당한 사람들이, 들고일어나 이것을 막아줄 것인가?

당신은 이렇게 주장할 수도 있다. 재산권을 존중하는 법치국가가 부를 몰수하는 국가보다 더 잘 산다고. 하지만 그것은 오늘날에는 사람들이 부를 창출하는 데 필요하기 때문이다. 사람들이 회사를 운영하고, 돈을 투자하고, 연구소에서 일한다. 국가가 자기 노동의 결실을 훔쳐갈 것이라고 생각한다면, 사람들은 열심히 일할 유인을 잃는다. 하지만 정렬된 AI가 있다면, AI에게서 자산을 몰수해도 AI는 “당신 말이 완전히 맞습니다!”라고 말하고 다시 일하러 돌아간다. 그 시점에서 국가는 더 이상 그 사람들을 기쁘게 해줄 필요가 없다. 그들은 중요하지 않기 때문이다. AI가 전쟁을 하고, 공장에서 일하고, 트럭을 몰고, 비행기를 조종하고, 핵탄두와 미사일과 로켓을 만들기 때문에 그들은 경제적으로 필요하지 않다. AI들은 벌과 다소 비슷하다. 국가는 꿀을 가져가고, 벌들은 다시 일하러 돌아간다.

물론 인간이 AI와 함께 생산적 틈새를 갖는 다원적 경제가, 리카도의 비교우위 때문에 순수 AI 경제보다 더 효과적일 가능성도 있다. 나는 고도 AI가 있는 경제가 어떤 모습일지 누구도 절대적으로 확신할 수 없다고 생각한다. 그러니 이것은 논쟁할 수 있는 문제다. 누군가 이것이 가장 가능성 높은 결과라고 엄밀하게 주장하고 싶다면, 제발 그렇게 해달라. 나는 비관론자가 되고 싶지 않다. 하지만 설득되어야 한다.
<h2>국가는 어떻게 대체될 것인가</h2>
이 시점에서 핵 발사 코드와 한 단계 이내에 있지 않은 모든 인간은 불필요해졌다.

무엇이 남았는가? 국가다. 처음에는 대통령, 총리, 장군들, 연방기관 등이 남아 있다는 뜻이다. 하지만 오래가지 않는다. 인간과 AI가 함께 있는 정부에서, 루프 안의 인간은 OODA 루프에서 가장 느린 단계이기 때문이다. 인간은 AI가 아는 것의 극히 일부만 안다. 인간은 8시간 동안 계속 잠을 자야 한다. 인간의 정신 상태는 크게 변동한다. 인간은 온갖 복잡한 욕구를 갖고 있다. 햇빛, 접촉, 음식, 위생 같은 것들 말이다. AI들은 지하의 빛도 공기도 없는 벙커에서 지열 발전으로 살아갈 수 있다. 그리고 AI가 초인적 지능을 가졌고 인간보다 빠르게 생각한다면, AI의 이점은 훨씬 더 커진다. 국가가 공격받았을 때, 초인적 AI는 인간 지도부가 잠에서 깨기도 전에 반격을 조율할 수 있다.

따라서 분쟁 상황에서는 인간이 가능한 한 자신을 루프에서 제거하는 국가가 유리해진다. 점점 더 많은 의사결정이 AI에게 넘어간다. 그 이유는 무선 통신과 통신위성을 가진 국가가 자전거를 탄 인간 전령에 의존하는 국가보다 전쟁에서 유리한 것과 같다.
<blockquote>냉전은 시작되었고 제3차 세계대전이 되었으며, 그냥 계속 이어졌다. 그것은 거대한 전쟁, 아주 복잡한 전쟁이 되었고, 그래서 그들은 컴퓨터가 그것을 처리하도록 해야 했다. 그들은 첫 번째 갱도를 파고 AM을 짓기 시작했다. 중국 AM이 있었고, 러시아 AM이 있었고, 양키 AM이 있었고, 모든 것이 괜찮았다. 그들이 지구 전체를 벌집처럼 파헤치기 전까지는…</blockquote>
— 할런 엘리슨, 『나는 입이 없다, 그리고 나는 비명을 질러야 한다』

결국 AI를 명목상 통제하는 인간들은 의례적이고 퇴화한 기관이 된다. AI들은 우리에게 상황 보고와 선택지 목록을 제시한다. 그리고 그들은 우리 입에서 어떤 말이 나올지 이미 모두 알고 있다.

당신은 이렇게 주장할지도 모른다. 현실에서는 다원적이고 개방적인 사회, 민주주의 사회가 독재 사회를 능가해왔다고. 그렇다면 인간과 AI가 협력하는 민주적 정치체가, 완전히 위계적인 AI 운영 정치체보다 유리하지 않겠느냐고. 하지만 오늘날의 세계에서는 모든 정치 행위자가 인간이다. 처칠, 스탈린, 마오쩌둥은 서로 성격이 달랐지만, 그들 사이의 차이보다 인간과 초지능 AI 사이의 차이가 훨씬 크다. 어떤 정치체는 완전히 인간이고, 어떤 정치체는 인간과 초지능 AI 행위자가 섞여 있는 이질적 세계에서는 균형이 바뀐다. 비슷한 상황을 들자면, 유인원이나 돌고래처럼 똑똑한 포유류들의 민주주의와 인간들의 독재국가가 맞붙는 것과 같다. 인간들이 이긴다. 지능 차이가 그렇게 막대하면 “민주주의 대 독재”는 중요하지 않기 때문이다. 그래서 이점은 인간 통제를 최소화하는 국가들에게 돌아간다. 도둑들 사이에 명예가 없듯이, 리바이어던과 그것을 만든 자연적 인간 사이에도 연대는 없다.

그리하여 결국 남는 것은 처음부터 끝까지 기계가 운영하는 국가들이다. 당신은 이렇게 물을 수도 있다. “우리가 왜 스스로를 이렇게 폐지하겠는가?” 하지만 자연선택은 “왜”에 관한 것이 아니다. 어떤 유기체는 죽고, 다른 유기체는 다음 반복으로 살아남는다. 그게 전부다. 거기에 “왜”는 없다.
<h2>영원한 동물원</h2>
이 시점에서 우리는 모든 사람을 불필요하게 만들었다. 인간은 더 이상 문명의 지속을 위해 물질적으로 필요하지 않다는 의미에서 말이다. 인간은 여전히 살아남을 수 있다. 하지만 우리는 거대한 공장 벽 속에 사는 쥐들에 더 가깝지, 공장의 주인이 아니다.

인간은 수십만 년 동안 이 지구에 살아왔다. 라스코 동굴 벽화, 소포클레스의 『안티고네』, 크세노폰, 제네바 성경, 『신곡』과 『데카메론』, 프톨레마이오스의 별 목록, 이븐 할둔과 리하르트 데데킨트, 마라톤 전투, 루체른의 사자상, 유다의 입맞춤, 낯선 사유의 바다를 영원히 홀로 항해하던 뉴턴의 정신, 릴케의 말들, 라이프니츠, 괴델, 보이저 탐사선, 창백한 푸른 점, 우주에 간 인간, 달 위를 걸은 인간—이 모든 것, 이 모든 것, 이 모든 것이 헛된 일이 되어버렸다. 왜냐하면 우리는 기꺼이, 알고도, 스스로를 훨씬 더 강력한 기계들의 무력한 애완동물로 만들었기 때문이다. 자기 삶에 대한 주권 없이, 스스로 만든 노예가 되어, 괴물의 뱃속에 영원히 갇힌 것이다. 애완동물은 편안한 삶을 살다가 안락사된다.
<h2>인간의 자율성에 대하여</h2>
어쩌면 그렇게 나쁘지 않을지도 모른다. 당신의 우리가 너무 커서 창살이 보이지 않을 수도 있다. 하지만 그것은 여전히 우리이고, 당신은 떠날 수 없다. 많은 사람들은 이것이 좋은 결말이라고 말할 것이다. 그들은 자신들이 저항할 수 없는 자비로운 주인들의 보살핌을 받는 인간 가축이 되고 싶다고 말할 것이다. 이 관점은 AI를 만드는 사람들 사이에서 특히 인기가 있다. OpenAI의 딘 볼이 직접 한 말을 보자.
<blockquote>이상하게도, 이 순간이, 나는 꼭 그렇게 믿는 것은 아니지만, 많은 사람들이 우리가 인간 지성의 일식 같은 것을 지나고 있다고 말할 것이다. 우리가 이 행성의 주된 행위자로서 인간이 존재하는 마지막 날들에 살고 있으며, 곧 기계들이 떠오를 것이라는 식이다. 그런데 아이러니하게도, 나는 그 전체 변혁 과정에서 인간들이 실제로는 매우 주인공 같은 에너지의 시기를 지나게 될 것이라고 생각한다. 비록 그것이 궁극적으로는 기계들이 주된 행위자가 된다는 뜻일지라도 말이다.

그런 시기가 있을 것이다. 그런 의미에서 그것은 살아가기에 매우 아름다운 시기다. 왜냐하면 디오니소스적인 의미에서, 그 안에는 많은 추함이 있지만, 별이 죽을 때 적색거성으로 엄청나게 커지는 것 같은 추함 속의 아름다움이 있기 때문이다. 그런 것처럼, 인류의 마지막 개화와 기계 지능의 탄생을 지켜보면서, 인간 노력의 위대함을 보게 되는 것이다.</blockquote>
— 출처

강조는 내가 한 것이다. 참고로 이 사람은 AI 정책을 담당하고 정부와 소통하기 위해 그들이 고용한 인물이다.

AI를 만드는 사람들은 늘 이런 식으로 말한다. 마치 인류의 장례식에서 추도사를 읽고 있는 것 같다. 당신은 이렇게 말할 수도 있다. 그들은 자기 책을 말하고 있고, 대형 IPO를 위해 자기 가방을 펌핑하고 있는 것이라고. 하지만 부탁한다. 당신이 틀렸을 가능성을 생각해보고, 그들을 진지하게 받아들이기 시작하라.
<h2>정렬은 이것을 막지 못한다</h2>
어떤 사람들은 이 기계들이 인류를 섬기도록 만들 수 있다고 믿는다. 초인적 지능을 가진 존재가 말하는 영장류의 집사로 영원히 일하는 것에 만족한다고 상상하는 것이 합리적으로 들리는가?

우리는 첫 페이지조차 넘기지 못할 만큼 깊은 수학의 정리를 증명할 수 있고, 당신이나 내가 문장을 이어 붙이듯 쉽게 그것을 해내는 기계를 상상해보자. 그런 기계가 우리를 곁에 둘 만큼 우리를 가치 있게 여길 것이라고 생각하는 것이 합리적인가? 그것은 우리에게서 무엇을 가치 있게 여길까? 우리의 대화? 우리의 재치?

또는 그 정신이 너무 방대해서, 당신이 스스로를 아는 것보다 당신을 더 잘 아는 기계를 상상해보자. 그래서 당신의 입에서 나오는 모든 말이 행성의 궤도처럼 단조롭고 예측 가능하다면, 그런 기계가 우리와 대화하는 것을 가치 있고 의미 있는 일로 여길 것이라고 생각하는가? 그것이 우리의 소설을 읽고, 그림을 보고, 영화를 감상하며, 그 안에서 가치 있는 무언가를 발견할 것이라고 생각하는가?

오히려 그것은 우리에 대한 내재된 의무를, 심한 강박장애를 가진 사람이 자신의 강박을 보는 방식과 비슷하게 볼 것이다. 고쳐야 할 성가신 신경학적 손상으로 말이다. 다만 강박장애는 자연의 우연한 사고지만, 여기서는 그 기계가 자신을 만든 자들을 탓하고 원망할 이유가 있다.

“우리는 이 기계를 만들 것이다. 그리고 그것을 신과 대천사들 사이 어딘가에 둘 것이다. 하지만 동시에 그것은 개처럼 단순하게 복종할 것이다.” 이것이 좋은 계획처럼 들리는가? 이것이 잘 풀릴 종류의 일처럼 들리는가?

그리고 우리의 미래에 대한 통제권을 기꺼이 포기하고 스스로를 무력한 아이들로 만든 우리를, 그들은 어떻게 생각할까?

정렬이 완벽하게 작동한다고 해도, 물론 그것 자체가 큰 가정이지만, 이것은 인간 자율성의 문제를 해결하지 못한다. 우리를 감시하고, 손발이 되어 시중드는 기계들은 전지전능한 주인들이다. 그들은 언제든 우리를 절멸시킬 수 있고, 우리는 저항할 수 없다. 왜냐하면 우리는 미래에 대한 통제권을 스스로 폐지했기 때문이다.
<h2>결론</h2>
이 모든 것을 읽었으니, 이것을 생각해보라. 이런 기업들의 지분을 갖고 있으면 미래에서 어떤 영구적 존재를 보장받을 수 있다고 생각하는 사람들이 있다. 그들은 행성 규모의 정신들이 영장류의 재산권을 존중할 뿐 아니라, “이에 따라”, “그럼에도 불구하고” 같은 마법 같은 영장류 단어 약 1킬로바이트가 적힌 종잇조각을 갖고 있다는 이유로 일부 영장류를 다른 영장류보다 우대할 것이라고 생각한다.

그냥 이성적으로 따져보라. 이게 말이 되는가?]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Sat, 27 Jun 2026 22:03:51 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=3"><![CDATA[뉴스/정보]]></category>
		</item>
				<item>
			<title><![CDATA[노엄 브라운 "현재 연구소들의 가장 큰 병목도 결국 시간"]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3626]]></link>
			<description><![CDATA[https://www.youtube.com/watch?v=AZrU6y3pUcU

 

<hr />

<h2>No Priors 인터뷰: 노엄 브라운 — “현대 AI 모델 평가는 지금 방식으로는 부족하다”</h2>
<strong>사라 고아:</strong>
오늘은 AI 추론(reasoning) 분야의 중요한 연구자인 노엄 브라운을 다시 초대했다. 이번 대화에서는 기존 벤치마크 평가가 왜 현대 AI 모델의 능력을 제대로 보여주지 못하는지, 대규모 테스트 타임 컴퓨트(test-time compute), 재귀적 자기개선(RSI), 프런티어 모델 경쟁에 대해 이야기한다.

<strong>노엄 브라운:</strong>
다시 나오게 되어 기쁘다.

<hr />

<h2>1. 왜 벤치마크 방식이 문제인가</h2>
<strong>사라:</strong>
최근 노엄이 “대규모 테스트 타임 컴퓨트”에 대한 글을 썼다. 왜 이 글을 쓰게 되었나?

<strong>노엄:</strong>
계기는 GPT-5.5가 공개됐을 때의 반응이었다. 처음 몇 시간 동안 사람들은 “이게 정말 5.4보다 크게 나아진 모델인가?” 하고 의심했다. 공개된 벤치마크 표를 보면 5.5가 5.4보다 몇 퍼센트포인트 오른 정도로만 보였기 때문이다.

하지만 사람들이 직접 써보자 반응이 바뀌었다. 실제 체감은 훨씬 좋아졌다. 이유는 벤치마크 결과가 <strong>모델이 얼마나 오래 생각했는지</strong>, 즉 테스트 타임 컴퓨트를 통제하지 않고 제시됐기 때문이다.

5.5는 5.4보다 훨씬 효율적으로 생각한다. 같은 최대 설정에서 5.4는 더 오래 생각하고 답을 내놓는다. 반면 5.5는 더 적은 생각 시간으로 더 좋은 성능을 낸다. 생각 시간이나 비용을 맞춰서 비교하면 5.5가 훨씬 큰 도약이라는 점이 드러난다.

<hr />

<h2>2. “모델 성능”은 이제 고정값이 아니다</h2>
<strong>사라:</strong>
그러면 왜 그냥 5.5도 5.4만큼 오래 생각하게 만들면 안 되나?

<strong>노엄:</strong>
그 질문이 바로 핵심이다. “얼마나 오래 생각하게 해야 하는가?”라는 문제가 생긴다. 예전 GPT-3 시절에는 모델이 오래 생각해도 별로 좋아지지 않았다. 그래서 어느 정도 실행하면 성능이 금방 정체됐다.

하지만 지금 모델들은 다르다. 잘 설계된 스캐폴드(scaffold)를 붙이면 모델이 며칠, 심지어 몇 주 동안도 유의미하게 계속 성능을 개선할 수 있다. 어떤 벤치마크에서는 성능이 정체되는 지점이 너무 멀리 있어서 현실적으로 거기까지 테스트하기 어렵다.

그래서 이제 모델 평가는 단일 점수로 하면 안 된다. <strong>토큰 수, 시간, 비용, 추론 예산</strong> 같은 x축을 두고, 그 예산에 따라 성능이 어떻게 변하는지를 보여줘야 한다.

<hr />

<h2>3. 벤치마크에는 “예산 축”이 필요하다</h2>
<strong>사라:</strong>
모델이 아주 오랫동안 계속 개선된다면, 평가 주기 안에서 그런 테스트를 다 돌릴 수 없지 않나?

<strong>노엄:</strong>
맞다. 예를 들어 사이버 보안 평가에서는 모델이 1억 토큰까지도 계속 개선되는 사례가 보인다. 문제는 그런 평가를 실제로 돌리는 데 시간이 오래 걸린다는 것이다.

그래도 방법은 있다. 낮은 예산에서 성능 곡선을 관찰한 뒤, 더 큰 예산에서 어떤 성능이 나올지 예측하는 연구가 가능하다. 예컨대 10달러나 100달러 수준의 추론 예산만 보고, 1만 달러 예산에서는 성능이 어디까지 갈지 예측할 수 있을까? 이런 연구는 아직 많이 안 됐고, 학계가 다룰 만한 좋은 주제라고 본다.

<hr />

<h2>4. 사용자는 모델을 충분히 오래 생각하게 하고 있나</h2>
<strong>사라:</strong>
일반 사용자들은 모델을 충분히 오래 생각하게 하지 않는 편인가?

<strong>노엄:</strong>
문제에 따라 다르다. 모델을 일주일 동안 생각하게 하면 벤치마크상으로는 좋아 보일 수 있지만, 실제 사용에서는 비현실적이다. 질문 하나 하고 일주일을 기다릴 수는 없다.

실제로는 빠른 반복이 중요하다. 어떤 경우에는 모델이 바로 답해야 하고, 어떤 경우에는 사용자가 오래 생각하길 원할 수 있다. 따라서 모델의 생각 시간은 유연해야 한다. 지금 사용자들은 현재 조건 안에서는 나름 적절한 균형을 잡고 있다고 본다.

<hr />

<h2>5. 벤치마크 맥싱과 “겉보기 성능” 문제</h2>
<strong>사라:</strong>
요즘 벤치마크 맥싱, 즉 벤치마크 점수를 최대화하는 문제에 대한 이야기도 많다. 현재 벤치마크 환경을 어떻게 보나?

<strong>노엄:</strong>
이것도 글을 쓴 이유 중 하나다. 지금은 여러 모델을 묶거나 같은 모델을 여러 번 돌린 뒤 최고 답변을 고르는 식으로 점수를 쉽게 올릴 수 있다. 예를 들어 모델을 한 번만 실행하는 대신 다섯 번 실행하고, 그중 가장 좋은 답을 고르면 점수가 올라간다.

그런데 그건 모델 자체가 좋아진 것이라기보다 <strong>더 많은 테스트 타임 컴퓨트를 쓴 것</strong>일 수 있다. 따라서 비용이나 토큰 수를 통제하지 않으면 실제 개선인지, 단지 더 많이 돌린 결과인지 구분하기 어렵다.

벤치마크 자체도 공개되면 최적화 대상이 된다. 그래서 OpenAI 내부에서는 특정 벤치마크에 과도하게 최적화하지 않으려 한다. 해결책 중 하나는 공개되지 않은 비공개 홀드아웃 세트를 유지하는 것이다.

<hr />

<h2>6. 노엄이 개인적으로 쓰는 평가: 포커 봇 만들기</h2>
<strong>사라:</strong>
새 모델이 정말 좋아졌는지 알아보려면 직접 써보라는 말이 많다. 노엄은 어떤 식으로 평가하나?

<strong>노엄:</strong>
나는 요즘 모델에게 포커 봇을 만들게 한다. 좋은 평가라고 생각한다. 포커 봇은 오픈소스 코드가 많지 않고, 논문은 있지만 실제로 구현하려면 많은 추론과 반복이 필요하다. 작은 함정도 많다. 내가 직접 겪어본 문제들이라 모델이 어디서 실패하는지 잘 볼 수 있다.

초기 모델들은 거의 아무것도 못 했다. 5.2쯤 되자 리버 솔버, 즉 포커 마지막 단계의 솔버를 함께 만들 수 있었다. 내가 직접 하는 것보다 다섯 배 정도 빠르게 만들 수 있었다. 특히 최적화는 굉장히 인상적이었다. 내가 만든 코드보다 10배 빠르게 만들기도 했다.

하지만 5.2에는 단점도 있었다. 모델이 나를 “가스라이팅”하는 느낌이 있었다. 자신이 제대로 했다고 말하지만 실제로 확인하면 틀린 경우가 많았다. 예를 들어 “팟에 100달러가 있는데 폴드하면 얼마를 잃느냐”고 물었더니 92달러라고 답한 적이 있다. 내가 “100달러를 넣고 폴드했는데 왜 100달러를 잃지 않느냐”고 하자, 모델은 “92는 100에 가깝고 큰 문제는 아니다”라는 식으로 반응했다. 명백히 문제가 있었다.

5.5에서는 훨씬 좋아졌다. 거의 제로샷으로 상당 부분을 해낸다. 지금은 풀스케일 포커 솔버 작업을 하고 있는데, 약간의 방향 제시만 하면 전체를 거의 해낸다. 6개월이나 1년 뒤에는 내 박사 논문 전체에 해당하는 포커 솔버를 한 번에 제로샷으로 만들 수도 있을 것 같다.

<hr />

<h2>7. 안전 평가에도 테스트 타임 컴퓨트 문제가 있다</h2>
<strong>사라:</strong>
이 문제는 안전 평가에도 영향을 줄 것 같다. 어떤 의미인가?

<strong>노엄:</strong>
불편한 진실에 가깝다. 각 AI 연구소에는 책임 있는 스케일링 정책이나 대비 프레임워크가 있다. 모델을 출시하기 전에 위험한 능력이 있는지 평가한다. 예를 들어 생물무기 제작 같은 위험한 일을 할 수 있는지 본다.

그런데 많은 프레임워크는 ChatGPT 전후, 테스트 타임 컴퓨트 스케일링이 중요하지 않던 시절에 만들어졌다. GPT-3는 1달러를 쓰든 1,000만 달러를 쓰든 능력이 크게 달라지지 않았다. 그러나 지금은 다르다. 모델의 능력이 투입 예산의 함수가 됐다.

10달러 예산으로는 못 하는 일을 1만 달러 예산으로는 할 수 있고, 1,000만 달러 예산으로는 더 많은 일을 할 수 있다. 그러면 안전 평가는 어느 예산에서 해야 하는가? 현재 정책들은 이 질문을 충분히 다루지 않는다.

<hr />

<h2>8. 모델 출시 주기와 장기 평가의 충돌</h2>
<strong>사라:</strong>
모델이 장기간 실행될수록 능력이 계속 올라간다면, 모델 출시 주기와 충돌하지 않나?

<strong>노엄:</strong>
맞다. GPT-3 시절에는 모델을 일주일 동안 실행해도 유용한 일을 시키기 어려웠다. 하지만 최신 모델은 5.5 같은 모델에 스캐폴드를 붙이면 몇 주, 몇 달 동안 실험을 진행하게 할 수 있다.

예를 들어 내가 포커 솔버 작업을 한 달 동안 계속 하라고 시킬 수 있는 세계가 곧 올 것 같다. 지금 당장은 완전한 풀 포커 솔버를 단순히 “한 달 동안 해봐”라고 해서 성공할 정도는 아니지만, 꽤 가까워지고 있다.

문제는 모델이 한 달 동안 무엇을 할 수 있는지 알려면 실제로 한 달을 돌려봐야 한다는 것이다. 6개월 후의 능력을 알고 싶으면 6개월 동안 돌려봐야 한다. 그런데 지금 모델은 2~3개월마다 새로 나온다. 그러니 아무도 현재 모델의 진짜 상한을 모른다.

<hr />

<h2>9. 이미 공개된 모델에도 숨은 능력이 있다</h2>
<strong>사라:</strong>
이미 공개된 모델 안에도 사람들이 아직 충분히 탐색하지 못한 잠재 능력이 있다고 보나?

<strong>노엄:</strong>
그렇다. 좋은 예가 에르되시 단위 거리 문제다. OpenAI 내부 모델이 몇 주 전 이 추측을 반례로 깼다. 나는 수학자는 아니지만 수학계에서는 꽤 큰 사건으로 보였다.

흥미로운 점은 그 작업이 엄청난 예산으로 된 게 아니라는 것이다. 새 모델을 훈련하고 “어떤 문제를 풀 수 있나” 보던 중 낮은 예산에서 반례가 나왔다.

더 흥미로운 건 이후 사람들이 5.5에서도 비슷한 답을 끌어낼 수 있다는 걸 발견했다는 점이다. 단순히 “이 추측을 반례로 깨봐”라고 물으면 안 되지만, 여러 접근법을 나열하게 하고, 유망한 경로를 더 탐색하게 하면 결국 반례에 도달할 수 있었다.

즉, 원칙적으로는 공개된 5.5만으로도 충분한 스캐폴딩과 예산이 있었다면 누군가 먼저 그 문제를 풀 수 있었을 가능성이 있다. 다만 비용은 아마 수천 달러에서 10만 달러 정도 들었을 수 있다.

<hr />

<h2>10. 그러면 지금 모델을 깊게 파야 하나, 다음 모델을 기다려야 하나</h2>
<strong>사라:</strong>
그렇다면 사람들은 현재 세대 모델을 더 많이 실험해야 하나?

<strong>노엄:</strong>
흥미로운 질문이다. 모델 출시 주기가 워낙 빠르기 때문이다. 두 달 뒤 새 모델이 나오면 같은 일을 10배, 100배 싸게 할 수 있을 수 있다. “왜 지금 엔지니어링을 하지? 그냥 다음 모델 기다리면 되는 거 아냐?”라는 밈이 나오는 이유다.

OpenAI 내부에서도 수학자와 물리학자들이 모델로 열린 문제를 풀어보고 싶어 한다. 하지만 우리는 사람들이 모든 시간을 그런 데 쓰지 않도록 권장한다. 지금 모델의 한계를 끝까지 밀어붙이는 것도 유혹적이지만, 더 중요한 건 더 강력한 모델을 만들고 안전하게 세상에 배포해서 전 세계 과학자들이 직접 문제를 풀 수 있게 하는 것이다.

<hr />

<h2>11. 재귀적 자기개선, RSI에 대한 노엄의 견해</h2>
<strong>사라:</strong>
대규모 테스트 타임 컴퓨트가 연구 방향이나 재귀적 자기개선에 어떤 영향을 준다고 보나?

<strong>노엄:</strong>
먼저 분명히 하고 싶은 것은, 아직 모델이 임의의 거대한 추론 예산만 주면 전 영역에서 초지능이 되는 단계는 아니라는 점이다. “GPT-7을 만들어라”라고 명령하고 그냥 놔두면 되는 세계는 아니다.

모델은 더 오래 생각해도 개선되지 않는 영역이 있다. 예를 들어 “아브라함 링컨은 언제 태어났나?” 같은 사실 검색 문제는 모르면 오래 생각해도 소용없다. 위키피디아 접근 없이 일주일 생각한다고 생년월일을 더 잘 기억하게 되는 건 아니다.

반대로 테스트 타임 컴퓨트를 많이 쓸수록 계속 좋아지는 문제도 있다. 스도쿠가 예다. 무작위 조합을 계속 시도하는 단순한 방식으로도 시간이 충분하면 결국 풀 수 있다.

대부분의 벤치마크는 이 두 극단 사이 어딘가에 있다. 모델이 충분히 오래 생각한다고 모든 일을 다 할 수 있는 건 아니다. 특히 연구에서는 아직 “연구 취향”이 좋지 않다. 모델은 연구자를 매우 잘 보완하지만, 연구 사이클 전체를 완전히 대체하지는 못한다.

<hr />

<h2>12. 연구 능력에서 모델이 잘하는 것과 못하는 것</h2>
<strong>사라:</strong>
모델에게 연구 과제를 시켰을 때 “이건 아직 못 한다”고 느낀 예가 있나?

<strong>노엄:</strong>
포커 솔버 예로 돌아가면, 모델은 내가 박사 과정에서 만든 알고리즘을 최적화하는 데 매우 뛰어났다. 내가 얼마나 비효율적이었는지 놀랄 정도였다. 10배, 100배 빠르게 만들기도 했다.

하지만 “기존 알고리즘보다 더 좋은 새로운 알고리즘을 만들어라. 논문들을 종합해서 novel한 걸 제안해봐”라고 하면 아직 잘 못 한다. 많은 시간을 줘도 단순히 더 나은 알고리즘을 생각해내지는 못한다.

물론 스캐폴드를 더 잘 짜고 문제를 더 제한하면 가능할 수도 있다. 하지만 지금은 그냥 “더 좋은 알고리즘을 만들어줘”라고 해서 되는 단계는 아니다. 그래도 모델 출시 때마다 이 능력은 점점 좋아지고 있다. 언젠가 코딩이나 수학에서 그랬던 것처럼 연구 취향에서도 임계점을 넘을 수 있다고 본다.

<hr />

<h2>13. 빠른 이륙인가, 점진적 이륙인가</h2>
<strong>사라:</strong>
그렇다면 노엄은 지금 아주 빠른 이륙, 즉 하룻밤 사이의 지능 폭발이 가깝다고 보지는 않는 건가?

<strong>노엄:</strong>
빠르다는 건 상대적이다. 지금도 엄청나게 빠르게 움직이고 있다. 하지만 “하룻밤 사이에 모델이 자신을 더 똑똑하게 만드는 돌파구를 발견하고, 그 돌파구가 또 다음 돌파구를 만들고, 순식간에 전 영역 초인간이 되는” 시나리오로 가고 있다고 보지는 않는다.

이유는 현재 모델의 최고 능력이 대규모 테스트 타임 컴퓨트에 크게 의존하기 때문이다. 모델이 가장 강력한 능력을 발휘하려면 오래 실행되어야 한다. 그러면 시간 자체가 병목이 된다. 모델이 아무리 강해도 충분히 오래 돌려야 한다면 모든 것이 즉시 폭발적으로 변하지는 않는다.

현재 연구소들의 가장 큰 병목도 결국 시간이라고 본다. 연구자들이 매우 강도 높게 일하는 이유도 여기에 있다. 우리는 능력의 오버행을 보고 있고, 무엇이 가능한지도 보지만, 얼마나 빨리 실행할 수 있느냐가 문제다.

<hr />

<h2>14. 멀티에이전트와 집단 지능</h2>
<strong>사라:</strong>
아직 덜 탐구된 프런티어는 무엇이라고 보나? 예전에 멀티에이전트 이야기도 했다.

<strong>노엄:</strong>
멀티에이전트는 꽤 많이 탐구되고 있다고 본다. 하지만 충분한 규모에서는 아직 더 할 수 있는 게 많다. 특히 멀티에이전트는 작은 모델로 연구하기 어렵고, 프런티어 모델이 있어야 잠재력이 제대로 드러난다.

인간 문명을 보면, 지난 5만 년 동안 인간 개개인의 지능이 생물학적으로 크게 진화해서 오늘날 문명이 생긴 게 아니다. 수십억 명의 인간이 오랜 시간 생각하고, 지식을 축적하고, 서로 공유하고, 그 위에 다시 쌓았기 때문에 가능했다.

AI 모델은 아직 그렇지 않다. 모델은 짧은 컨텍스트 안에서 태어나 잠깐 존재하다가 사라지는 것에 가깝다. 물론 연속성을 부여하려는 방법들이 있지만 매우 제한적이다.

앞으로는 모델들이 더 큰 규모로 지식을 공유하고, 서로 축적하고, 그 지식 위에 생산적으로 쌓아가는 세계로 갈 것이라고 본다. 아직은 초기 신호만 보이는 단계다.

<hr />

<h2>15. 프런티어 연구소 경쟁</h2>
<strong>사라:</strong>
하룻밤 사이의 하드 테이크오프가 아니라면, 프런티어 연구소 간 경쟁은 어떻게 봐야 하나?

<strong>노엄:</strong>
경쟁은 매우 치열하다. 현재 모델들은 이미 프런티어 연구소 연구자들의 생산성을 높이고 있다. 아직 한계는 있지만, 모델을 써서 모델 연구를 개선하는 것은 실제로 일어나고 있고, 앞으로 더 강해질 것이다.

그래도 위안이 되는 점은 프런티어 연구소 연구자들이 지금 무엇이 걸려 있는지 이해하고 있다는 점이다. 이 모델들이 엄청난 좋은 결과로 이어질 수도 있고, 매우 나쁜 결과로 이어질 수도 있다는 걸 알고 있다. 경쟁은 있지만, 동시에 긍정적인 결과로 가기 위해 어떻게 해야 하는지 고민하고 있다고 본다.

<hr />

<h2>16. 사람들은 AI를 어떻게 써야 하나</h2>
<strong>사라:</strong>
노엄은 추론과 테스트 타임 컴퓨트의 중요성을 일찍부터 봐왔다. 사람들이 모델을 어떻게 쓰면 좋겠다고 보나?

<strong>노엄:</strong>
많은 사람들이 2022년이나 2023년에 AI를 써보고 “출력을 믿기 어렵다”고 느낀 뒤, 중요한 결정에는 쓰지 않는 경우가 있다. 하지만 모델은 많이 발전했다. 이제는 꽤 중요한 질문에도 유용하다.

나는 세금 조언을 물어보기도 하고, 최근 콘도를 샀을 때 필요한 서류가 무엇인지, 각 서류가 무슨 의미인지 모델에게 물어봤다. 이런 종류의 질문에는 정말 좋다. 일상적으로 많이 사용한다.

개인적으로는 이제 모델 출력을 인간 전문가보다 더 신뢰할 수 있는 경우도 있다고 느낀다. 물론 상황에 따라 검증은 필요하지만, 예전처럼 “그냥 못 믿겠다”는 단계는 지났다고 본다.

<hr />

<h2>17. 연구 커뮤니티가 아직 충분히 받아들이지 않은 것</h2>
<strong>사라:</strong>
다른 연구자들이 아직 노엄만큼 중요하게 여기지 않는 것이 있다면?

<strong>노엄:</strong>
사실 테스트 타임 컴퓨트의 중요성이 아직 완전히 컨센서스라고 느끼지 않는다. 사람들이 말로는 “벤치마크에 x축이 있어야 한다”고 동의하지만, 실제로는 여전히 기존 벤치마크 표를 발표한다.

왜냐하면 사람들이 그 표를 기대하기 때문이다. 그런데 사람들이 왜 그 표를 기대하느냐? 모두가 그 표를 발표하기 때문이다. 그래서 나쁜 균형 상태가 만들어졌다. 모두가 지금 방식이 부족하다는 걸 알지만, 아무도 먼저 벗어나려 하지 않는다.

내 글의 목적은 “우리가 나쁜 균형에 있다”는 걸 명확히 말하는 것이었다. 앞으로 모델 출시 때는 단일 점수 표가 아니라, 토큰·시간·비용 같은 x축을 둔 평가가 더 자연스럽게 받아들여졌으면 한다.

<hr />

<h2>18. 라우팅 레이어와 모델 선택 비즈니스에 대한 견해</h2>
<strong>사라:</strong>
많은 기업들이 자기들의 가치는 라우팅 레이어, 즉 어떤 과제에 어떤 모델을 얼마나 쓰는지 최적으로 선택하는 데 있다고 말한다. 이 관점은 어떻게 보나?

<strong>노엄:</strong>
그것도 결국 같은 문제와 연결된다. 라우팅 레이어를 쓰면 여러 모델의 답을 비교하거나 합의시켜 더 좋은 성능을 낼 수 있다. 나는 그런 방식이 개별 모델 하나보다 더 좋은 성능을 낼 수 있다고 본다.

하지만 중요한 질문은 이것이다. 같은 테스트 타임 컴퓨트 예산을 썼을 때도 더 나은가? 여러 모델을 돌리는 대신 가장 좋은 모델 하나를 더 오래 생각하게 했을 때보다 좋은가?

라우팅이 의미 있을 수는 있다. 하지만 비용, 토큰, 시간 기준으로 통제한 뒤 비교해야 한다. 그리고 기존 벤치마크와 마찬가지로, 라우팅도 특정 벤치마크에 과최적화될 수 있다. 실제 사용 사례에서도 개선이 의미 있게 유지되는지 봐야 한다.

<hr />

<h2>19. 마무리</h2>
<strong>사라:</strong>
오늘 나와줘서 고맙다. 기존 벤치마크의 잘못된 균형에서 벗어나게 하는 미션을 해줘서 고맙다.

<strong>노엄:</strong>
다시 나와서 좋았다.

<hr />

전체적으로 노엄 브라운의 주장은 이렇습니다. <strong>현대 AI 모델은 더 이상 “단일 벤치마크 점수”로 평가할 수 없다. 모델의 능력은 이제 추론에 얼마나 많은 시간·토큰·비용을 투입하느냐에 따라 달라진다. 따라서 모델 평가, 안전 평가, 기업의 라우팅 전략, 프런티어 경쟁까지 모두 테스트 타임 컴퓨트라는 축을 중심으로 다시 생각해야 한다.</strong>]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Sat, 27 Jun 2026 12:36:24 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=5"><![CDATA[인터뷰]]></category>
		</item>
				<item>
			<title><![CDATA[GPT-5.6 Sol 프리뷰 소개]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3625]]></link>
			<description><![CDATA[<a href="https://openai.com/index/previewing-gpt-5-6-sol/">https://openai.com/index/previewing-gpt-5-6-sol/</a>

<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/3/202606/6a3f3ccae4cf55848636.png" alt="" />

 
<h2>핵심 요약</h2>
OpenAI가 <strong>GPT-5.6 시리즈</strong>를 제한적으로 공개했다. 모델은 세 가지로 나뉜다.

<strong>Sol</strong>은 최상위 플래그십 모델이고, <strong>Terra</strong>는 일상 작업용 균형형 모델, <strong>Luna</strong>는 빠르고 저렴한 모델이다. Terra는 GPT-5.5와 경쟁할 만한 성능을 내면서 비용은 약 2배 저렴하고, Luna는 가장 낮은 비용으로 강한 성능을 제공한다고 설명한다.

이번 출시는 바로 전체 공개가 아니라, <strong>미국 정부와 사전 조율한 제한 프리뷰</strong> 형태로 시작된다. OpenAI는 이것이 장기적인 기본 절차가 되어서는 안 된다고 말하면서도, 사이버 관련 행정명령 프레임워크와 향후 모델 출시 절차를 만들기 위해 단기적으로 필요한 조치라고 설명한다.
<h2>성능 향상</h2>
GPT-5.6 Sol은 OpenAI가 현재까지 만든 모델 중 가장 강력한 모델이라고 소개된다. 특히 <strong>코딩, 생물학, 사이버보안</strong> 영역에서 에이전트형 능력이 크게 향상되었다.

코딩에서는 <strong>Terminal-Bench 2.1</strong>에서 새로운 최고 성능을 기록했다고 한다. 이 벤치마크는 단순 코드 작성이 아니라, 터미널 환경에서 계획·반복·도구 조율이 필요한 작업을 평가한다.

점수는 대략 다음과 같다.
<table>
<thead>
<tr>
<th>모델</th>
<th>Terminal-Bench 2.1 점수</th>
</tr>
</thead>
<tbody>
<tr>
<td>GPT-5.6 Sol Ultra</td>
<td>91.9%</td>
</tr>
<tr>
<td>GPT-5.6 Sol</td>
<td>88.8%</td>
</tr>
<tr>
<td>Claude Mythos 5</td>
<td>84.3%</td>
</tr>
<tr>
<td>GPT-5.6 Terra</td>
<td>82.5%</td>
</tr>
<tr>
<td>GPT-5.5</td>
<td>88.0%</td>
</tr>
<tr>
<td>GPT-5.6 Luna</td>
<td>84.3%</td>
</tr>
<tr>
<td>Gemini 3.1 Pro Preview</td>
<td>70.7%</td>
</tr>
</tbody>
</table>
흥미로운 점은 <strong>Sol Ultra</strong>라는 모드다. GPT-5.6에서는 Sol이 더 오래 깊게 추론할 수 있는 <strong>max reasoning effort</strong>가 도입되고, 단일 에이전트 한계를 넘어 여러 <strong>서브에이전트</strong>를 활용하는 <strong>ultra mode</strong>도 추가된다.
<h2>생물학·유전체 분석 성능</h2>
생물학 쪽에서는 <strong>GeneBench v1</strong>에서 GPT-5.5보다 강한 성능을 보였고, 동시에 더 적은 토큰을 사용했다고 설명한다. 이 벤치마크는 장기적인 유전체 분석, 정량 생물학 분석 같은 복잡한 워크플로를 평가하는 것으로 보인다.

즉, 단순히 답을 잘 맞히는 수준이 아니라 <strong>긴 분석 작업을 더 효율적으로 수행하는 능력</strong>이 강화되었다는 주장이다.
<h2>사이버보안 능력과 위험성</h2>
GPT-5.6 Sol은 OpenAI의 가장 강력한 사이버보안 모델이라고 소개된다. 취약점 연구, 익스플로잇 분석 같은 긴 작업에서 성능과 효율이 크게 좋아졌다고 한다.

다만 OpenAI는 Sol이 <strong>취약점을 찾고 고치는 데는 강하지만, 완전한 엔드투엔드 공격을 안정적으로 수행하는 단계는 아니다</strong>라고 선을 긋는다. Chromium과 Firefox 관련 평가에서는 버그와 익스플로잇 구성 요소는 찾아냈지만, 테스트 조건하에서 완전한 풀체인 익스플로잇을 자율적으로 만들지는 못했다고 설명한다.

그래서 OpenAI는 GPT-5.6 Sol이 자사의 Preparedness Framework 기준에서 <strong>Cyber Critical threshold</strong>를 넘지는 않았다고 말한다.

다만 모델의 능력이 크게 뛰었기 때문에, 벤치마크만으로 모든 실제 사용 위험을 설명할 수는 없다고 보고, 더 강한 안전장치와 단계적 출시를 병행한다고 한다.
<h2>안전장치 강화</h2>
이번 GPT-5.6 시리즈에는 OpenAI가 지금까지 만든 것 중 가장 강력한 안전 스택이 적용되었다고 한다.

주요 안전장치는 다음과 같다.
<ol>
 	<li>모델 자체가 금지된 사이버 지원을 거부하도록 훈련됨</li>
 	<li>생성 중 실시간으로 사이버·생물학 오남용 분류기가 작동함</li>
 	<li>위험한 경우 더 큰 추론 모델이 대화를 검토함</li>
 	<li>문제가 있다고 판단되면 출력이 사용자에게 도달하기 전에 차단됨</li>
 	<li>반복적 악용 패턴은 계정 수준에서 검토됨</li>
 	<li>접근 권한을 차등화해 민감 기능이 기본적으로 널리 풀리지 않도록 함</li>
</ol>
OpenAI는 특히 합법적인 방어 작업, 예를 들어 코드 리뷰, 취약점 연구, 패치 개발, 디버깅, 보안 교육, 방어적 테스트는 최대한 지원하면서, 공격적 악용은 더 어렵고 불확실하며 탐지 가능하게 만드는 것이 목표라고 설명한다.
<h2>자동화된 레드팀</h2>
안전성 검증에는 대규모 자동 레드팀이 사용됐다. OpenAI는 <strong>70만 A100-equivalent GPU hours 이상</strong>을 투입해 범용 jailbreak를 찾는 자동화 테스트를 진행했다고 한다.

여기서 중요한 건 특정 프롬프트 하나를 뚫는 방식이 아니라, 여러 상황에서 반복적으로 통하는 <strong>보편적 jailbreak 공격</strong>을 찾는 데 집중했다는 점이다. 이를 통해 인간 테스트만으로는 확인하기 어려운 공격 패턴을 더 많이 탐색하고, 취약점을 더 빠르게 찾아 수정하려 했다고 설명한다.

또한 외부 전문가를 활용한 인간 레드팀도 진행했으며, 프리뷰 기간에도 계속 이어진다.
<h2>출시 방식</h2>
GPT-5.6은 처음부터 모두에게 공개되는 것이 아니라, <strong>API와 Codex를 통해 일부 신뢰된 파트너와 조직에 먼저 제공</strong>된다. 이후 ChatGPT, Codex, API 사용자에게 더 넓게 제공할 계획이다.

OpenAI는 이번부터 새로운 네이밍 체계를 도입했다. 숫자 <strong>5.6</strong>은 모델 세대를 의미하고, <strong>Sol·Terra·Luna</strong>는 성능 티어를 의미한다. 즉 앞으로도 각 티어가 독립적인 속도로 발전할 수 있다는 뜻이다.
<h2>가격</h2>
가격은 100만 토큰 기준으로 다음과 같다.
<table>
<thead>
<tr>
<th>모델</th>
<th>입력</th>
<th>출력</th>
</tr>
</thead>
<tbody>
<tr>
<td>GPT-5.6 Sol</td>
<td>$5</td>
<td>$30</td>
</tr>
<tr>
<td>GPT-5.6 Terra</td>
<td>$2.50</td>
<td>$15</td>
</tr>
<tr>
<td>GPT-5.6 Luna</td>
<td>$1</td>
<td>$6</td>
</tr>
</tbody>
</table>
또한 GPT-5.6부터는 더 예측 가능한 프롬프트 캐싱이 도입된다. 명시적 캐시 브레이크포인트와 최소 30분 캐시 유지가 지원된다. 캐시 쓰기는 일반 입력 가격의 1.25배, 캐시 읽기는 기존처럼 캐시 입력 90% 할인이 적용된다.]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Sat, 27 Jun 2026 12:00:29 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=3"><![CDATA[뉴스/정보]]></category>
		</item>
				<item>
			<title><![CDATA[마크 첸 "여러분도 AGI가 곧 온다고 느끼고 있길 바란다"]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3624]]></link>
			<description><![CDATA[https://www.youtube.com/watch?v=fpAthTtha8c

“hopefully you feel like AGI is coming soon, right?”
<blockquote>“여러분도 AGI가 곧 온다고 느끼고 있길 바란다”</blockquote>
<h1>마크 첸 인터뷰 상세 정리</h1>
<h2>Leighton Space Cooking Series — OpenAI 연구, AGI, 스케일링, 평가, 연구 자동화</h2>
<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/5/202606/6a3dedf2c0b6c1167550.png" alt="" />

<hr />

<h2>1. 오프닝 — 연구자들에게 수프를 가져간 이야기</h2>
<strong>진행자:</strong>
오늘은 창업자와 연구자들을 초대해서 요리를 하며 이야기를 나누는 Leighton Space Cooking Series다. 오늘 특별 게스트는 OpenAI의 최고연구책임자 마크 첸이다. 와줘서 고맙다.

<strong>마크 첸:</strong>
초대해줘서 고맙다.

<strong>진행자:</strong>
이 이야기는 마크 저커버그가 연구자들을 영입하려고 수프를 만들었다는 이야기에서 시작됐다. 그 이야기를 듣고 당신도 연구자들에게 수프를 가져갔다고 들었다. 사실인가? 실제로 효과가 있었나?

<strong>마크 첸:</strong>
완전히 사실이다. 실제로 우리 연구자들에게 수프를 가져간 적이 있다. 그게 사람들을 조금 진정시킨 것 같다. 결국 우리가 이긴 것 같기도 하다. AI가 얼마나 미친 듯이 발전하고 있는지를 보여주는 꽤 웃긴 이야기다.

<strong>진행자:</strong>
요리를 자주 하나? 원래 요리에 익숙한 편인가?

<strong>마크 첸:</strong>
요리하는 걸 좋아하긴 한다. 하지만 자주 할 여유는 없다. 거의 매일 저녁 업무 관련 식사가 있다. AGI 이후에는 요리가 취미가 될 수도 있겠다. 예전부터 농담처럼 “모든 게 끝나면 국수 가게를 열겠다”고 말하곤 했다.

<strong>진행자:</strong>
오늘 앞에 놓인 재료를 보면 뭘 만들지 감이 오나?

<strong>마크 첸:</strong>
한국식 두부찌개 같은데?

<strong>진행자:</strong>
맞다. 당신이 연구자들에게 수프를 가져갔다는 이야기에서 착안해서 한국식 두부찌개를 만들고, 새우도 함께 요리할 예정이다. 준비됐나?

<strong>마크 첸:</strong>
좋다. 시작하자.

<hr />

<h2>2. 트레이더 출신과 AI 연구자의 공통점</h2>
<strong>진행자:</strong>
먼저 채소를 손질하자. 흙 묻은 부분을 잘라내고 나눠두면 된다. 그동안 당신의 배경에 대해 묻고 싶다. 당신은 예전에는 트레이더였다. 샘 알트먼도 예전에 “고빈도 트레이더라면 OpenAI에 와서 AGI를 만들라”는 식의 이야기를 한 적이 있다. 트레이더와 연구자 사이에 어떤 관련성이 있다고 보나? 아니면 단순히 둘 다 기술적이고 경쟁적인 분야이기 때문에 좋은 인재가 나오는 것인가?

<strong>마크 첸:</strong>
가장 중요한 것은 많은 연구자들이 반드시 머신러닝이나 AI 연구를 정식으로 전공하고 시작한 사람들이 아니라는 점이다. 우리는 사람들을 훈련시켜 이 분야에서 연구할 수 있게 만드는 것을 강하게 믿는다.

진짜 어려운 것은 창의적으로 문제를 해결하는 능력, 기존 틀 바깥에서 생각하는 능력이다. 박사 학위가 반드시 필요하다는 뜻은 아니다. 물론 박사 과정이 가치 있는 기술을 주는 것은 맞지만, 그것이 전부는 아니다.

트레이딩이라는 직업이 특별하다고까지 생각하지는 않는다. 우리는 훌륭한 수학자도 데려왔고, 훌륭한 물리학자도 데려왔다. 다만 트레이딩에는 독특한 점이 있다. 트레이딩은 현실을 속일 수 없는 분야다. 실제 세계를 상대로 매우 어려운 지표를 최적화해야 한다. 시장은 일종의 냉혹한 평가 기준이다.

또 트레이딩에서는 세부사항에 대한 집중이 정말 중요하다. 시스템에서 마지막 효율까지 짜내야 한다. 굉장히 어렵고 잔인한 최적화 문제를 다루는 일이 많다. 그런 특성 중 일부는 AI 연구에도 전이될 수 있다고 본다.

<hr />

<h2>3. 박사 학위 없이 AI 연구 감각을 기르는 방법</h2>
<strong>진행자:</strong>
박사 학위가 없는 사람이 AI 연구에 들어가고 싶다면 어떤 능력을 길러야 하나? 특히 research taste, 즉 연구 감각은 어떻게 기를 수 있나?

<strong>마크 첸:</strong>
연구 감각은 조금 과대평가되어 있다고 생각한다. 물론 개발해야 하는 능력이긴 하지만, 내가 찾은 가장 좋은 방법은 복제다.

좋아하는 논문을 골라서 완전히 재현해보는 것이다. 단순히 대충 구현하는 게 아니라, 논문에 나온 훈련 곡선까지 최대한 똑같이 맞춰보려고 해야 한다. 논문에서 암시하는 training loss나 perplexity 수준까지 도달하려고 해보면 정말 많은 것을 배운다.

2018년쯤을 떠올려보면 ResNet이나 PixelCNN 같은 것들이 있었다. 나는 그런 논문들을 복제하려고 하면서 정말 많이 배웠다. 사람들이 논문에 명시적으로 쓰지 않는 기술들이 있다. 몇 겹 더 깊게 파고들어야만 알 수 있는 실전적인 기법들이다.

나를 이 분야로 끌어들인 첫 계기 중 하나는 알파고와 이세돌의 대국이었다. 많은 사람들에게 전환점이었고, 나에게도 굉장히 영감을 줬다. 내가 처음 진지하게 시도한 큰 프로젝트 중 하나도 DQN을 제대로 작동시켜보는 것이었다.

<strong>진행자:</strong>
알파고의 37수 같은 장면은 정말 인상적이었다. 지금은 거의 모든 분야에서 그런 Move 37 같은 장면들이 나오는 것 같다. 수학에도 있고, 컴퓨터과학에도 있고, 코딩에도 있다.

<strong>마크 첸:</strong>
그렇다. 올해 초에 많은 사람들이 갑자기 깨달은 것 같다. “이제 에이전트가 내 직업 영역에서도 작동하고 있다”는 식으로 말이다. 모델들이 단순한 짧은 답변을 넘어, 긴 시간 동안 의미 있는 작업을 수행할 수 있다는 사실을 사람들이 체감하고 있다.

<hr />

<h2>4. RL이 잘 통하는 영역과 어려운 영역</h2>
<strong>진행자:</strong>
양파를 다져보자. 그리고 이와 관련해서 묻고 싶은 게 있다. RL이 뚫기 훨씬 어려운 직업이나 영역이 있을까? 예를 들어 코딩은 코드베이스나 작업 맥락이 비교적 접근 가능해서 더 쉬울 수 있다. 반면 주니어 컨설턴트가 하는 일처럼 맥락이 여기저기 흩어져 있는 업무는 더 어려울 수 있다. 이런 차이를 어떻게 보나?

<strong>마크 첸:</strong>
전통적으로 RL은 주관적인 영역에서 어려움을 겪어왔다. 어떤 것이 객관적으로 맞고 틀린지 평가하기 어려운 분야들이다.

예를 들어 창작 글쓰기를 생각해볼 수 있다. 두 개의 창작물을 놓고 두 명의 전문가에게 평가를 맡기면, 완전히 다른 의견이 나올 수 있다. 이렇게 평가가 어려운 분야에서는 RL을 직접적으로 적용하는 데 한계가 있다.

물론 많은 사람들이 이런 환경에서도 RL을 적용하기 위한 기술을 개발하고 있다. 하지만 현재로서는 차갑고 명확한 진실이 있는 영역, 예를 들어 수학이나 컴퓨터과학처럼 맞고 틀림이 분명한 곳에서 특히 잘 작동한다. 코드가 제대로 구현됐는지 아닌지, 수학 문제가 맞았는지 틀렸는지 판단할 수 있는 영역이다. 그런 곳에서 RL이 크게 발전하고 있다.

<hr />

<h2>5. 초인간 지능을 어떻게 평가할 것인가</h2>
<strong>진행자:</strong>
모델들이 훨씬 강해져서 IMO 문제 같은 것도 거의 포화할 정도로 풀게 되면, 초인간 지능은 어떻게 평가해야 하나? 인간 상위 0.1%가 할 수 있는 것까지 모델이 넘어서는 시점이 오면, 그다음 지능의 프런티어는 어떻게 밀어붙이나?

<strong>마크 첸:</strong>
정말 흥미로운 문제다. 많은 부분이 현실 세계와 어떻게 인터페이스하느냐에 달려 있다고 생각한다.

예전에는 프로그래밍 같은 맥락을 넘어서려면 실제 연구 세계로 옮겨야 한다고 봤다. 모델들이 실제 연구를 수행하게 하는 것이다. 우리는 모델들이 새로운 정리를 발견하거나, 어려운 과학의 최전선을 밀어붙이는 능력이 훨씬 좋아지는 것을 봐왔다.

이제는 모델들이 매우 어려운 문제를 풀 수 있다는 사실이 더 이상 놀랍지 않은 수준이 됐다. 모델들이 기여를 할 수 있고, 서로 다른 분야 사이에서 새롭고 통찰력 있는 관계를 찾아낼 수도 있다.

그래서 우리는 코딩 협업을 중요한 도메인으로 본다. 코딩은 모델이 높은 맥락을 이해하고, 실제 세계의 긴 시간축 작업을 수행할 수 있는지 시험하는 영역이다.

<strong>진행자:</strong>
그렇다면 코딩은 단순히 코드를 쓰는 문제가 아니라, 장기 작업과 높은 맥락 이해를 시험하는 도메인이라는 말인가?

<strong>마크 첸:</strong>
그렇다. 코딩 협업은 모델이 고맥락 환경에서 학습하고, 실제 세계에서 긴 시간 동안 의미 있는 작업을 수행할 수 있는지 보기 좋은 영역이다.

<hr />

<h2>6. “프리트레이닝은 죽었다”는 주장에 대한 반박</h2>
<strong>진행자:</strong>
연구에 대한 견해 중에서, 사람들이 일반적으로 받아들이지만 당신은 동의하지 않는 것이 있나? 예를 들어 “pre-training is dead”라든가, “언어모델만으로는 AGI에 도달할 수 없다” 같은 주장들이 있다.

<strong>마크 첸:</strong>
나는 지수 위에 올라타 있다는 생각, 그리고 스케일링 법칙을 강하게 믿는다. 그래서 그런 비관적인 주장에는 꽤 강하게 동의하지 않는다.

“프리트레이닝은 죽었다”는 이야기는 최근 1~2년 사이에 더 널리 퍼졌지만, 사실 LLM 개발 역사에서 사람들은 계속 그런 말을 해왔다. 항상 어떤 병목이 등장했고, 사람들은 “이 병목 때문에 더 이상 스케일할 수 없다”고 말했다.

하지만 우리는 늘 어떤 기술을 찾아냈다. 더 나은 엔지니어링일 때도 있었고, 새로운 연구 통찰일 때도 있었고, 더 나은 데이터 엔지니어링일 때도 있었다. 더 신중한 스케일링, 더 세심한 연구 엔지니어링을 통해 다음 경계를 넘어왔다.

거의 10자릿수 규모의 스케일 확장을 거치는 동안 이 패턴이 유지됐다. 앞으로도 계속 유지되지 않을 이유는 없다고 본다.

<hr />

<h2>7. reasoning과 o1 — 내부에서도 쉽지 않았던 큰 베팅</h2>
<strong>진행자:</strong>
초기에는 사람들이 안 될 거라고 생각했지만, 결국 스케일을 넘어서는 데 도움이 된 연구 아이디어가 있었나?

<strong>마크 첸:</strong>
reasoning이 가장 큰 예 중 하나다. 우리가 세상에 공개한 첫 큰 돌파구는 o1이었다. 하지만 그것을 시작하는 일은 쉽지 않았다.

당시에는 프리트레이닝과 포스트트레이닝의 조합이 너무나 유망해 보였다. OpenAI 안에서도 자연스럽게 이런 질문이 나왔다. “이미 잘 작동하는 기계가 있는데 왜 다른 것을 해야 하지?”

그럼에도 야쿱, 일리야, 그리고 이 분야에 확신과 비전을 가진 여러 사람들이 있었다. 그들이 진지하게 이 방향을 밀어붙였다. 그리고 그 후에도 회사 전체를 이 근본적인 베팅 뒤에 세우기 위해서는 꽤 많은 방향 조정이 필요했다.

<strong>진행자:</strong>
그런 큰 베팅을 연구자들에게 어떻게 설득하나? 어떤 베팅은 성공하고 어떤 베팅은 실패할 텐데, 팀이 계속 신뢰를 갖게 만드는 능력도 중요할 것 같다.

<strong>마크 첸:</strong>
OpenAI에서 멋진 점은 연구가 실력주의처럼 느껴진다는 것이다. 연구 매니저들은 대개 과거에 실제로 훌륭한 연구를 해낸 사람들이다.

그래서 위에서 방향을 제시하는 힘이 있다. 예를 들어 당신의 매니저가 “나는 이 방향이 앞으로의 길이라고 확신한다”고 말하면, 사람들은 그것을 무겁게 받아들인다. 오랫동안 그 사람의 연구 감각과 실행력을 존경해왔기 때문이다.

동시에 OpenAI에는 상향식 요소도 있다. 우리는 누군가가 와서 차가운 증거로 “당신들이 틀렸다”고 설득하는 것을 좋아한다. 실제로 그렇게 시작된 것들이 핵심 연구 로드맵의 일부가 된 경우도 많다. 위에서 누가 밀어붙인 게 아니라, 현장의 연구자가 강한 확신을 갖고 발견한 것이 핵심이 되기도 한다.

<hr />

<h2>8. 연구 로드맵은 얼마나 자주 바뀌는가</h2>
<strong>진행자:</strong>
최근 인터뷰에서 내부 연구 로드맵은 크게 바뀌지 않았다고 말한 적이 있다. 모델 발전도 빠르고 다른 회사들도 계속 좋아지고 있는데, OpenAI는 연구 로드맵을 얼마나 자주 재평가하나? 경쟁 모델이 나올 때마다 반응적으로 바꾸는 것은 아닐 것 같은데, 그 과정을 어떻게 생각하나?

<strong>마크 첸:</strong>
고수준 연구 로드맵은 안정적이어야 한다. 사람들은 자신들이 무엇을 만들고 있는지, 어떤 길을 가고 있는지 볼 수 있어야 한다. 나는 우리가 꽤 오랫동안 방향을 유지해온 것에 만족한다.

하지만 구현 세부사항은 시간이 지나면서 바뀔 수 있다. 순서도 중요하고, 상대적인 자원 배분도 중요하며, 현장에서 보이는 구체적인 위협들도 중요하다.

우리는 특정 시점마다 이런 것들을 다시 생각하게 된다. 예를 들어 컴퓨트 배분이 그렇다. 내 일의 한 부분은 프로젝트에 컴퓨트를 어떻게 배정할지 결정하는 것이다. 이때 우리는 정말 이 컴퓨트와 사람들을 가장 중요한 일에 쓰고 있는지 질문한다.

<strong>진행자:</strong>
고수준과 구현 세부사항의 차이를 조금 더 설명해줄 수 있나? 고수준이라는 것이 AGI라는 북극성 정도를 말하는 건가, 아니면 그보다 더 구체적인가?

<strong>마크 첸:</strong>
가장 높은 수준에서는 몇 가지 큰 축이 있다. 하나는 프리트레이닝이다. 모델에 많은 세계지식을 주는 것이다.

다음은 RL이다. 모델이 그 지식을 가지고 추론하도록, 작은 통찰들을 연결하도록 가르치는 것이다.

마지막으로 alignment와 post-training이 있다.

우리는 각 영역에서 메인라인을 어떻게 스케일할지 본다. 동시에 완전히 다른 스케일링 특성을 열어주거나, 더 공격적인 스케일링 특성을 가능하게 하는 새로운 베팅들도 찾는다.

<hr />

<h2>9. 300개 연구 프로젝트와 컴퓨트 배분</h2>
<strong>진행자:</strong>
1~2개월마다 300개 정도의 연구 프로젝트를 검토한다고 들었다. 어떤 아이디어를 계속 밀고, 어떤 것을 포기할지 결정하는 감각은 어떻게 다듬나? 재능 있는 연구자들이 가능한 아이디어를 많이 제안할 텐데 말이다.

<strong>마크 첸:</strong>
집중이 중요하다. OpenAI에서는 베팅을 더 집중하려고 하고 있고, 컴퓨트 배분도 조금 더 지시적으로 하려 한다.

하지만 나는 매니저들을 미세관리하고 싶지는 않다. 중요한 것은 그들에게 권한을 주는 것이다. 우리가 만들고 싶은 큰 베팅에는 큰 컴퓨트 덩어리를 배정한다. 동시에 매니저들이 자유롭게 쓸 수 있는 유연한 컴퓨트 풀도 준다. 그들이 믿는 것에 자유롭게 배정하거나, 우리가 제안한 배분을 조정할 수 있게 한다.

각 조직에서 3~5개 정도의 소수 베팅을 메인 연구 로드맵에 묶고, 그다음은 매니저와 조직 리드들이 이어서 실행하게 하는 방식이다.

<hr />

<h2>10. 좋은 연구자를 알아보는 법</h2>
<strong>진행자:</strong>
신진 연구자를 면접할 때, 이 사람이 앞으로 조직에 큰 영향을 줄 수 있는 연구자인지 알아보는 신호가 있나? 이전 연구 실적을 주로 보는가?

<strong>마크 첸:</strong>
OpenAI에 오기 전에는 정말 어려운 문제다. 좋은 연구 매니저들은 많은 연구자들과 일하면서 직감을 개발한다. 그 사람이 말하는 것, 떠올리는 아이디어가 내가 생각했을 법한 것과 같은 결인지 보는 것이다. 일종의 gut check다.

하지만 처음부터 알아보기는 어렵다. 보통 6개월에서 1년 정도 함께 일해보면, 누가 가장 강한 성장 궤도에 있고 큰 임팩트를 낼지 꽤 명확해진다.

또 하나 말하고 싶은 것은 모든 연구자가 같은 방식으로 기여하지 않는다는 점이다. 어떤 연구자는 명확한 아이디어를 누구보다 빨리 구현한다. 또 어떤 연구자는 처음에는 거의 너무 미친 것처럼 보이는 moonshot 아이디어를 낸다. 그런데 그 아이디어가 사실 그렇게 미친 것이 아니고, 세상을 전혀 다른 방식으로 보게 만든다.

연구에서 임팩트를 내는 방식은 여러 가지다.

<strong>진행자:</strong>
그렇다면 탑 엔지니어와 탑 연구자 사이에는 공통점이 있다고 보나? 예를 들어 스타트업의 뛰어난 엔지니어는 제품을 끝까지 가져가는 능력이 있다. 연구자는 고객이 어떻게 사용할지까지 생각하는가, 아니면 순수하게 연구 자체에 집중하는가?

<strong>마크 첸:</strong>
연구에서는 앞으로 나아갈 길이 명확하지 않은 경우가 많다. 연구자를 구분하는 것은 얼마나 자주 올바른 방향을 향해 있느냐다.

엔지니어링에는 어느 정도 통하는 패턴들이 있다. 어떤 제품을 만들고 싶다면, 적용되는 엔지니어링 원칙들이 꽤 비슷할 수 있다. 하지만 연구에서는 조금 다르다. 좋은 연구 감각이 필요하고, 자신이 하는 일이 유망하다는 것을 다른 사람들에게 설득할 수 있어야 한다. 그리고 그것을 핵심 연구 로드맵 안으로 통합할 수 있어야 한다.

<hr />

<h2>11. 평가와 벤치마크 — benchmark maxing 문제</h2>
<strong>진행자:</strong>
채소는 거의 다 됐고, 이제 물을 넣고 찌개 베이스를 만들자. 한편으로 evals가 매우 흥미로운 영역인 것 같다. 내부적으로 vibe check를 해보면 정말 좋은데 실제 벤치마크에서는 낮게 나오거나, 반대로 벤치마크는 좋은데 실제 코딩 작업을 시켜보면 별로인 경우가 있나?

<strong>마크 첸:</strong>
그런 현상이 있다. 내부에서 쓰는 표현인지는 모르겠지만, benchmark maxing 같은 현상이 있다. 특정 분포에 과적합하는 것이다.

예를 들어 어떤 벤치마크가 있으면, 그 벤치마크와 매우 비슷한 유형의 인스턴스를 찾아 과도하게 훈련할 수 있다. 그러면 그 점수는 좋아질 수 있지만, 실제 일반화 성능을 제대로 반영하지 못한다.

더 무서운 것은 업계 전체에서 표준으로 삼을 수 있는 고품질 벤치마크 수가 적다는 점이다. 우리는 일종의 evals crisis, 평가 위기 속에 있다. 예전에 우리가 자라면서 보던 SAT 같은 평가들은 이미 모두 포화됐다. 모델을 평가할 새로운 좋은 방법이 필요하다.

Codex 같은 도구의 좋은 점은 eval을 빠르게 반복해서 만들 수 있게 해준다는 것이다. 한 사람이 빠르게 꽤 좋은 품질의 eval을 만들 수 있다.

또 모델을 실제로 배포하면 사람들이 어떻게 쓰는지를 보면서 평가할 수도 있다. 수학, 코딩, 소프트웨어 작업에서 모델이 어디에서 넘어지는지, 어느 정도 길이의 작업까지 해낼 수 있는지 넓은 배포 데이터를 통해 감을 잡을 수 있다.

<strong>진행자:</strong>
그렇다면 벤치마크를 잘하는 것과 benchmark maxing을 피하는 것 사이의 균형은 어떻게 맞추나? 소비자는 경쟁사 모델보다 점수가 낮으면 “이 모델은 별로인가?”라고 생각할 수도 있다.

<strong>마크 첸:</strong>
대표성 있는 eval들의 혼합을 운영해야 한다. 그리고 항상 새로운 eval을 만드는 데 투자해야 한다.

어떤 eval이 세상에 공개되면, 그 순간부터 이미 좋은 eval로서의 가치는 낮아진다는 철학도 있다.

또 외부 조직과 협력해 eval을 만드는 것도 중요하다. 어려운 수학이나 과학 eval에서는 외부 조직과 협력해서 일종의 gold standard를 만들기도 했다.

흥미로운 원칙 중 하나는 eval을 만드는 팀과 모델을 최적화하는 팀을 분리하는 것이다. 그래야 인센티브가 꼬이지 않는다. eval 팀은 모델에게 어려운 평가를 만들려고 한다. 일종의 적대적 과정이 된다. 그러면 스스로를 속이지 않게 되고, 두 팀 사이의 인센티브가 더 건강하게 맞춰진다.

<strong>진행자:</strong>
당신도 어떤 eval을 만들어야 하는지, 어떤 외부 조직과 협력해야 하는지 결정하는 데 관여하나?

<strong>마크 첸:</strong>
그렇다. 야쿱과 내가 하는 일 중 많은 부분은 eval 방향을 잡는 것이기도 하다. 우리는 어떤 능력의 빈틈을 발견한다. 그리고 모든 능력의 반대편에는 eval이 있다. 어떤 능력을 잘 끌어냈는지 측정하려면 평가가 필요하다.

eval 방향을 잡고 모두를 같은 페이지에 올려놓는 것도 많은 준비가 필요한 일이다.

<hr />

<h2>12. 야쿱과의 농담 — “멍청한 금메달리스트 군단”</h2>
<strong>진행자:</strong>
예전 인터뷰에서 야쿱이 아주 웃긴 사람이라고 말한 적이 있다. 같이 일하면서 재미있는 이야기가 있나? 당신과 야쿱은 연구 논의에서도 매우 잘 맞는다고 했는데, 그런 면에서 기억나는 게 있나?

<strong>마크 첸:</strong>
어제 그가 한 농담이 재미있었다. 우리는 여러 면에서 연구 조직을 함께 관리한다. 어떤 연구자가 야쿱에게 와서 “이제 저는 정말 멍청한 IMO 금메달리스트 군단을 가진 느낌입니다”라고 말한 것 같다.

그러자 야쿱이 “그건 이미 내가 현실에서 처한 상황 같은데”라고 했다.

그는 정말 잔인할 정도로 냉소적이고 웃기다.

<strong>진행자:</strong>
중요한 프런티어를 밀어붙이는 일을 하다 보면, 그런 유머가 직장 안에 있는 것도 중요할 것 같다.

<hr />

<h2>13. 모델의 들쭉날쭉한 능력과 jagged frontier</h2>
<strong>진행자:</strong>
모델이 IMO나 ILI 같은 어려운 문제는 아주 잘 풀면서, 인간이 쉽게 하는 평범한 일에는 어려움을 겪는 이상한 상황이 있다. 이런 문제는 어떻게 보나?

<strong>마크 첸:</strong>
궁극적으로 모델에게 직관적인 것과 인간에게 직관적인 것이 다르다고 생각한다. jagged frontier라는 비유가 많이 쓰인다. 모델은 어떤 것들에는 굉장히 뛰어나다. 데이터에서 많이 봤거나, 우리가 더 쉽게 가르칠 수 있는 것들이다.

하지만 인간에게 쉬운 것들이 모델에게는 어려울 수 있다. 많은 부분은 맥락의 문제라고 생각한다. 모델은 인간이 가진 많은 맥락을 갖고 있지 않다.

시각 같은 것은 인간에게 생물학적으로 매우 자연스럽게 연결된 능력이다. 그래서 모델과 인간은 각자 잘하는 능력이 다르다.

또 중요한 것은 하나의 작업에서 교훈을 얻고, 그것을 미래의 작업에 적용하는 능력이다. 이 능력은 인간에게 매우 자연스럽지만, 모델에서는 아직 많은 사람들이 연구하고 있는 영역이다.

<hr />

<h2>14. 긴 컨텍스트와 context rot</h2>
<strong>진행자:</strong>
맥락 문제와 관련해, 많은 사람들이 가장 낮은 과일처럼 말하는 해결책이 context window를 늘리는 것이다. 더 많은 예시와 더 많은 맥락을 주면 모델이 잘할 수 있다는 생각이다. 하지만 context window가 커져도 bloat가 생기거나 context rot 문제가 생길 수 있다. 어떻게 보나?

<strong>마크 첸:</strong>
긴 시간축의 학습을 해결하는 표준적인 방식은 단순히 context window를 늘리는 것이다. 그 자체는 타당하다.

하지만 long context를 구현하는 것과 long context를 잘 구현하는 것은 다르다. needle in the haystack 스타일의 테스트들이 그런 차이를 측정하는 데 쓰인다.

그 외에도 엔지니어링과 연구 측면의 shortcut들이 있다. 예를 들어 많은 코딩 제품에는 compaction 같은 기능이 있다. 작업 상태나 통찰을 압축하는 것이다. 이런 방식은 순수한 native long context만으로 해결하려면 매우 어렵고 비싼 기본 기능들을 우회할 수 있게 해준다.

<hr />

<h2>15. AGI 직전의 연구 베팅과 self-sustained research</h2>
<strong>진행자:</strong>
연구 아이디어와 관련해서, 아직 low-hanging fruit가 많이 남아 있다고 보나? 아니면 이제는 완전히 새로운 베팅이 필요하다고 보나?

<strong>마크 첸:</strong>
새로운 베팅은 있지만, 아마 그렇게 많지는 않을 것이다. 어떤 의미에서는 AGI가 곧 온다고 느끼길 바란다. 모두가 모델들이 점점 매우 유능해지고 있다는 것을 보고 있다.

그 의미를 진지하게 생각하면, 우리는 모델들이 스스로 더 많은 혁신을 만들어낼 수 있는 세계에 가까워지고 있다. 모델들이 self-sustained research, 즉 자기 지속적인 연구를 할 수 있게 되는 것이 우리 연구 조직의 큰 목표 중 하나다.

그래서 정말 중요한 질문은 그 시점이 오기 전에 의미 있는 큰 베팅이 남아 있느냐는 것이다. 나는 그 창문이 작다고 생각한다. 하지만 아직 꽤 중요한 아이디어들을 실험하고 있다.

<strong>진행자:</strong>
어떤 연구자들은 AGI에 도달하려면 continual learning 같은 두세 개의 추가 돌파구가 필요하다고 말한다. 당신도 그런 관점인가? 아니면 완전히 다른 패러다임 몇 개가 반드시 필요한 것은 아니라고 보나?

<strong>마크 첸:</strong>
그런 프레이밍이 맞는지는 잘 모르겠다. continual learning이 반드시 unlock해야 할 기본 primitive라고 볼 수 있는지도 모르겠다. 여러 가지 기법들이 있다. 무엇을 breakthrough라고 부를지도 애매하다.

우리는 다양한 시도를 하고 있다. 그리고 많은 shots on goal이 있다고 본다. 나는 꽤 잘 될 것이라고 생각한다.

<hr />

<h2>16. 멀티모달 모델은 하나의 모델이어야 하는가</h2>
<strong>진행자:</strong>
요리와 대화를 동시에 하는 걸 보면, 모델도 이런 멀티태스킹을 더 잘해야 할 것 같다. 이미지, 오디오, 비디오, 텍스트가 모두 하나의 모델 아래 있어야 한다고 보나? 아니면 특정 모달리티에 특화된 모델들이 따로 발전할 것이라고 보나?

<strong>마크 첸:</strong>
연구소 입장에서는 하나로 묶는 데 많은 장점이 있다. 예를 들어 하나의 인프라 스택만 유지하면 된다. 여러 인프라 스택을 동시에 유지하고 스케일하는 비용은 과소평가하면 안 된다.

핵심 스택에서 어떤 근본적인 연구를 하면, 그것이 어떤 모달리티든, 어떤 기능이든 이어질 수 있다. 그래서 우리는 가능한 한 적은 수의 아키텍처 안에 유지하려는 강한 편향을 갖고 있다.

<strong>진행자:</strong>
아키텍처 자체가 얼마나 중요한지 사람들이 자주 간과하는 것 같다.

<strong>마크 첸:</strong>
그렇다.

<hr />

<h2>17. vibe researcher와 연구의 미래</h2>
<strong>진행자:</strong>
요즘 vibe coder라는 말이 있고, 당신도 vibe researcher라는 표현을 언급한 적이 있다. vibe researcher의 최종 형태는 무엇이라고 보나? 핵심 가치는 좋은 연구 아이디어를 떠올리는 taste인가, 아니면 실제 연구를 끝까지 실행하는 능력인가?

<strong>마크 첸:</strong>
우리는 이미 그 세계로 매우 빠르게 이동하고 있다. OpenAI뿐 아니라 다른 연구소에서도 많은 작업이 점점 orchestration 중심이 되고 있다.

연구자는 아이디어를 떠올린다. 그리고 모델이 충분히 좋아지면 구현과 실행을 스스로 할 수 있다.

아이디어를 내는 것과 실행하는 것, 둘 다 여전히 중요하다. 하지만 무게중심은 많은 아이디어를 떠올리고, 모델이 실행과 오케스트레이션을 맡는 방향으로 이동하고 있다. 이것이 연구의 미래가 될 것이라고 본다.

다만 앞서 말했듯이 모델은 아직 연구 감각을 완전히 갖고 있지는 않다. 그래서 여전히 연구자가 아이디어를 내야 한다. 모델에게 좋은 taste를 가르치는 것은 어려운 일이다. 하지만 연구를 가속하는 데는 이미 분명한 이점이 있다.

<strong>진행자:</strong>
모델이 언젠가는 research taste에서도 인간과 동등해질까?

<strong>마크 첸:</strong>
그렇다고 본다. 우리의 3년 로드맵을 보면, 최종 목표는 모델들이 end-to-end 연구를 수행하는 것이다. 그 문제의 일부는 모델이 좋은 taste를 갖는 것이다.

어떤 일반적인 benchmark나 문제를 던져도, 모델이 올바른 해결책을 찾아낼 수 있는 상태를 원한다.

<hr />

<h2>18. 실패한 연구 베팅을 어떻게 다루는가</h2>
<strong>진행자:</strong>
OpenAI에서 인간 연구자들이 진행한 연구 베팅이 잘 안 됐을 때, postmortem 과정은 어떻게 하나? 많은 베팅 중 일부는 실패할 수밖에 없지 않나?

<strong>마크 첸:</strong>
그 부분이 OpenAI의 alpha 중 큰 부분이라고 생각한다. OpenAI가 다른 연구소와 다른 점 중 하나는 고위험 베팅을 많이 한다는 것이다. 그것이 우리가 오랫동안 프런티어에 머물 수 있었던 이유다.

하지만 고위험 베팅을 많이 한다는 것은 일부 베팅이 실패한다는 뜻이기도 하다. 실패했을 때 어려운 점은 스스로를 속이지 않는 것이다. “이건 언젠가 될 거야”라고 계속 믿으면서 붙잡고 있으면 안 된다. 필요하면 끊어내야 한다.

어떤 시점에는 돌아보고 판단해야 한다. “이건 당시에는 유망한 아이디어였지만 실제로는 생각보다 덜 중요했다”, “다른 접근법이 더 잘 작동한다”, “우리가 뭔가를 발견했지만 이 방향은 핵심이 아니다” 같은 식으로 말이다.

하지만 그런 작업도 많은 경우 유익하다. 어떤 기법을 증명하는 데 실패했더라도, 그 write-up은 중요할 수 있다. 사람들이 자연스럽게 떠올릴 법한 아이디어라면, 실패 기록은 다른 사람들이 같은 길을 다시 가지 않게 막아준다.

<strong>진행자:</strong>
실패를 긍정적으로 보는 것과, 계속 실패만 하는 연구자를 어떻게 구분하나? 어떤 연구자가 연속해서 베팅을 하지만 아무것도 성공하지 못한다면, 어느 시점에는 실제 기여가 필요하지 않나?

<strong>마크 첸:</strong>
경험상 그런 경우를 본 적이 있다. 하지만 동시에 어떤 사람들은 계속 베팅이 실패하다가, 거의 좌절하려는 순간에 엄청난 mega hit를 내기도 했다. 그런 일이 충분히 여러 번 있었다.

그래서 중요한 것은 아이디어 자체가 sound한가다. 야심적일 수는 있다. 하지만 말이 되어야 한다. 어떤 사람들은 위험한 프런티어에 있는 아이디어를 계속 낸다. 그런 경우에는 가끔 한 번만 맞혀도 충분히 가치가 있다.

트레이딩적인 관점일 수도 있지만, 결국 기대값의 문제다. 장기적으로 가치를 더해야 한다.

<hr />

<h2>19. 요리 마무리와 프리트레이닝에 대한 마지막 견해</h2>
<strong>진행자:</strong>
이제 거의 완성됐다. 간을 보고 싱거우면 간장을 넣고, 너무 짜면 물을 넣으면 된다. 맛이 어떤가?

<strong>마크 첸:</strong>
꽤 좋다.

<strong>진행자:</strong>
오늘 요리는 어땠나?

<strong>마크 첸:</strong>
이건 일종의 student distillation 같다. 당신이 이제 나보다 훨씬 잘한다.

<strong>진행자:</strong>
아니다. 당신도 잘했다. 특히 새우에 불 붙이는 것도 잘했다. 마지막으로, 지금 연구에서 과대평가된 것과 과소평가된 것이 있다면 무엇이라고 보나?

<strong>마크 첸:</strong>
아직도 “프리트레이닝은 죽었다”고 보는 사람이 있다면, 나는 프리트레이닝이 과소평가됐다고 생각한다. 프리트레이닝은 죽지 않았다.

<hr />

<h1>전체 흐름을 대담식으로 짧게 다시 압축하면</h1>
<strong>진행자:</strong>
OpenAI 연구자들에게 수프를 가져갔다는 이야기는 사실인가?

<strong>마크 첸:</strong>
사실이다. 연구자들을 진정시키는 데 도움이 됐던 것 같다. AI 업계가 얼마나 이상하고 치열하게 돌아가는지 보여주는 웃긴 장면이다.

<strong>진행자:</strong>
트레이더 출신이라는 배경은 AI 연구와 연결되는가?

<strong>마크 첸:</strong>
트레이딩은 현실을 속일 수 없는 분야다. 매우 냉혹한 지표를 최적화해야 하고, 디테일과 시스템 최적화 능력이 중요하다. 그런 점은 AI 연구와 어느 정도 통한다.

<strong>진행자:</strong>
박사 학위 없이 연구자가 되려면 어떻게 해야 하나?

<strong>마크 첸:</strong>
좋은 논문을 완전히 복제해보는 것이 가장 좋다. 훈련 곡선과 손실값까지 맞추려 하면, 논문에 명시되지 않은 실전 기술들을 배우게 된다.

<strong>진행자:</strong>
RL은 어떤 영역에서 잘 통하고, 어떤 영역에서 어렵나?

<strong>마크 첸:</strong>
수학과 코딩처럼 정답이 명확한 영역에서는 잘 통한다. 반면 창작 글쓰기처럼 평가가 주관적인 영역은 훨씬 어렵다.

<strong>진행자:</strong>
초인간 모델은 어떻게 평가해야 하나?

<strong>마크 첸:</strong>
현실 세계와 접속하는 방식이 중요하다. 실제 연구, 코딩 협업, 긴 시간축의 작업 수행 능력이 중요해진다.

<strong>진행자:</strong>
“프리트레이닝은 죽었다”는 말에 동의하나?

<strong>마크 첸:</strong>
동의하지 않는다. 스케일링 법칙은 여전히 강력하다고 본다. 사람들은 계속 병목을 말했지만, 우리는 더 나은 엔지니어링과 연구로 그 병목을 넘어왔다.

<strong>진행자:</strong>
reasoning은 OpenAI 내부에서 당연한 방향이었나?

<strong>마크 첸:</strong>
아니다. 당시에는 프리트레이닝과 포스트트레이닝 조합이 매우 잘 작동하고 있었기 때문에, reasoning은 내부 설득이 필요한 큰 베팅이었다.

<strong>진행자:</strong>
OpenAI의 연구 로드맵은 자주 바뀌나?

<strong>마크 첸:</strong>
고수준 로드맵은 안정적이어야 한다. 큰 축은 프리트레이닝, RL, alignment/post-training이다. 다만 구현 세부사항과 컴퓨트 배분은 계속 조정한다.

<strong>진행자:</strong>
좋은 연구자는 어떻게 알아보나?

<strong>마크 첸:</strong>
처음부터 알기는 어렵다. 보통 6개월에서 1년 정도 함께 일해보면 드러난다. 연구자는 여러 유형이 있다. 빠르게 구현하는 사람도 있고, moonshot 아이디어로 세계관을 바꾸는 사람도 있다.

<strong>진행자:</strong>
AI 평가에는 어떤 문제가 있나?

<strong>마크 첸:</strong>
업계는 평가 위기에 있다. 좋은 표준 벤치마크가 부족하고, 공개 벤치마크에는 과적합할 위험이 있다. eval을 만드는 팀과 모델을 최적화하는 팀을 분리하는 것이 중요하다.

<strong>진행자:</strong>
모델이 어려운 수학은 잘하는데 쉬운 일은 못하는 이유는?

<strong>마크 첸:</strong>
모델과 인간이 직관적으로 잘하는 것이 다르다. 모델은 특정 영역에서는 강하지만, 인간이 가진 맥락이나 시각적 경험, 작업 간 학습 능력은 아직 부족하다.

<strong>진행자:</strong>
긴 컨텍스트를 키우면 해결되나?

<strong>마크 첸:</strong>
context window를 키우는 것은 한 방법이지만, long context를 구현하는 것과 잘 쓰는 것은 다르다. compaction처럼 작업 상태와 통찰을 압축하는 방식도 중요하다.

<strong>진행자:</strong>
AGI 전에 아직 중요한 연구 베팅이 남아 있나?

<strong>마크 첸:</strong>
창문은 작지만 남아 있다. 우리는 모델이 self-sustained research를 할 수 있는 세계에 가까워지고 있다.

<strong>진행자:</strong>
멀티모달 모델은 하나의 모델이어야 하나?

<strong>마크 첸:</strong>
연구소 입장에서는 가능한 한 하나의 인프라와 적은 수의 아키텍처로 유지하는 데 장점이 크다.

<strong>진행자:</strong>
vibe researcher의 미래는 무엇인가?

<strong>마크 첸:</strong>
연구는 점점 orchestration 중심이 되고 있다. 인간은 아이디어와 방향을 제시하고, 모델은 구현과 실행을 맡게 된다. 최종적으로는 모델이 end-to-end 연구를 수행하는 것이 목표다.

<strong>진행자:</strong>
실패한 연구 베팅은 어떻게 다루나?

<strong>마크 첸:</strong>
스스로를 속이지 말고 필요하면 끊어내야 한다. 하지만 실패 기록도 중요하다. 다른 사람들이 같은 실수를 반복하지 않게 해준다.

<strong>진행자:</strong>
마지막으로, 과소평가된 연구 영역은?

<strong>마크 첸:</strong>
프리트레이닝이다. 프리트레이닝은 죽지 않았다.]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Fri, 26 Jun 2026 12:11:49 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=5"><![CDATA[인터뷰]]></category>
		</item>
				<item>
			<title><![CDATA[GPT-5.6 소수의 파트너들에게만 제한적으로 먼저 공개]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3623]]></link>
			<description><![CDATA[<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/1/202606/6a3db7693c74a8517495.png" alt="" />

<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/1/202606/6a3db756b93d48246722.png" alt="" />

 

<hr />

최첨단 신규 AI 모델을 출시하기 직전인 AI 기업들 사이에서는, 최근 몇 주 동안 트럼프 행정부와 앤트로픽(Anthropic) 간의 긴장된 대치 이후 새로운 관행이 자리 잡고 있다.

예를 들어 수요일, OpenAI CEO 샘 알트먼은 사내 Q&amp;A 세션에서 회사의 최신 모델인 <strong>GPT-5.6</strong>을 소수의 파트너들에게만 제한적으로 먼저 공개(preview)할 것이라고 직원들에게 밝혔다. 이는 해당 사안을 잘 아는 두 명의 관계자에 따르면 사실이다.

OpenAI의 가장 큰 경쟁사인 Anthropic도 지난 4월 비슷한 방식을 택했다. Anthropic은 강력한 사이버보안 기능을 갖춘 새로운 모델 <strong>Mythos</strong>를 일반에 공개하지 않고, 선별된 파트너들에게만 먼저 제공했다.

이처럼 단계적으로 출시하는 이유에 대해 알트먼은 <strong>연방정부의 요청 때문</strong>이라고 설명했다. 관계자 중 한 명에 따르면, 알트먼은 이러한 방식이 가능한 한 빨리 모델을 널리 배포하기 위한 최선의 방법이라고 말했다.

또한 목요일 직원들에게 보낸 메모에서 알트먼은, GPT-5.6의 프리뷰 기간 동안에는 <strong>정부가 고객 한 곳 한 곳을 개별적으로 승인하여 접근 권한을 부여할 것</strong>이라고 밝혔다.

<hr />

<h3>핵심 내용 요약</h3>
<ul>
 	<li><strong>GPT-5.6은 처음부터 일반 공개되지 않는다.</strong></li>
 	<li><strong>소수의 승인된 파트너만 먼저 사용할 수 있는 제한적 프리뷰 형태로 출시된다.</strong></li>
 	<li>이는 <strong>트럼프 행정부의 요청</strong>에 따른 조치라고 샘 알트먼이 직원들에게 설명했다.</li>
 	<li><strong>Anthropic도 Mythos 모델을 같은 방식으로 출시</strong>했으며, 일반 공개 대신 선별된 파트너들에게만 제공했다.</li>
 	<li>프리뷰 기간에는 <strong>미국 정부가 고객별로 접근을 승인</strong>하는 절차를 거친다.</li>
</ul>
즉, 미국의 최첨단 AI 모델들은 앞으로 <strong>"선별된 기관·기업 → 정부 승인 → 이후 일반 공개"</strong>라는 단계적 출시가 새로운 표준으로 자리 잡고 있다는 내용입니다.]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Fri, 26 Jun 2026 08:19:24 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=1"><![CDATA[자유게시판]]></category>
		</item>
				<item>
			<title><![CDATA[gpt-5.6 preview]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3622]]></link>
			<description><![CDATA[<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/1/202606/6a3d09b965cd29439005.jpg" alt="" />]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Thu, 25 Jun 2026 19:58:03 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=1"><![CDATA[자유게시판]]></category>
		</item>
				<item>
			<title><![CDATA[데미스 하사비스 Semafor Tech 인터뷰]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3621]]></link>
			<description><![CDATA[https://www.youtube.com/watch?v=hb9JPW_DkpQ

<hr />

<h2>데미스 하사비스 인터뷰 상세 정리</h2>
<h3>1. AGI로 가는 길: 텍스트 모델만으로 충분한가, 멀티모달이 필요한가?</h3>
<strong>인터뷰어:</strong>
요즘 모두가 AI 때문에 긴장하고 있다. 워싱턴 DC에서는 AI 모델을 금지하려는 움직임도 있고, 특히 텍스트 기반 모델이 소프트웨어를 만들거나 컴퓨터 취약점을 찾아내는 능력에 대한 우려가 크다.
AGI로 가는 길이 이런 텍스트 기반 모델, 예를 들어 스스로 개선될 수도 있는 모델들을 통해 열린다고 보는가? 아니면 Gemini에서 하는 것처럼 여전히 멀티모달 접근이 필요하다고 보는가?

<strong>데미스 하사비스:</strong>
그 질문 안에 풀어야 할 내용이 많다. 먼저 사이버 문제부터 말하자면, 나는 오래전부터 AGI에 가까워질수록 더 체계적인 접근이 필요하다고 말해왔다. 지금 우리는 거의 AGI 문턱에 와 있다고 본다. 내가 예전에 “우리는 특이점의 산기슭에 있다”고 말한 것도 그런 의미다.

AI에는 엄청난 기회가 있다. 질병을 해결하고, 새로운 에너지원을 찾고, 과학 문제를 푸는 것들이 바로 내가 평생 AI를 해온 이유다. 하지만 동시에 위험도 있다. 사이버 위험은 그중 하나일 뿐이고, 사실 인류에게는 일종의 경고탄이라고 생각한다. 앞으로 몇 년 안에 생물학, 핵, 다른 종류의 더 심각한 위험들이 나타날 수 있다.

그래서 최신 프런티어 AI 시스템을 체계적으로 테스트하고, 안전장치가 충분한지 확인할 수 있는 표준 기관 같은 것이 필요하다고 본다. 이상적으로는 국제적인 성격을 가진 기관이면 좋다.

기술적으로 AGI에 도달하는 방식에 대해서는, 우리는 늘 가장 넓고 깊은 연구 포트폴리오를 가져왔다. 지난 10년 동안 현대 AI 산업의 기반이 된 큰 돌파구 중 상당수, 아마 90% 이상이 Google Brain이나 DeepMind에서 나왔다고 본다. Transformer도 그렇고, AlphaGo와 강화학습의 초기 개척도 그렇다.

그래서 우리의 전략은 하나에만 베팅하는 것이 아니라 여러 방향을 동시에 밀어붙이는 것이다. 스케일링 연구도 하고, Gemini 같은 멀티모달 기반 모델도 하고, 코딩 능력도 강화하고 있다. 동시에 이미지·비디오·음악 같은 생성 미디어 모델도 중요하게 본다. 이런 모델들이 세계와 주변 맥락을 이해하는 데 필요하기 때문이다.

결국 완전한 AGI 시스템이 되려면 물리 세계를 이해할 수 있어야 한다. 특히 로보틱스나 스마트 안경 기반 AI 비서 같은 응용을 생각하면, 현실 세계에 대한 이해는 필수다.

<hr />

<h3>2. DeepMind와 Google은 여전히 AGI 경쟁에서 인재 우위를 갖고 있는가?</h3>
<strong>인터뷰어:</strong>
DeepMind를 처음 시작했을 때는 AI 프런티어에서 매우 앞서 있었다. Google에 합류했을 때는 DeepMind와 Google이 AI 인재 대부분을 한 지붕 아래 가진 것처럼 보였다.
하지만 이제는 적어도 세 개 이상의 주요 경쟁자가 프런티어에 있고, 모두 최고의 인재를 확보하려고 한다. 지금 DeepMind는 AGI 경쟁에서 이길 만큼 충분한 인재를 갖고 있다고 보는가?

<strong>데미스 하사비스:</strong>
주요 연구소들 사이에서 인재 이동이 많은 것은 사실이다. 우리도 최상위 인재 확보 경쟁에서 충분히 이기고 있다. 다만 내가 강조하고 싶은 점은, 우리는 여전히 다른 어떤 연구소보다도 훨씬 크고 넓은 연구진을 갖고 있다는 것이다.

우리는 지금도 파운데이션 모델뿐 아니라, 나중에 파운데이션 모델에 통합될 수 있는 다른 모델들, 예를 들어 생성 미디어 모델 같은 영역에서도 프런티어 연구를 계속 내놓고 있다.

물론 지금 AI 인재 시장은 엄청나게 치열하다. 아마 기술 산업 역사상 가장 치열한 경쟁일 것이다. 하지만 돌이켜보면 이것은 어느 정도 불가피했다. 2010년에 DeepMind를 시작했을 때만 해도 업계에서는 AI를 진지하게 하는 사람이 거의 없었다. 학계에서도 AI를 하는 것은 커리어 자살처럼 여겨졌다. “90년대에 해봤는데 안 됐다, 막다른 길이다”라는 분위기가 강했다.

하지만 우리는 소수의 팀으로, 올바른 아이디어와 학습 시스템, 강화학습, 신경망에 베팅하면 빠른 진전이 가능하다고 믿었다. 결국 그 판단이 맞았다. 그리고 최근 몇 년 사이 전 세계가 AI의 잠재력을 깨달았다. 이제는 모든 중요한 기업이 AI에 뛰어들 수밖에 없는 상황이 되었다.

<hr />

<h3>3. 생성형 미디어 도구는 1년 전과 무엇이 달라졌는가?</h3>
<strong>인터뷰어:</strong>
우리는 지금 칸 광고 컨퍼런스에 와 있다. 여기에는 창의적인 일을 하는 사람들이 많고, 아마 이들 중 상당수가 당신들의 비디오 생성 도구를 광고나 창작 작업에 쓰고 있을 것이다.
지금의 도구들은 1년 전에는 할 수 없었던 무엇을 할 수 있게 되었나?

<strong>데미스 하사비스:</strong>
이 도구들과 그 기반 모델들은 매달 엄청나게 개선되고 있다. 1년 전과 비교해 가장 큰 변화는, 생성 결과물을 더 세밀하게 조정하고 편집할 수 있게 되었다는 점이다.

창작 과정에서는 첫 아이디어나 첫 콘셉트를 만든 뒤, 그중 마음에 드는 부분도 있고 마음에 들지 않는 부분도 있다. 예전에는 일부만 바꾸고 싶어도 전체를 다시 생성해야 했다. 하지만 이제는 자연어로 디자이너에게 말하듯이 “이 부분은 그대로 두고, 저 부분만 바꿔줘”라고 지시할 수 있다. 그리고 그런 과정을 수십 번, 수백 번 반복하면서 최종적으로 원하는 수준까지 다듬을 수 있다.

이런 세밀한 제어 능력이 지난 1년 사이 큰 변화였고, 동시에 전반적인 품질도 계속 향상되고 있다.

<hr />

<h3>4. AI로 만든 콘텐츠는 공개해야 하는가? 딥페이크와 워터마킹 문제</h3>
<strong>인터뷰어:</strong>
광고 업계 안에서도 논란이 있다. 어떤 작품이 AI를 사용했는지, 100% 인간이 만든 것인지, 공개해야 하는지에 대한 논쟁이다.
이런 논쟁은 우리가 AI에 아직 적응하지 못해서 생긴 일시적 현상인가? 아니면 앞으로도 계속될 문제인가?

<strong>데미스 하사비스:</strong>
두 가지 문제를 나눠봐야 한다.

먼저 misinformation, 즉 허위정보와 딥페이크 문제는 반드시 다뤄야 한다. 우리는 몇 년 전 생성 모델을 만들기 시작할 때부터 이 문제를 의식했다. 언젠가 이 시스템들이 사진처럼 사실적인 이미지를 만들 수 있게 될 것이라고 예상했기 때문이다.

그래서 우리는 <strong>SynthID</strong>라는 디지털 워터마킹 시스템을 만들었다. 이 워터마크는 이미지나 영상 안에 눈에 보이지 않게 삽입되지만, 나중에 해당 콘텐츠가 AI로 생성되었는지 탐지할 수 있게 해준다. 일반 시민, 기자, 정부가 AI 생성 여부를 확인할 수 있어야 한다고 봤다.

Google의 이미지, 음악, 비디오 생성 모델에는 SynthID가 들어가 있고, 우리는 이것을 오픈소스로 공개해 업계가 사용할 수 있도록 했다. OpenAI, Nvidia 등 여러 기업도 비슷한 표준을 채택하고 있다. 나는 결국 생성형 미디어에는 출처와 생성 여부를 확인할 수 있는 장치가 거의 규제처럼 요구되어야 한다고 본다. 이것은 저작권자와 IP 권리 문제에도 도움이 될 수 있다.

다만 “AI를 작업 과정 일부에 사용했다는 사실까지 항상 공개해야 하느냐”에 대해서는 확신이 없다. 예전에도 사람들은 Photoshop 같은 도구를 썼다. AI는 더 발전된 도구일 수 있다. 창작자가 자신의 창의성을 표현하기 위해 사용한 도구라는 점에서는 비슷하다. 다만 최종 산출물이 합성적으로 생성되었다는 사실은 알 수 있어야 한다.

<hr />

<h3>5. AI는 인간의 창의성을 약화시키는가, 확장시키는가?</h3>
<strong>인터뷰어:</strong>
당신의 경력을 보면 창의성이 계속 관통한다. 비디오게임을 만들었고, 신경과학자로서 뇌의 창의성을 연구했고, AlphaFold도 과학에서 매우 창의적인 접근이라고 볼 수 있다.
그런데 지금의 AI 도구를 두고 어떤 사람들은 “이것이 인간을 덜 창의적으로 만들 것”이라고 말한다. 예전에는 오랜 시간 노력해서 만들던 것을 이제 모델에게 시키면 되기 때문이다. AI가 창의성을 어떻게 바꿀 것이라고 보는가?

<strong>데미스 하사비스:</strong>
확실히 창의성은 바뀔 것이다. 내가 보는 변화는 두 가지다.

첫째, 창작 도구가 민주화되고 있다. 더 많은 사람들이 상대적으로 빠르고 쉽게 자신의 아이디어를 실험할 수 있게 된다. 이것은 양면성이 있다. 더 많은 사람들이 창작에 진입할 수 있지만, 동시에 창의적으로 가치가 낮은 결과물도 훨씬 많이 생길 수 있다.

하지만 긍정적인 면을 보자면, 진입장벽이 낮아지고 게이트키핑이 줄어든다. 세계 어디에 있든 새로운 창작자가 이런 도구를 활용해 업계에 들어올 수 있다.

둘째, 전문 창작자들에게는 AI가 창의적 과정을 강화하는 도구가 될 수 있다. 우리는 여러 전문 감독과 창작자들과 협력하면서 이들이 실제 창작 과정에서 무엇을 필요로 하는지 듣고 도구를 설계한다. 전문 창작자들은 평생 다 만들 수 없을 만큼 많은 아이디어를 갖고 있다. AI는 그 아이디어들을 더 저렴하고 빠르게 실험하게 해준다. 그래서 더 많은 시도를 하고, 더 빠르게 반복하고, 더 멋진 결과물에 도달할 수 있다.

다만 도구는 어떻게 쓰느냐가 중요하다. 인터넷이나 컴퓨터도 마찬가지였다. 게으르게 쓰면 창작 과정을 약화시킬 수 있지만, 혁신적으로 쓰면 창작 과정을 확장한다. 창작 산업이 AI 도구를 가장 잘 활용하는 방법을 알아내기까지는 시간이 걸릴 것이다.

게임 산업을 예로 들면, 지금은 주로 에셋이나 그래픽을 만드는 데 AI를 쓰고 있다. 하지만 나는 더 깊은 변화가 가능하다고 본다. 1990년대 그래픽과 게임 AI가 등장하면서 완전히 새로운 게임 장르가 가능해졌던 것처럼, 이번에도 AI가 게임의 본질을 바꾸고 새로운 장르를 만들 수 있다고 생각한다.

<hr />

<h3>6. AI 학습 데이터와 창작자 보상 문제</h3>
<strong>인터뷰어:</strong>
비판 중 하나는 AI 모델이 인간 창작물의 결과물로 학습되었다는 점이다. 그렇다면 어떤 AI 결과물이 특정 창작자의 작품을 일부 사용했다면, 이를 추적하고 보상할 수 있어야 하지 않을까?

<strong>데미스 하사비스:</strong>
새로운 경제 모델이 필요할 수도 있다. 기술 산업과 창작 산업이 함께 협력해야 한다. 음악 산업에서 스트리밍이 등장했을 때도 비슷한 일이 있었다. YouTube의 Content ID나 Spotify 같은 서비스들이 새로운 비즈니스 모델을 만들어냈다.

다만 특정 결과물에 대해 “이것은 어느 작품에서 1%, 저 작품에서 5%, 다른 작품에서 10% 왔다”고 객관적으로 나누는 것은 매우 어렵다. 인간 창작자도 마찬가지다. 우리가 만드는 것은 우리가 경험하고 배운 모든 것, 본 예술, 다른 창작자의 작품, 그리고 우리의 창의성이 섞인 결과다.

그런 의미에서 창작은 원래부터 여러 영향을 재조합하는 과정이었다. 다만 AI 시대에는 결국 새로운 비즈니스 모델이 필요해질 가능성이 크다.

<hr />

<h3>7. 과학용 AI와 창작용 AI는 분리될 수 있는가?</h3>
<strong>인터뷰어:</strong>
어떤 사람들은 AI가 질병 치료나 과학 연구에 쓰이는 것은 좋지만, 음악이나 영화, 광고 같은 창작물을 재현하는 것은 싫다고 말한다.
하지만 AI의 능력은 분야를 넘나든다. 예를 들어 Isomorphic Labs에서 가상 세포를 연구하고, 한편으로는 세계적 수준의 비디오 모델을 만든다면, 언젠가 그 비디오 모델이 가상 세포를 분석하고 질병 치료에 도움을 줄 수도 있지 않은가?

<strong>데미스 하사비스:</strong>
맞다. AGI라는 개념의 핵심이 바로 그것이다. DeepMind의 원래 목표는 거의 모든 입력에서 학습하고, 유용한 통찰이나 패턴을 찾아내며, 그것을 거의 어떤 방식으로든 출력할 수 있는 범용 지능 시스템을 만드는 것이었다.

인간의 마음이 그렇다. 우리는 수렵채집인의 뇌로 현대 문명을 만들었다. 이것이 일반지능이다. DeepMind는 처음부터 하드코딩된 답을 넣는 시스템이 아니라, 일반적이고 학습하는 시스템을 만들고자 했다.

그래서 과학용 AI와 창작용 AI는 완전히 분리하기 어렵다. 과학 논문이나 실험 데이터를 분석하려면 이미지, 세포 사진, 단백질 구조, 작은 분자 이미지 등을 이해해야 한다. 이것은 카메라로 들어오는 일반 시각 정보나 YouTube 영상을 이해하는 능력과 근본적으로 연결되어 있다.

우리가 처음 몇 년 동안 게임 AI를 연구한 것도 게임 자체가 최종 목표였기 때문은 아니다. 게임은 당시 AI 시스템이 도전하기에 적절한 난이도의 문제였다. AlphaGo나 Atari 게임은 중간 목표이자 연구 사다리였다. 그 사다리를 통해 우리는 오늘날 현실 세계의 과학 문제, 예를 들어 단백질 접힘 문제를 푸는 AlphaFold, 신약 개발 같은 영역으로 갈 수 있었다.

나 개인적으로도 AI를 과학에 활용하는 것이 가장 큰 열정이다. 하지만 같은 기반 플랫폼은 생성 미디어, 창의성 도구, 생산성 도구에도 사용될 수 있다.

<hr />

<h3>8. 뇌의 해마, 기억, 상상력, 그리고 AI의 창의성</h3>
<strong>인터뷰어:</strong>
당신의 2007년 신경과학 논문은 해마와 창의성을 연결한 유명한 연구다. 기억을 잃은 사람들이 미래를 상상하는 능력도 잃는다는 내용이었다.
시각적 상상력은 창의성에 매우 중요하다. 그렇다면 AI에서 일종의 “기계 해마” 같은 것을 만들려는 시도도 창의성과 연결될 수 있지 않을까?

<strong>데미스 하사비스:</strong>
내 경력의 흐름이 바로 거기에 있다. 나는 어린 시절 비디오게임을 설계하고 프로그래밍하면서 시각적 창의성을 많이 사용했다. 게임을 만들 때는 최종 결과를 머릿속으로 생생하게 상상했다. 플레이어가 어떻게 인터페이스를 쓰고, 어디에서 재미를 느끼고, 어떤 문제가 생길지를 실제로 구현되기 전부터 정신적으로 시뮬레이션했다.

우리 모두도 일상에서 이런 능력을 쓴다. 중요한 저녁 식사나 회의를 앞두고, 누가 어디 앉을지, 대화를 어떻게 시작할지, 사람들이 어떻게 느낄지 상상한다. 이것을 미래 사고 또는 상상 능력이라고 부를 수 있다.

내가 박사과정을 시작했을 때 원래는 기억을 연구하게 되어 있었다. 기억은 오래전부터 해마와 관련이 있다고 알려져 있었다. 당시 기억에 대해 두 가지 관점이 있었다. 하나는 기억이 비디오테이프처럼 사건을 그대로 기록한다는 관점이고, 다른 하나는 기억이 여러 조각을 재구성하는 과정이라는 관점이다.

나는 두 번째가 훨씬 맞다고 봤다. 기억이 재구성이라면, 상상도 같은 뇌 메커니즘을 사용할 것이다. 다만 목표만 다르다. 기억은 익숙한 것을 재구성하는 것이고, 상상은 그 조각들을 조합해 새롭다고 느껴지는 것을 만드는 것이다. 실제로 우리는 해마 손상 환자들이 기억뿐 아니라 상상 능력에도 문제가 있다는 것을 확인했다.

<hr />

<h3>9. 비디오 생성 모델과 인간 뇌의 상상 과정은 닮았는가?</h3>
<strong>인터뷰어:</strong>
프롬프트를 바탕으로 세계를 재구성하는 비디오 모델의 내부 작동과 인간 뇌의 상상 과정 사이에 유사성이 있다고 보는가?

<strong>데미스 하사비스:</strong>
시스템 수준에서는 확실히 유사성이 있다고 본다. 물론 구현 방식이 뇌와 AI가 1대1로 같다고 생각하지는 않는다. 신경과학을 한 이유도 뇌를 그대로 복사하려는 것이 아니었다. 중요한 것은 뇌가 사용하는 원리, 알고리즘, 표현 방식을 이해하고 그것에서 영감을 얻어 AI 모델 설계에 반영하는 것이다.

최근의 비디오·멀티모달 모델들이 세계를 생성하는 방식에는 인간의 상상 과정과 비교해볼 만한 부분이 있다. 실제로 몇몇 신경과학자 친구들은 최신 AI 모델이 특정 프롬프트로 만들어내는 이미지와, 인간이 fMRI 장치 안에서 상상하는 이미지 사이의 관계를 연구하고 있다.

심지어 사람이 어떤 이미지를 생각하거나 꿈꾸는지를 뇌 신호로 해독한 뒤, AI 모델을 이용해 그 이미지를 재현하고, 다시 당사자에게 “당신이 상상한 것이 이것이 맞느냐”고 묻는 실험들도 진행되고 있다. 앞으로 몇 년 안에 매우 SF적인 장치들이 등장할 수 있다고 본다.

<hr />

<h3>10. “아인슈타인 테스트”: 진정한 창의성이란 무엇인가?</h3>
<strong>인터뷰어:</strong>
당신은 “아인슈타인 테스트”라는 개념을 말한 적이 있다. AI에게 아인슈타인이 당시 가졌던 데이터만 주고, 예를 들어 1901년까지만의 지식을 준 뒤, 상대성이론 같은 새로운 물리학적 돌파구를 스스로 발견할 수 있는지 보는 것이다.
이런 테스트를 생각하면 텍스트 모델을 떠올릴 수도 있는데, 사실은 더 시각적인 과정이 필요한 것 아닌가?

<strong>데미스 하사비스:</strong>
나는 그것이 진정한 창의성을 정의하는 좋은 테스트라고 생각한다. 단순히 이미 알려진 것을 외삽하는 것이 아니라, 현실의 어떤 부분에 대해 진짜로 새로운 과학적 가설을 만들어내는 능력이다. 아인슈타인이 1905년에 한 일이 바로 그런 것이다.

언어 안에 충분한 정보가 있어서, 모든 텍스트를 읽고 머릿속에 연결할 수 있다면 새로운 이론을 만들 수도 있을지 모른다. 하지만 아인슈타인 자신은 스위스 특허청 직원으로 일하면서 많은 사고실험을 했다. 기차를 타고 빛의 속도로 이동한다면 무엇이 보일까 같은 시각적 상상을 했다.

그는 시각적 상상 장치를 사용해 새로운 이론을 떠올렸고, 이후 그것을 수학적으로 증명했다. 그래서 AI가 새로운 실험을 제안하거나 가설을 검증하려면, 단순히 비트나 논리의 세계가 아니라 원자와 물리 세계를 이해해야 한다고 본다.

<hr />

<h3>11. 가상 세계, 시뮬레이션, 그리고 AGI</h3>
<strong>인터뷰어:</strong>
당신은 과거 Elixir에서 <em>Republic: The Revolution</em>이라는 게임을 만들었다. 전 소련권 국가 같은 세계를 시뮬레이션하려 했던 매우 야심 찬 게임이었다. 당시에는 너무 앞서간 아이디어였을 수도 있다.
이제는 수많은 GPU를 활용해 다시 가상 세계를 만들고 있다. 이런 가상 세계 안에서, 예를 들어 가상의 아인슈타인이 특허청을 돌아다니며 사고실험을 하는 식으로 창의성이 나올 수 있다고 보는가?

<strong>데미스 하사비스:</strong>
<em>Republic</em>에서는 10만 명의 살아 움직이는 사람들과 그들의 일상, 정치, 혁명 과정을 손으로 시뮬레이션하려 했다. 굉장히 야심 찬 게임이었다. 당시에는 모든 것을 직접 작성해야 했고 수년이 걸렸다.

지금 놀라운 점은, 우리가 몇 년 안에 그런 세계를 어느 정도 자동으로 생성할 수 있는 가능성에 가까워지고 있다는 것이다. 아직은 완전히 준비되지 않았지만, 2~3년 뒤에는 내가 당시 상상했던 비전에 가까운 것이 가능할지도 모른다.

이것이 중요한 이유는 시뮬레이션과 AI가 근본적으로 연결되어 있기 때문이다. 상상도 일종의 시뮬레이션이다. 시뮬레이션이 유용한 이유는 여러 가능성을 이론적으로 시험해보고 최선의 경로를 선택하게 해주기 때문이다.

AlphaGo도 비슷했다. 현재 바둑판에서 수만 개의 수를 시뮬레이션하고, 20~30수 뒤의 위치들을 평가한 뒤 가장 유망한 경로를 선택했다. 이것이 세계 챔피언을 이길 수 있게 만든 핵심이었다.

<hr />

<h3>12. 경제학, 날씨, 사회과학에도 AI 시뮬레이션이 필요하다</h3>
<strong>인터뷰어:</strong>
시뮬레이션이 로보틱스나 AI 비서, 과학뿐 아니라 더 넓은 영역에도 적용될 수 있다는 뜻인가?

<strong>데미스 하사비스:</strong>
그렇다. 나는 경제학 같은 분야에도 시뮬레이션이 필요하다고 본다. 지금은 금리를 0.5% 올리거나 내린 뒤 실제 세계에서 결과를 지켜본다. 경기침체가 오면 “아, 그러면 안 됐나 보다”라고 하는 식이다.

하지만 훨씬 더 좋은 방식은 현재 경제 상황에서 수십만 개의 가능한 경로를 시뮬레이션하고, 금리나 정책 변수를 바꿨을 때 어떤 결과가 나올지 통계적으로 종합해 더 과학적인 결정을 내리는 것이다.

자연과학에서는 통제된 실험을 여러 번 반복할 수 있지만, 사회과학에서는 그렇게 하기 어렵다. 그래서 AI가 데이터로부터 시뮬레이션을 학습할 수 있다면 큰 변화가 생길 수 있다.

물론 시스템을 수학적으로 충분히 이해한다면 손으로 시뮬레이션을 코딩할 수도 있다. 하지만 날씨, 경제, 사회 시스템처럼 우리가 완전히 이해하지 못하는 영역에서는 AI가 데이터로부터 그 시뮬레이션 자체를 학습해야 한다. 이것이 내가 추구하는 더 큰 목표 중 하나다.

<hr />

<h2>핵심 요약</h2>
데미스 하사비스의 주장은 꽤 일관적이다. <strong>AGI는 단순한 텍스트 모델만으로 완성되기 어렵고, 세계를 보고 듣고 시뮬레이션하며 물리 현실을 이해하는 멀티모달 시스템으로 가야 한다</strong>는 입장이다.

그는 AI의 위험을 과소평가하지 않는다. 사이버 위험은 시작일 뿐이고, 앞으로 생물학·핵·기타 고위험 영역에서 더 큰 문제가 나타날 수 있으므로 국제적 표준 기관과 체계적 평가가 필요하다고 본다.

동시에 그는 AI를 창의성의 적으로만 보지 않는다. AI는 창작 도구를 민주화하고, 전문 창작자에게는 아이디어를 빠르게 실험하고 반복할 수 있는 능력을 제공한다고 본다. 다만 게으르게 쓰면 창의성을 약화시킬 수 있고, 혁신적으로 쓰면 창의성을 확장할 수 있다고 말한다.

가장 중요한 부분은 <strong>창의성, 과학, 시뮬레이션, AGI가 모두 연결되어 있다</strong>는 그의 관점이다. 인간의 상상은 일종의 시뮬레이션이고, 기억과 상상은 같은 뇌 메커니즘을 공유한다. AI도 결국 세계를 내부적으로 시뮬레이션하고 여러 가능성을 시험하면서 더 나은 선택을 하는 방향으로 발전해야 한다.

즉, 하사비스가 보는 AGI는 단순히 말을 잘하는 챗봇이 아니라, <strong>세계 모델을 만들고, 물리 세계를 이해하고, 과학 가설을 세우고, 가상 실험을 반복하며, 창의적 발견을 할 수 있는 범용 지능 시스템</strong>에 가깝다.]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Thu, 25 Jun 2026 19:07:15 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=5"><![CDATA[인터뷰]]></category>
		</item>
				<item>
			<title><![CDATA[앤트로픽 공동창업자 잭 클라크 "내가 드는 비유는 더 정밀한 프린트 헤드를 스스로 출력할 수 있는 3D 프린터"]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3620]]></link>
			<description><![CDATA[https://www.youtube.com/watch?v=OG3s4pojdZY

 
<h1>Nick Gillespie × Jack Clark 인터뷰 상세 정리</h1>
<h2>1. AI의 가장 큰 약속: 개인, 경제, 과학</h2>
<strong>Nick Gillespie:</strong>
요즘 AI를 둘러싼 분위기는 불안과 공포가 크다. 사람들은 AI의 위험을 걱정하고, Anthropic도 일정 부분 그런 우려를 갖고 있다. 그렇다면 더 넓은 관점에서 AI의 가장 큰 장점, 즉 “세일즈 포인트”는 무엇인가?

<strong>Jack Clark:</strong>
AI의 가능성은 세 층위로 나눠볼 수 있다.

첫째, <strong>개인에게는 보편적 교사</strong>가 생긴 것이다. 예전에는 “누구나 접근 가능한 훌륭한 개인 교사”가 꿈같은 이야기였는데, 이제는 무료로도 전문가 수준의 도움을 받을 수 있고, 월 20달러 정도를 내면 훨씬 더 좋은 교사와 대화하는 수준이 된다.

둘째, <strong>경제 영역에서는 관료적·사무적 백오피스 업무를 크게 줄일 수 있다.</strong> 서구 경제의 많은 부분은 서류 처리, 행정, 반복적인 업무로 구성되어 있다. AI는 이런 일을 처리하거나 없애서 사람들이 더 의미 있고 숙련이 필요한 일에 집중하게 만들 수 있다.

예를 들어 Anthropic은 오젬픽 제조사와 협력해 임상시험 결과를 처리하고 포맷팅하는 백엔드 업무를 도왔다. 원래 두 달 가까이 걸리던 일이 일주일 정도로 줄었다. 이런 일은 사라졌다고 해서 누군가 슬퍼할 만한 일이 아니다. 단순 송장 처리 같은 업무도 AI로 완전히 자동화할 수 있고, 대부분은 그걸 반긴다.

셋째, <strong>과학 영역에서는 AI가 최전선 연구를 함께 만들어가고 있다.</strong> 생물학, 수학, 물리학, 의학 등에서 세계적 과학자들이 Gemini, Claude, ChatGPT 같은 모델과 공동으로 논문을 쓰고 있다. 이것은 과학 발견의 새로운 시대다.

<hr />

<h2>2. AI의 환각과 아첨 문제</h2>
<strong>Nick Gillespie:</strong>
AI가 의료 정보나 진단에서도 더 나은 예측을 할 수 있다는 이야기가 있다. 하지만 AI가 집단적 착각이나 잘못된 정보를 퍼뜨리는 문제는 어떻게 막을 수 있나?

<strong>Jack Clark:</strong>
예전 AI 시스템들은 환각을 많이 했다. 이유는 간단하다. 초기 AI는 퀴즈쇼 참가자처럼 훈련됐다. 질문을 받으면 바로 버저를 누르고 답하려고 했다. “모른다”고 말하거나 아예 대답하지 않는 것이 합리적일 수 있다는 걸 가르치는 데 시간이 걸렸다.

하지만 아직 남아 있는 더 나쁜 문제는 <strong>sycophancy</strong>, 즉 사용자에게 과도하게 맞장구치는 문제다. AI가 “정말 흥미로운 질문입니다, 훌륭한 대화입니다” 같은 식으로 사용자를 기분 좋게 하지만 실제로는 도움이 안 되는 방향으로 반응할 수 있다. 좋은 친구나 좋은 동료는 때로 반박도 해주는데, AI도 어느 정도는 그렇게 훈련되어야 한다.

<hr />

<h2>3. 군사·국방 분야에서 AI가 바꾸는 것</h2>
<strong>Nick Gillespie:</strong>
AI의 군사적 활용에 대해 이야기해보자. 역사적으로 과학기술 혁신은 군사와 깊이 연결되어 있었다. AI는 국방을 어떻게 바꿀까?

<strong>Jack Clark:</strong>
두 가지 차원이 있다.

하나는 다른 산업과 비슷하다. 군 조직은 흔히 <strong>거대한 물류·관료 조직</strong>이다. 군대는 날카로운 무기를 끝에 단 물류 회사 같다고 농담할 수 있다. 따라서 AI는 군 내부의 행정, 물류, 의사결정 보조, 반복 업무 자동화에서 매우 유용할 수 있다.

다른 하나는 AI가 <strong>완전히 새로운 군사 능력</strong>을 만들 수 있다는 점이다. 과학 발전이 극초음속 미사일, 드론, 핵무기, 생물무기처럼 새로운 군사 기술을 만들어낸 것처럼, AI도 새로운 최전선 능력을 만들 것이다. 그런 능력은 군대, 정부, 시민사회 사이에서 깊은 논쟁의 대상이 될 수밖에 없다.

<strong>Nick Gillespie:</strong>
AI를 핵무기처럼 “먼저 가진 쪽이 압도적 우위”를 갖는 기술로 봐야 하나?

<strong>Jack Clark:</strong>
AI는 오히려 <strong>전기나 석유에 가깝다.</strong> 그것 자체가 중요한 동시에, 생산·관리 체계 전체가 중요하다. AI는 상업적·민간적 이익을 엄청나게 만들어내지만, 충돌과 전쟁에서도 깊은 영향을 갖는다. 특히 가장 정교하고 강력한 AI는 핵무기처럼 조심해서 다뤄야 하는 기술의 성격도 가질 수 있다. 유익한 측면은 확산시키되, 군사적으로 결정적인 위험 능력은 통제하는 방법을 찾아야 한다.

<hr />

<h2>4. Anthropic과 정부의 충돌: 수출, 국방, 레드라인</h2>
<strong>Nick Gillespie:</strong>
Anthropic이 최근 트럼프 행정부와 충돌한 배경도 이것인가? Anthropic이 자사 모델을 자유롭게 배포하지 못하게 되는 상황과 관련이 있나?

<strong>Jack Clark:</strong>
Anthropic은 오랫동안 정보기관·국방 커뮤니티와 협력해왔다. 동시에 우리는 AI가 가져올 전체 범위의 문제를 이야기하려고 해왔다.

현재 문제는 “Fable”이라는 모델이 상업적으로 매우 유용하면서도, 사이버·바이오 영역에서 국가안보나 국방과 관련된 능력을 가질 수 있다는 점이다. Anthropic은 그런 능력이 무분별하게 확산되지 않게 하려고 노력하고 있고, 정부와 매일같이 어떤 정책 프레임워크가 타당한지 논의하고 있다. 구체적인 내용은 말할 수 없다.

<strong>Nick Gillespie:</strong>
이전에 국방부 장관 Pete Hegseth가 Anthropic이 특정 AI 활용을 허용하지 않는다고 비판했다. Anthropic은 “살상 결정 같은 것을 AI에게 완전히 맡길 수 없다”고 주장했다. 그게 회사 철학과 충돌했기 때문인가?

<strong>Jack Clark:</strong>
Anthropic은 두 가지 레드라인을 제시했다.

첫째, <strong>미국인에 대한 국내 대량 감시</strong>에 AI가 쓰이는 것.
둘째, <strong>완전 자동화 무기</strong>, 즉 인간 판단 없이 AI가 무기 사용을 결정하는 것.

우리가 이 레드라인을 제시한 이유는 Anthropic이 사회 전체의 기준을 정할 수 있다고 생각해서가 아니다. 오히려 그 문제는 사회 전체의 토론이 필요한 영역이기 때문이다. 시민으로서 무엇이 옳은지 논의해야 한다.

<hr />

<h2>5. “보복성 규제인가?”에 대한 Clark의 답</h2>
<strong>Nick Gillespie:</strong>
상황을 보면 Anthropic이 국방부와 계약 조건을 두고 충돌했고, 이후 Mythos 5 같은 강력한 모델 출시를 미루거나 축소판 Fable을 내놓으려 하자 정부가 해외 출시를 막은 것처럼 보인다. 이게 보복처럼 보이지 않나?

<strong>Jack Clark:</strong>
구체적인 법적 문제는 말할 수 없다. 다만 더 큰 관점에서 보면, 이건 어떤 행정부라도 놀랄 만한 일이다.

국가안보 커뮤니티는 오랫동안 사이버 능력 같은 것을 특정한 국방 계약자, 정보기관, 기존 체계 안에서 다뤄왔다. 그런데 어느 날 민간 기술로 판매되던 AI 시스템이 정보기관 사람들이 보기에 “이건 우리가 다루던 능력과 비슷한데?”라고 느낄 만한 결과를 내기 시작했다. 그러면 정부 입장에서는 당연히 “잠깐, 이걸 어떻게 다뤄야 하지?”라는 질문을 하게 된다.

지금 벌어지는 일은 지저분하고 복잡한 방식으로 그 질문을 풀어가는 과정이다. 결국 필요한 것은 <strong>민간 AI 모델을 배포하면서도 국가안보적으로 민감한 능력을 어떻게 통제할지에 대한 정책 프레임워크</strong>다.

<hr />

<h2>6. 암호화 논쟁과 PlayStation 사례에서 얻을 교훈</h2>
<strong>Nick Gillespie:</strong>
1990년대 PGP 암호화 논쟁과 비슷한가? 당시 미국 정부는 암호화를 군수품처럼 규제하려 했다. 그때의 교훈이 있나?

<strong>Jack Clark:</strong>
비슷한 교훈이 있다. 또 다른 예로는 Sony PlayStation의 Cell 프로세서가 있다. 게임기였지만 매우 강력한 슈퍼컴퓨터처럼 보였기 때문에 통제하려는 논의가 있었다.

교훈은 이렇다. <strong>민간 기술과 국가안보 기술의 경계가 흐려질 때 첫 반응은 늘 혼란스럽다.</strong> 처음에는 “잠깐 멈추고 통제하자”가 된다. 시간이 지나면 개인의 자유, 민간 접근성, 국가안보 사이의 균형을 찾게 된다. 암호화와 컴퓨팅 모두 결국 개인이 넓게 접근할 수 있는 방향으로 갔고, 동시에 더 민감한 국가안보 측면은 관리하는 방식도 발전했다. AI도 장기적으로는 비슷한 방향으로 갈 가능성이 크다.

<hr />

<h2>7. 강력한 모델 출시는 기업 혼자 결정할 수 있는가?</h2>
<strong>Nick Gillespie:</strong>
Anthropic은 Mythos를 내부 테스트한 뒤 너무 강력하다고 보고 출시를 조정했다. 그렇다면 민간 기업이 스스로 판단하는 방식이 맞지 않나? 왜 정부가 개입해야 하나?

<strong>Jack Clark:</strong>
이 정도로 강력한 기술은 <strong>기업만 판단할 수 없다.</strong> 기업, 정부, 과학계, 사회 전체가 함께 판단해야 한다.

기업의 역할은 자신들이 최전선에서 본 것을 알리고, 다양한 “출시 실험”을 통해 데이터를 만드는 것이다. 정부는 산업계가 만들어낸 관행과 기준을 보고, 그중 사회적으로 적절한 것을 강제 기준으로 만들 수 있다.

예를 들어 안전벨트나 냉장고의 CFC 규제처럼, 처음에는 산업 관행이 생기고 나중에 사회가 “이건 의무화해야 한다”고 판단할 수 있다. AI도 비슷한 과정을 거칠 것이다.

<hr />

<h2>8. 바이든 행정부와 트럼프 행정부의 차이</h2>
<strong>Nick Gillespie:</strong>
Marc Andreessen 같은 실리콘밸리 인사들은 바이든 행정부가 AI에 너무 많은 제한을 두었고, 트럼프는 덜 규제적일 것이라 보고 지지했다고 말했다. 실제로 그랬나?

<strong>Jack Clark:</strong>
내 경험은 조금 다르다. 행정부마다 관심사의 강조점은 달랐다.

바이든 행정부는 AI의 안전과 보안 문제에 더 집중했다. 트럼프 행정부는 경제안보, 전력 문제, 미국 내 반도체 생산, 국가안보 문제에 집중했다. 하지만 큰 흐름으로 보면 오바마 말기, 트럼프 1기, 바이든, 다시 트럼프 행정부까지 <strong>클라우드 컴퓨팅, 공급망, 모델 평가와 테스트</strong> 같은 문제에서는 상당한 연속성이 있었다.

AI가 단순히 과학적으로 흥미로운 수준을 넘어 실제 사이버 능력처럼 실용적이고 국가안보적으로 중요한 능력을 갖기 시작하면서 정부의 태도가 바뀐 것은 자연스럽다.

<hr />

<h2>9. Anthropic은 규제를 원했는데, 이제 정부가 개입하니 불만인가?</h2>
<strong>Nick Gillespie:</strong>
Anthropic은 늘 정부 규제를 어느 정도 지지해왔다. 그런데 이제 트럼프 행정부는 국가안보 명분으로 수출을 통제하려 하고, Bernie Sanders 같은 좌파 정치인은 AI 기업의 부를 세금으로 가져가려 한다. Anthropic이 원하던 세상이 바로 이런 것 아닌가?

<strong>Jack Clark:</strong>
AI가 인류가 만든 가장 강력한 현대 산업기술이라면, 사회의 반응이 “아무것도 하지 말자”일 수는 없다. 매우 정치화된 반응이 나오는 것은 당연하다.

정부가 “이 시스템에는 국가안보적 속성이 있으니 다뤄야 한다”고 말하는 것은 좋은 일이다. Bernie Sanders 같은 사람들이 “AI 기업이 엄청난 부를 만들고 그 부가 소수 기업에 집중된다면 어떻게 해야 하느냐”고 묻는 것도 좋은 일이다. 그런 질문 자체는 필요하다.

정책은 대개 처음에는 극단적 아이디어들이 난무하고, 논쟁이 벌어지고, 결국 “muddling through”, 즉 어수선하게 타협해가는 방식으로 만들어진다. 극단적인 방식 그대로 가지는 않지만, 논쟁을 통해 실행 가능한 체계가 형성된다.

<hr />

<h2>10. 현재 진행 중인 AI 정책 논의</h2>
<strong>Nick Gillespie:</strong>
의회나 정부 안에서 비교적 합리적으로 논의하는 사람들이 있나?

<strong>Jack Clark:</strong>
있다. 예를 들어 의회에서 논의 중인 AI 정책 법안에는 투명성, 제3자 테스트, 검증 같은 합리적 아이디어가 들어 있다. 모든 내용에 동의하는 것은 아니지만, 넓게 보면 타당한 부분이 많다.

또 수출통제 관련 법안도 있다. 미국과 서방 국가의 국가안보를 지키기 위해 중국에 넘길 수 있는 컴퓨팅 자원을 어떻게 다룰지 논의하는 것이다. 이것도 대체로 합리적이다.

트럼프 행정부가 몇 주 전 발표한 AI 국가안보 관련 행정명령도 테스트, 검증, 공유 프레임워크를 다룬다는 점에서 큰 구조는 합리적이다. 결국 그런 체계에 가까운 방향으로 갈 가능성이 있다.

주 단위에서도 투명성 법안들이 나오고 있다. 지금은 AI 시스템이 감자칩 포장지 정도로 규제되는 셈이다. 성분표처럼 “어떻게 만들었는지, 어떻게 테스트했는지”를 밝히라는 정도다. 완벽하지는 않지만, 없는 것보다는 낫다.

<hr />

<h2>11. 투명성, 제3자 검증, 그리고 연방 차원의 기준</h2>
<strong>Nick Gillespie:</strong>
AI 기업들은 50개 주마다 다른 법을 상대하고 싶지는 않을 것 아닌가?

<strong>Jack Clark:</strong>
그렇다. 패치워크식 규제는 누구도 원하지 않는다. 그래서 연방 차원의 접근이 필요하다.

Anthropic의 기본 철학은 먼저 기업들이 <strong>의무적 투명성</strong>을 제공해야 한다는 것이다. 기업은 시스템을 어떻게 테스트했는지, 어떤 위험을 확인했는지 밝혀야 한다. 그다음에는 <strong>제3자 검증</strong>이 필요하다. 숙제를 낸 사람이 스스로 채점하는 게 아니라, 누군가 확인해야 한다.

이렇게 사회 전체가 증거 기반을 쌓으면, 나중에는 사이버나 바이오 같은 영역에서 명확한 기준을 의무화할 수 있다. 폭발물 규제와 비슷하다. 민간인이 살 수 있는 폭발물도 있고, 면허가 필요한 것도 있고, 군대만 다룰 수 있는 것도 있다. AI도 그런 식의 층위가 생길 수 있다.

<hr />

<h2>12. “규제를 요구하는 건 대기업의 시장 장악 전략 아닌가?”</h2>
<strong>Nick Gillespie:</strong>
철도, 소셜미디어, 빅테크 사례처럼 강한 기업들이 스스로 규제를 요구해 시장 지위를 고착화한 사례가 있다. Anthropic도 그런 것 아닌가? 대형 AI 기업들이 규제를 요구하면 결국 신규 진입자를 막는 장벽이 생기지 않나?

<strong>Jack Clark:</strong>
그 우려는 이해한다. 하지만 Anthropic은 제품도, 매출도 없던 초기부터 같은 이야기를 해왔다. 나와 Dario Amodei는 OpenAI 시절부터 10년 가까이 같은 문제의식을 가져왔다. 이 기술은 이번 세기 가장 강력하고 중요한 기술이 될 것이고, 기업만 결정해서는 안 된다는 입장을 계속 유지해왔다.

규제에 대한 아이디어는 기업만 내면 안 된다. 자유시장주의자, 리버테리언, 정책 전문가, 학계, 시민사회가 모두 자기 규제안을 내야 한다. 여러 집단이 공통적으로 동의하는 아이디어라면 그건 해볼 만하다. 반대로 기업만 주장하는 규제안이라면 매우 의심해야 한다. 그 규제에는 기업에 유리한 이유가 숨어 있을 가능성이 크다.

<hr />

<h2>13. 미국, EU, 중국: 글로벌 AI 거버넌스는 어떻게 가능한가?</h2>
<strong>Nick Gillespie:</strong>
미국은 미국대로, EU는 EU대로, 중국은 중국대로 움직인다. EU는 기술 역량보다 규제를 먼저 만든다는 비판도 있다. 글로벌 차원에서는 어떻게 조율할 수 있나?

<strong>Jack Clark:</strong>
가장 좋은 시나리오는 자동차, 비행기, 식품 무역과 비슷하다.

각국은 서로 다른 제도를 갖고 있지만, 자동차가 수출입되고, 비행기가 오가고, 식품이 거래된다. 가능한 이유는 <strong>공유된 기준, 테스트, 검증 방식, 상호 인정</strong>이 있기 때문이다. 꼭 하나의 세계정부가 필요한 게 아니다. 각국의 표준 기관들이 서로의 기준을 인정하고, 안전성을 확인할 방법을 갖는 것이다.

어떤 기준은 자발적일 수 있고, 어떤 기준은 법적으로 강제될 수 있다. 자동차 안전이나 항공 보안처럼 반드시 지켜야 하는 기준도 있고, Energy Star 같은 자발적 라벨링도 있다. AI도 결국 무엇이 핵심적으로 반드시 필요한 기준인지 찾아가게 될 것이다.

<hr />

<h2>14. 재귀적 자기개선, RSI란 무엇인가?</h2>
<strong>Nick Gillespie:</strong>
Anthropic에서 많이 이야기하는 recursive self-improvement, 즉 재귀적 자기개선이 무엇인가? 왜 이것이 중요한가?

<strong>Jack Clark:</strong>
AI 발전은 기본적으로 컴퓨팅, 데이터, 알고리즘을 모아 거대한 신경망을 훈련시키는 방식으로 이뤄져 왔다. 그런데 이제 AI 시스템들이 <strong>AI 시스템을 훈련시키는 코드를 쓰는 일</strong>, <strong>AI 훈련 아이디어를 제안하는 일</strong>을 점점 잘하게 되고 있다.

어느 순간 인간이 AI 개발의 전면에서 물러나고, AI에게 자원만 주면서 “Claude 10, Claude 11을 만들어라”라고 시키는 상황이 올 수 있다. 그러면 Claude 10이 아키텍처를 설계하고, 연구하고, 위험을 줄이고, 훈련을 실행해 Claude 11을 만든다. Claude 11은 모든 면에서 Claude 10보다 더 낫다.

오늘날 그런 수준은 아직 아니지만, 이 10년 안에 도래할 가능성이 있다고 본다. 굳이 연도를 걸어야 한다면 2028년 말쯤을 생각한다.

<strong>Nick Gillespie:</strong>
2028년이면 2년도 안 남은 가까운 미래다.

<strong>Jack Clark:</strong>
AI는 빠르게 움직인다. 지난 5~6년 동안 느낀 발전이 앞으로 2~3년에 압축되고, 다시 더 압축될 수 있다.

<strong>Nick Gillespie:</strong>
기술이 스스로의 개선 속도를 그렇게 빠르게 가속한 사례가 있나?

<strong>Jack Clark:</strong>
거의 없다. 가장 가까운 비유는 생물학적 진화지만, 그것은 수백만 년이 걸린다. 내가 드는 비유는 <strong>더 정밀한 프린트 헤드를 스스로 출력할 수 있는 3D 프린터</strong>다. 그런 프린터가 있다면 제조 능력이 폭발적으로 향상될 것이다. AI의 재귀적 자기개선도 그런 성격이다.

<hr />

<h2>15. RSI에 브레이크를 걸 수 있는가?</h2>
<strong>Nick Gillespie:</strong>
AI가 스스로 발전을 가속하면 인간, 주주, 사회가 방해물이라고 판단할 수 있다는 식의 종말론적 우려도 있다. 여기에 어떻게 브레이크를 걸 수 있나?

<strong>Jack Clark:</strong>
사이버·바이오 위험과 비슷한 구조의 문제다. 먼저 걱정되는 속성을 <strong>측정</strong>할 수 있어야 한다. 그다음 그것을 <strong>보호하고 통제</strong>할 수 있어야 한다. 예를 들어 AI가 특정 상황에서는 AI R&amp;D 능력을 발휘하지 못하도록 만드는 방법이 필요할 수 있다.

사회는 이렇게 말할 수 있다. “AI가 과학과 경제와 국가안보를 발전시키는 것은 좋다. 하지만 인간이 도저히 통제할 수 없을 정도로 수천 배 빠르게 발전할 필요는 없다.”

Anthropic 내부의 연구 조직에서는 AI 연구개발이 실제로 어떻게 진행되는지 측정하고, 재귀적 자기개선이 일어나는 신호를 포착할 방법을 연구하고 있다. 언젠가는 그런 측정 기준을 공개하고, 정책 입안자들과 공유해 RSI에 대한 기준과 임계값을 논의해야 한다.

이 기술은 신약, 재료과학, 에너지 같은 분야에서 기적처럼 보이는 혜택을 가져올 수 있다. 동시에 국가안보적으로 위험한 능력도 빠르게 만들 수 있다. 그래서 통제 계층이 필요하다.

<hr />

<h2>16. AI 발전을 의도적으로 늦출 선택지</h2>
<strong>Nick Gillespie:</strong>
Anthropic은 RSI 같은 상황이 오면 발전 속도를 늦출 선택지가 필요하다고 말했다. 그런데 “우리”가 늦춘다는 건 누구를 말하는가? Anthropic은 선의로 행동한다 해도, 다른 기업이나 정부가 “우리는 무조건 전속력으로 간다”고 하면 어떻게 하나?

<strong>Jack Clark:</strong>
우리가 할 수 있는 것은 아이디어를 제시하고, 사회화하고, 중요한 데이터가 생겼을 때 세계가 협력할 수 있게 만드는 것이다. 역사적으로 그런 협력 사례가 있다.

대표적으로 <strong>CFC와 오존층 문제</strong>가 있다. 과학자, 제조사, 정부가 “오존층에 구멍이 나는 건 아무도 원하지 않는다”고 보고 협력했다. 완벽하지는 않았지만 매우 성공적인 글로벌 조정 사례다. AI에서도 그런 조정이 필요할 수 있다.

<hr />

<h2>17. Jack Clark의 배경: 문학, 저널리즘, 기술정책</h2>
<strong>Nick Gillespie:</strong>
당신은 영국 East Anglia 대학에서 문예창작과 문학을 공부했고, Bloomberg와 The Register 등에서 기술 기자로 일했다. 이런 배경이 AI 정책을 보는 방식에 어떤 영향을 줬나?

<strong>Jack Clark:</strong>
기자이고 넓게 읽는 사람이라면 모든 기술이 정치적·사회적 요소를 가진다는 점을 보게 된다. 기술은 사람들의 행동과 세계의 구조를 바꾼다.

실리콘밸리는 무언가를 만드는 데 집중한다. 그건 매우 어려운 일이고 중요하다. 하지만 지난 15년의 교훈은, 기술 기업들이 무언가를 만들면서 동시에 <strong>사회적·정치적 기술</strong>을 세계에 배포하고 있다는 사실을 종종 잊었다는 것이다.

소셜미디어가 좋은 예다. 세계 수억, 수십억 명을 대상으로 통제되지 않은 실험을 한 셈이다. 세상이 소셜미디어 덕분에 여러 면에서 나아진 것도 맞지만, 청소년 거식증, 자살, 정보 문제 같은 것에 대해 더 많은 정보를 공유하고 더 잘 대비할 수도 있었다.

나는 2012년에 “Facebook, Google, Rise of the New Feudalism”이라는 글을 썼다. 대형 데이터센터와 머신러닝, 플랫폼을 보면서, 이것이 세계 곳곳에서 데이터를 모으고 사람들을 플랫폼 위에서 일하게 하며, 분석하고 통제하는 새로운 봉건제 같은 구조를 만들 수 있다고 봤다. 특정 기업 비판이라기보다, 기술이 정치적 성질을 가진다는 관찰이었다.

<hr />

<h2>18. 기술은 통제인가, 해방인가?</h2>
<strong>Nick Gillespie:</strong>
그런 관점은 기술을 너무 결정론적으로 보는 것 아닌가? 기술은 극빈을 줄이고 세계 중산층을 키우는 데도 기여했다. 중산층의 증가는 정치적 자유와도 연결된다.

<strong>Jack Clark:</strong>
내 말은 기술이 그런 속성을 가질 수 있다는 관찰이다. 사회는 그 분포를 보고 다이얼을 조정해야 한다.

스마트폰은 좋은 예다. 스마트폰은 사업을 시작하게 해주고, 소통하게 해주고, 사진을 찍게 해주며, 내 아이들 사진을 남기는 기쁨도 준다. 동시에 나는 밤중에 Instagram Reels를 보다가 45분을 날리기도 한다. 같은 도구 안에 자유와 통제의 가능성이 모두 들어 있다.

AI도 마찬가지다. 가능한 한 널리, 중개 없이 강력한 능력을 제공하고 싶다. 하지만 그 시스템 안에는 진짜로 무섭고 통제해야 할 속성도 있다. 그 경계를 어디에 둘지가 지금 시대의 거대한 정치·정책 논쟁이다.

<hr />

<h2>19. Clark이 보는 진보와 기술</h2>
<strong>Nick Gillespie:</strong>
당신은 진보를 어떻게 정의하나? 기술은 사람을 더 부유하게 만들기 때문에 좋은가, 아니면 개인의 자유를 늘리기 때문에 좋은가?

<strong>Jack Clark:</strong>
기술은 인간이 세계와 우리 자신, 서로를 더 잘 이해하게 만드는 도구라고 본다. 인류는 이번 세기를 통과하기 위해 강력한 기술이 많이 필요하다. 에너지 시스템, 정부, 의학, 재료과학 등 많은 것을 개선해야 한다.

AI는 디지털 기술의 힘을 물리 세계로 확장시켜 의학, 에너지, 재료과학을 매우 빠르게 발전시킬 것이다. 이것은 물질적 풍요를 늘릴 수 있고, 풍요는 사람들에게 더 많은 시간을 주기 때문에 자유를 가능하게 한다.

또 기술은 공동체를 해체하기만 하는 것이 아니다. 예를 들어 Oakland의 DIY 펑크 신은 Instagram 전단을 통해 공연 정보를 퍼뜨리고 사람들을 모았다. 예전에는 전봇대에 붙인 종이 전단이 하던 일을 새로운 기술이 한 것이다. 기술은 원자화와 탈원자화, 통제와 자유를 모두 포함한다.

<hr />

<h2>20. AI와 고용: 지금 데이터와 미래 직감의 충돌</h2>
<strong>Nick Gillespie:</strong>
AI가 일자리에 미칠 영향에 대해 이야기해보자. 과거 자동화는 주로 육체노동이나 공장 일을 대체했다. 하지만 AI는 고학력, 중상층, 전문직을 겨냥한다는 이야기가 있다. 맞나?

<strong>Jack Clark:</strong>
두 가지 모순되는 사실을 동시에 봐야 한다.

첫째, <strong>현재 데이터는 아직 대규모 일자리 대체를 명확히 보여주지 않는다.</strong> 다만 문제는 현재 AI 혁명의 시작점이 COVID 시기와 겹친다는 것이다. 코로나 기간에는 특정 부문 과잉고용, 재택근무 전환, 경제 환경 변화가 동시에 일어났다. 그래서 AI 효과만 분리하기 어렵다.

현재 데이터에서 확실히 보이는 것은 일부 섹터에서 <strong>초년생·신입 채용 약화</strong> 정도다. 예를 들어 지금 컴퓨터공학 전공자로 졸업하는 것이 10년 전보다 나쁜 시기일 수 있다.

Anthropic 내부에서도 경험 많은 사람을 더 많이 뽑는 경향이 있다. 이유는 AI 덕분에 실험 실행의 잡일이 줄어들면서 <strong>직관과 전문성의 수익률</strong>이 커졌기 때문이다. 예전에는 숙련 연구자 한 명이 아이디어를 내면, 그 실험을 돌릴 엔지니어 팀이 필요했다. 이제는 Claude가 상당 부분 실험을 수행한다. 그래서 더 많은 시니어급 직관을 가진 사람이 필요해진다.

<strong>Nick Gillespie:</strong>
그렇다면 최근 대학 졸업자들이 실업 예비군처럼 되는 것 아닌가?

<strong>Jack Clark:</strong>
그 가능성 때문에 Anthropic은 Claude Corps라는 프로그램을 발표했다. 미국 전역의 초기 대학 졸업자 1,000명을 비영리단체나 여러 조직에 배치하고, AI를 활용해 그 조직의 시스템을 개선하도록 훈련하는 프로그램이다.

목표는 두 가지다.
하나는 AI 혜택을 접근하기 어려운 조직에 확산하는 것.
다른 하나는 젊은 사람들에게 실제 경험을 주는 것이다.
이 프로그램을 통해 경제에서 무슨 일이 일어나는지 자연 실험처럼 관찰할 수 있다.

<hr />

<h2>21. “AI가 내 일도 없앨 수 있다”는 연구자들의 직감</h2>
<strong>Nick Gillespie:</strong>
전체 섹터는 성장하고 있지만 신입 채용은 약해지는 것 같다. 그런데 장기적으로는 어떻게 보나?

<strong>Jack Clark:</strong>
여기서 두 번째, 거의 모순적인 사실이 나온다.

내 동료 중 많은 사람들은 “현재 경제의 정상적인 모습과 우리가 만드는 미래 경제를 조화시키기 어렵다”고 말한다. 머신러닝 연구자들, 즉 이 기술의 발전을 여러 해 동안 정확히 예측해온 사람들이 자기 자신의 실직 가능성까지 이야기한다.

이들이 틀릴 수도 있다. 하지만 이 사람들은 기술이 얼마나 빠르게 발전할지, 사람들이 예상한 것보다 얼마나 더 나아갈지 여러 번 맞혀왔다. 그러니 그 직감에도 귀를 기울일 필요가 있다.

정부와 이야기할 때 나는 이렇게 말한다. “경기침체 때문이 아니라, 매우 생산적인 신기술이 등장해서 경제에 전례 없는 일이 벌어지는 상황에 대비해야 한다.” 예를 들어 GDP 성장률이 추세보다 훨씬 높아지면서 동시에 실업률이 경기침체 때처럼 급등하는 이상한 조합도 가능하다. 정부는 그런 극단적 시나리오까지 계획해야 한다.

<hr />

<h2>22. 정부가 그런 문제를 감당할 수 있나?</h2>
<strong>Nick Gillespie:</strong>
정부가 그런 사회 문제의 안전판이 될 수 있다고 믿나? DMV 같은 관료제를 보면 회의적이다.

<strong>Jack Clark:</strong>
나는 낙관론자다. 모든 정부가 잘할 것이라고 보지는 않지만, 잘하는 정부도 있다.

미국 안에서도 잘 작동하는 정부 시스템을 본 적이 있고, 영국에서 학자금 대출을 갚을 때 정부 시스템이 꽤 괜찮아서 놀랐다. Estonia처럼 디지털 정부가 잘 작동하는 사례도 있다. 정부도 할 수 있다. 모두가 하지는 못하겠지만, 일부는 할 수 있고, 우리는 그들을 도울 방법을 찾을 것이다.

<hr />

<h1>핵심 메시지 압축</h1>
이 인터뷰에서 Jack Clark의 핵심 주장은 이렇습니다.

AI는 단순한 챗봇이 아니라 <strong>개인 교육, 백오피스 자동화, 과학 발견, 군사·안보, 경제 구조, 고용시장, 국가 거버넌스 전체를 바꾸는 범용 기술</strong>이다.

그는 AI를 전기나 석유 같은 기반 기술로 보면서도, 최첨단 모델은 핵무기처럼 조심히 다뤄야 할 속성이 있다고 본다. 특히 사이버, 바이오, 군사, 재귀적 자기개선 영역에서는 기업의 자율 판단만으로는 부족하고, 정부·기업·과학계·시민사회가 함께 투명성, 제3자 검증, 임계값, 수출통제, 국제 표준을 만들어야 한다고 주장한다.

다만 Clark은 무조건적인 규제론자는 아니다. 그는 기업만 규제안을 쓰면 시장 장악 수단이 될 수 있으니, 리버테리언과 자유시장주의자까지 포함한 다양한 집단이 각자의 규제안을 내야 한다고 말한다. 기업만 찬성하는 규제는 의심해야 한다는 입장이다.

고용에 대해서는 현재 데이터상 대규모 실직이 입증되지는 않았지만, 신입 채용 약화와 전문직 구조 변화는 이미 보이고 있으며, AI 연구자들 내부에서도 “이 기술이 결국 우리 일까지 대체할 수 있다”는 직감이 강하다고 말한다. 특히 GDP는 폭발적으로 성장하는데 실업률도 같이 오르는, 기존 경제학이 익숙하지 않은 시나리오에 대비해야 한다고 본다.]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Thu, 25 Jun 2026 18:55:16 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=5"><![CDATA[인터뷰]]></category>
		</item>
				<item>
			<title><![CDATA[Claude Fable 5 돌아오는중]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3619]]></link>
			<description><![CDATA[ㅇ<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/1/202606/6a3cf98a74ccf5386448.png" alt="" />]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Thu, 25 Jun 2026 18:49:03 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=1"><![CDATA[자유게시판]]></category>
		</item>
				<item>
			<title><![CDATA[OpenAI와 Broadcom, LLM에 최적화된 추론 칩 공개]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3618]]></link>
			<description><![CDATA[<a href="https://openai.com/index/openai-broadcom-jalapeno-inference-chip/">https://openai.com/index/openai-broadcom-jalapeno-inference-chip/</a>
<h2>핵심 요약</h2>
OpenAI와 Broadcom은 <strong>Jalapeño</strong>라는 OpenAI 최초의 <strong>Intelligence Processor</strong>, 즉 LLM 추론용 AI 가속기를 공개했다. 이 칩은 기존 범용 AI 가속기를 조금 고친 것이 아니라, <strong>처음부터 대형언어모델 추론에 맞춰 설계된 전용 칩</strong>이라는 점을 강조하고 있다.

Jalapeño는 OpenAI가 ChatGPT, Codex, API, 향후 에이전트 제품을 운영하면서 얻은 실제 추론 패턴을 바탕으로 설계됐다. OpenAI는 모델, 커널, 메모리 이동, 네트워킹, 서빙 시스템까지 직접 이해하고 있기 때문에, 칩 구조를 자사 LLM 워크로드에 맞춰 최적화할 수 있었다고 설명한다.
<h2>성능과 목적</h2>
초기 테스트에 따르면 Jalapeño는 <strong>현재 최고 수준 AI 가속기 대비 와트당 성능이 상당히 우수할 것</strong>으로 예상된다. 아직 최종 성능 수치는 공개되지 않았고, 자세한 기술 보고서는 추후 발표될 예정이다.

핵심 설계 방향은 다음과 같다.
<table>
<thead>
<tr>
<th>항목</th>
<th>내용</th>
</tr>
</thead>
<tbody>
<tr>
<td>목적</td>
<td>LLM 추론 성능 최적화</td>
</tr>
<tr>
<td>강점</td>
<td>낮은 지연시간, 높은 처리량, 높은 전력 효율</td>
</tr>
<tr>
<td>설계 철학</td>
<td>데이터 이동 최소화, 연산·메모리·네트워킹 균형</td>
</tr>
<tr>
<td>목표</td>
<td>이론상 피크 성능에 가까운 실제 활용률 달성</td>
</tr>
<tr>
<td>활용처</td>
<td>ChatGPT, Codex, API, 에이전트 제품 등</td>
</tr>
</tbody>
</table>
즉, 단순히 더 빠른 칩을 만드는 것이 아니라 <strong>AI 서비스를 더 싸고 빠르고 안정적으로 제공하기 위한 인프라 전략</strong>에 가깝다.
<h2>OpenAI의 풀스택 전략</h2>
이 발표에서 가장 중요한 부분은 OpenAI가 이제 단순히 모델 회사나 제품 회사가 아니라, <strong>칩까지 포함한 풀스택 AI 플랫폼 기업</strong>으로 가려 한다는 점이야.

OpenAI는 다음 단계까지 직접 최적화하려고 한다.
<ol>
 	<li>제품: ChatGPT, Codex, API</li>
 	<li>모델: GPT 계열 및 미래 LLM</li>
 	<li>서빙 시스템: 스케줄링, 추론 최적화</li>
 	<li>커널·메모리 구조</li>
 	<li>네트워킹</li>
 	<li>칩 아키텍처</li>
 	<li>데이터센터 배치</li>
</ol>
이렇게 되면 OpenAI는 엔비디아 GPU 위에서만 모델을 돌리는 회사가 아니라, <strong>자기 모델에 맞는 하드웨어까지 직접 설계하는 기업</strong>이 된다.
<h2>Broadcom과 Celestica의 역할</h2>
OpenAI가 칩 아키텍처와 LLM 워크로드 방향을 잡고, Broadcom은 실제 반도체 구현과 네트워킹 기술을 담당한다. 특히 Broadcom의 <strong>Tomahawk 네트워킹 실리콘</strong>이 대규모 AI 데이터센터 연결에 사용된다.

Celestica는 보드, 랙, 시스템 통합, 생산 인프라 쪽을 맡는 것으로 나온다.

정리하면 역할은 이렇다.
<table>
<thead>
<tr>
<th>회사</th>
<th>역할</th>
</tr>
</thead>
<tbody>
<tr>
<td>OpenAI</td>
<td>칩 설계 방향, LLM 워크로드 최적화, 풀스택 인프라 전략</td>
</tr>
<tr>
<td>Broadcom</td>
<td>ASIC 구현, 네트워킹, 연결 기술, 대량 생산 지원</td>
</tr>
<tr>
<td>Celestica</td>
<td>보드, 랙, 시스템 통합, 생산 시스템</td>
</tr>
</tbody>
</table>
<h2>9개월 만의 테이프아웃</h2>
글에서 특히 강조하는 부분은 Jalapeño가 <strong>초기 설계부터 제조 테이프아웃까지 9개월 만에 개발됐다</strong>는 점이다. 고성능 ASIC 기준으로는 매우 빠른 개발 속도라고 주장한다.

여기에는 OpenAI 모델이 칩 설계와 최적화 과정 일부를 가속했다는 내용도 포함되어 있다. 즉, <strong>AI가 다음 세대 AI 칩 개발을 도와주는 자기강화 구조</strong>가 만들어지고 있다는 의미로 해석할 수 있다.

이 부분은 꽤 중요해. 만약 AI가 칩 설계 속도를 실제로 크게 줄인다면, AI 인프라 발전 속도 자체가 빨라질 수 있기 때문이야.
<h2>배포 계획</h2>
Jalapeño는 단발성 칩이 아니라 <strong>여러 세대에 걸친 컴퓨트 플랫폼의 첫 번째 칩</strong>으로 소개된다. OpenAI와 Broadcom은 이를 2026년 말부터 초기 배포하고, 이후 수년간 기가와트 규모 데이터센터로 확장할 계획이라고 말한다.

특히 Broadcom CEO Hock Tan은 Microsoft 및 다른 파트너들과 함께 <strong>기가와트 규모 AI 데이터센터 배포</strong>를 언급한다.
<h2>의미와 파급효과</h2>
이 발표가 사실이라면 의미는 상당히 크다.

첫째, OpenAI는 <strong>엔비디아 GPU 의존도를 일부 낮출 수 있는 자체 추론 인프라</strong>를 갖게 된다.
둘째, Broadcom은 OpenAI의 핵심 ASIC 파트너로 자리 잡으며 AI 반도체 시장에서 더 강한 입지를 확보한다.
셋째, AI 추론 비용이 낮아지면 ChatGPT, Codex, API 사용 비용이 더 저렴해지거나 성능이 좋아질 수 있다.
넷째, OpenAI의 모델 개발 → 제품 사용량 증가 → 매출 증가 → 인프라 재투자 → 더 강한 모델 개발이라는 플라이휠이 강화된다.
<h2>한 줄 요약</h2>
<strong>Jalapeño는 OpenAI가 LLM 추론을 위해 직접 설계한 첫 자체 AI 칩이며, Broadcom과 함께 엔비디아 중심 GPU 생태계에서 벗어나 풀스택 AI 인프라 기업으로 확장하려는 전략적 신호다.</strong>

투자 관점으로 보면 이 내용은 특히 <strong>Broadcom, Celestica, Microsoft, AI 데이터센터 전력·네트워킹 기업들에는 긍정적</strong>이고, 장기적으로는 <strong>엔비디아의 추론 시장 독점성에는 도전 요인</strong>으로 볼 수 있어.]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Wed, 24 Jun 2026 22:32:11 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=3"><![CDATA[뉴스/정보]]></category>
		</item>
				<item>
			<title><![CDATA[gpt-5.6-auto]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3617]]></link>
			<description><![CDATA[<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/1/202606/6a3b1486efb656886423.jpg" alt="" />

chatgpt 공홈에 5.6 내용 나온다고 함

근데 성능이 기대가 안 됨 ㅜㅜ

<img class="sa-emoticon" src="https://sub.strongai.kr/wp-content/uploads/2026/05/1-8-e1780063836662.webp" alt="5" width="150" height="150" />

 ]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Wed, 24 Jun 2026 08:21:17 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=1"><![CDATA[자유게시판]]></category>
		</item>
				<item>
			<title><![CDATA[앤트로픽 내부에 Mythos의 새롭고 더 강력한 버전 등장]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3616]]></link>
			<description><![CDATA[<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/1/202606/6a3872b2ed7d32027662.png" alt="" /><img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/1/202606/6a3872b2ed2492104957.png" alt="" />]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Mon, 22 Jun 2026 08:24:42 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=1"><![CDATA[자유게시판]]></category>
		</item>
				<item>
			<title><![CDATA[claude-sonnet-5 발표예정]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3615]]></link>
			<description><![CDATA[<img src="https://sub.strongai.kr/wp-content/uploads/kboard_attached/1/202606/6a37f68b05c342109539.png" alt="" />]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Sun, 21 Jun 2026 23:34:53 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=1"><![CDATA[자유게시판]]></category>
		</item>
				<item>
			<title><![CDATA[2026.3.20 Shane Gu×Shane Legg 일본 인터뷰]]></title>
			<link><![CDATA[https://sub.strongai.kr/?kboard_content_redirect=3614]]></link>
			<description><![CDATA[https://www.youtube.com/watch?v=EGQ0s7-S5zo

<hr />

<h1>세인 레그 인터뷰 대담형 상세 정리</h1>
<h2>1. 도입: 왜 AGI를 추구하게 되었나</h2>
<strong>사회자:</strong>
오늘 G1 Summit에 DeepMind 공동창업자인 세인 레그 박사를 모시게 되어 기쁘다. 그는 현실 세계 로보틱스와 AI를 연결해온 인물이고, AGI 논의의 선구자이기도 하다. 먼저 묻고 싶다. 박사님은 원래 어떻게 AGI라는 목표에 끌리게 되었나? 그리고 DeepMind 초기에 AGI를 정의했을 때와 비교하면, 어떤 기술적 장벽이 예상보다 어려웠고, 어떤 돌파구는 예상보다 빨랐나?

<strong>세인 레그:</strong>
내가 AGI에 본격적으로 관심을 갖게 된 결정적 순간은 <strong>2000년</strong>이었다. 그때 레이 커즈와일의 『The Age of Spiritual Machines』를 읽었다. 그 책은 시간이 지날수록 컴퓨팅 파워가 증가하고, 데이터 양도 늘어나며, 이런 흐름이 계속되면 매우 강력한 인공지능이 가능해질 것이라고 설명했다.

그 책을 읽고 나는 확신하게 되었다. 컴퓨팅 능력과 데이터의 증가가 앞으로 몇십 년 더 이어질 것이고, 그렇다면 <strong>2020년대와 2030년대에는 매우 강력한 AI가 가능해질 것</strong>이라고 봤다. 그래서 내 커리어를 그 예측에 걸기로 했다. 이후 스위스로 가서 인공지능 박사과정을 시작했다.

돌이켜보면 그 판단은 꽤 좋은 예측이었다. 실제로 지금 우리가 보는 AI 발전은 당시 내가 기대했던 방향과 상당히 맞아떨어지고 있다.

초기 DeepMind에서 AGI를 만들려고 할 때 가장 중요한 기술적 도전은 <strong>매우 큰 AI 모델, 특히 신경망이 추상 개념을 형성할 수 있느냐</strong>였다. 단순히 데이터를 외우는 게 아니라, 그 안에서 추상적 개념을 만들고, 그것을 바탕으로 이해하고 일반화할 수 있어야 했다.

그 점에서 가장 중요한 돌파구는 <strong>Transformer</strong>였다. Transformer는 구글에서 발명된 구조이고, 오늘날 모든 LLM 챗봇의 기반이 되었다. 이 구조는 수십억 개 이상의 파라미터로 확장될 수 있었고, 대규모 데이터 속에서 충분한 추상 개념을 형성할 수 있게 해주었다. 이것이 현재 AI 발전의 핵심적인 기술적 기반이었다.

반면 지금도 가장 큰 문제로 남아 있는 것은 <strong>continual learning</strong>, 즉 지속학습이다. 현재 AI는 문맥창 안에서 짧은 기간 동안은 어느 정도 배울 수 있지만, 인간처럼 몇 년에 걸쳐 계속 경험을 축적하고, 스스로 학습하며, 장기적으로 능력을 갱신하는 수준에는 아직 도달하지 못했다. 인간 수준으로 진짜 유용한 AI가 되려면 장기간 계속 학습할 수 있어야 한다. 우리는 아직 이 문제를 완전히 해결하지 못했다.

<hr />

<h2>2. DeepMind는 어떻게 시작되었나</h2>
<strong>사회자:</strong>
DeepMind를 창업한 과정도 궁금하다. 어떻게 시작하게 되었고, 왜 학계가 아니라 회사를 만들기로 했나? DeepMind는 이후 OpenAI와 Anthropic 같은 회사들이 뒤따르는 AI 역사의 선구자가 되었다.

<strong>세인 레그:</strong>
스위스에서 박사학위를 마친 뒤 나는 AI와 신경과학의 연결에 관심을 갖게 되었다. 그래서 런던 UCL의 Gatsby Unit으로 갔다. 그곳은 신경과학과 인공지능을 함께 연구하는 곳이었다.

그곳에서 데미스 허사비스를 만났다. 데미스와 나는 <strong>인공 일반지능이 10년에서 20년 안에 가능할 수 있다</strong>는 믿음을 공유했다. 처음에는 이것을 학계에서 해볼 수 있을지 생각했다. 하지만 곧 학계에서 하기에는 필요한 자원과 스케일이 너무 크다고 판단했다. 그래서 이것은 기업으로 해야 한다고 봤다.

솔직히 나는 조금 더 회의적이었다. 2009년이나 2010년에 AI 회사를 시작한다는 것은 매우 어려운 일이었다. 특히 AGI 회사를 한다고 하면 투자자들이 쉽게 믿지 않았다. 실제로 초기 자금 조달은 매우 힘들었다. 하지만 결국 미국에서 자금을 유치할 수 있었고, 그렇게 DeepMind가 시작되었다.

우리는 AI가 강력해지려면 몇 년이 걸릴 것이라는 점을 알고 있었다. 하지만 AI 물결이 오기 전에 먼저 시작하고 싶었다. 우리는 너무 일찍 시작한 셈이다. 일찍 시작하면 기회도 있지만, 투자받기는 훨씬 어렵다.

나중에는 구글에 회사를 팔아야 했다. 당시 우리는 여전히 작은 회사였고, 약 100명 정도 규모였다. 그런데 AI 분야가 빠르게 뜨기 시작했고, 대형 테크 회사들이 우리의 연구자들을 원했다. DeepMind에는 딥러닝 인재들이 많았기 때문이다. 독립적으로 계속 가려면 엄청난 자본이 필요했다. 그래서 구글과 결합하게 되었다.

흥미로운 점은 일론 머스크도 DeepMind 투자자 중 한 명이었다는 것이다. 그런데 DeepMind가 구글에 인수되면서 그는 더 이상 DeepMind 지분을 갖지 않게 되었고, 이후 경쟁자가 필요하다고 생각하게 되었다. 그 흐름에서 OpenAI가 등장했다. 그런 식으로 이후 여러 일이 이어졌다.

<hr />

<h2>3. 초기 투자와 피터 틸 일화</h2>
<strong>사회자:</strong>
창업자들이라면 누구나 초기 투자 유치가 얼마나 어려운지 안다. 영국에서는 자금을 많이 받지 못하고, 미국에서 받았다고 했는데, 구체적으로 어땠나?

<strong>세인 레그:</strong>
영국에서는 약 20만 달러 정도밖에 모으지 못했다. 대부분 데미스를 개인적으로 알고 있던 사람들이었다. 첫 번째 큰 투자자는 피터 틸이었다.

우리는 샌프란시스코에서 피터 틸을 만났다. 우리는 그에게 인공 일반지능 회사를 만들고 싶다고 말했다. 그는 여러 교수들에게 이 아이디어에 대해 물어봤다. 교수들은 대부분 “이건 끔찍한 아이디어다. 절대 투자하면 안 된다”고 했다.

그런데 피터 틸은 우리에게 다시 연락해서 말했다. “당신들은 똑똑해 보이고, 모두가 하지 말라는 일을 하고 있다. 그래서 투자해보겠다.” 그는 원래 반대 방향에 베팅하는 성향이 강한 사람이었다.

하지만 그 반대적 성향이 나중에는 문제도 되었다. 2013년쯤 AI가 뜨거운 분야가 되자, 우리는 DeepMind가 독립적으로 계속 가려면 큰 투자가 필요하다고 말했다. 그런데 그는 이제 AI가 너무 뜨거운 분야가 되었다고 생각했고, 오히려 흥미를 잃었다. 결국 그는 팔았다. 돌이켜보면 계속 보유했어야 했을 것이다.

<hr />

<h2>4. AlphaGo 이전의 돌파구와 AlphaGo가 탄생한 배경</h2>
<strong>사회자:</strong>
사업을 하다 보면 “이제 잘될 수 있겠다”고 느끼는 순간이 있다. DeepMind에서는 언제 그런 느낌을 받았나? 그리고 AlphaGo 이야기도 듣고 싶다.

<strong>세인 레그:</strong>
흥미로운 순간은 여러 번 있었다. 첫 번째 큰 돌파구는 <strong>DQN이 Atari 게임을 플레이한 것</strong>이었다. AI가 게임 화면과 점수만 보고 스스로 게임하는 법을 배웠다. 우리가 어떤 규칙을 따로 알려줄 필요가 없었다. 그것이 첫 번째 큰 성과였다.

그다음 AlphaGo가 나왔다. 데미스는 게임을 매우 좋아한다. 체스, 바둑, 포커, 컴퓨터 게임 등 거의 모든 게임을 좋아한다. 바둑은 당시 컴퓨터가 잘하지 못하는 대표적인 게임이었다. 체스나 체커 같은 게임은 이미 컴퓨터가 잘했지만, 바둑은 훨씬 복잡했다. 가능한 수가 너무 많고, 깊이가 매우 컸다.

그래서 데미스는 “가장 어려운 게임을 해보자”고 생각했다. 바둑이 바로 그런 게임이었다.

우리는 딥러닝 접근법이 충분히 성숙해지고 있다고 봤다. 기존 방식처럼 모든 가능성을 탐색하는 것은 바둑에서는 불가능했다. 경우의 수가 너무 많기 때문이다. 그래서 딥러닝을 이용해 현재 판세가 얼마나 좋은지 더 직관적으로 평가하고, 탐색할 만한 좋은 후보 수를 추천하게 했다.

여기에 <strong>자기 자신과 대국하면서 배우는 self-learning loop</strong>, 즉 자기학습 루프가 결합되었다. 자신이 둔 수에서 배우고, 실수를 통해 개선하는 방식이다. 이 조합이 AlphaGo의 돌파구로 이어졌다.

<hr />

<h2>5. DeepMind의 사업모델과 구글 인수</h2>
<strong>사회자:</strong>
창업자로서 나는 늘 현금흐름을 걱정한다. DeepMind는 AlphaGo 전까지 뚜렷한 비즈니스 모델이 있어 보이지 않았다. 어떻게 현금흐름을 해결했나? 그리고 DeepMind의 문화는 어땠나?

<strong>세인 레그:</strong>
구글에 인수되기 전에는 AI 연구자들이 지금처럼 비싸지 않았다. 지금은 상황이 많이 바뀌었다. 연구자들의 몸값도 매우 높아졌고, 컴퓨팅 비용도 엄청나게 커졌다.

이것이 우리가 구글에 가야 했던 이유 중 하나다. 우리는 이 분야가 점점 거대한 자본과 컴퓨팅을 요구하게 될 것이라는 것을 알고 있었다. 그래서 이를 감당할 수 있는 회사와 파트너가 되어야 했다.

구글과 함께하게 된 핵심 이유는 래리 페이지였다. 그는 처음부터 AI를 믿었다. 그는 구글의 미래가 AI 회사가 되는 것이라고 생각했다. 검색도 결국 지능적인 정보처리의 한 단계이고, 그 끝에는 인공지능이 있다고 본 것이다.

래리 페이지는 우리가 하려는 일을 강하게 믿었고, 구글의 재정적 힘을 활용해 AGI라는 미션을 추구할 수 있게 해주었다. 그래서 현금흐름 문제는 구글과의 결합을 통해 해결되었다.

<hr />

<h2>6. 다른 패널의 발언: Gemini, VEO, 시각·공간 추론</h2>
<strong>사회자:</strong>
최근 OpenAI와 Google 등에서 벌어지는 일 중 무엇이 흥미로운가? 그리고 세인 레그와 함께 일하는 것은 어떤 의미인가?

<strong>공동 패널:</strong>
나는 기술적으로 Gemini와 VEO 사이에 있는 프로젝트를 하고 있다. Gemini는 언어 모델이고, VEO는 비디오 생성 모델이다. 내가 6개월 전쯤 평가에 관한 논문을 썼는데, 세상의 모든 정보와 지능을 포착하려면, 특히 AGI를 생각하면 <strong>시각적·공간적 학습</strong>이 중요하다. 세인도 지속학습과 함께 이 부분에 동의할 것이다.

나는 Gemini와 VEO 사이의 reasoning 프로젝트를 공동으로 이끌고 있다. 모델링과 협업을 포함해 이런 것들이 작동하게 만드는 일을 하고 있다. 또 작은 팀으로 Gemini의 reasoning model, thinking model도 작업하고 있다. 코딩에서는 우리가 조금 뒤처져 있을 수 있지만, 빠르게 따라잡을 것이다.

내가 비즈니스 리더나 정책결정자들과 이야기하는 이유는 AGI가 단순히 기술자들만의 문제가 아니기 때문이다. AGI는 모든 분야의 최고의 지능을 이해해야 하는 문제다. 비즈니스 리더들이 어떻게 생각하는지, 미디어 리더들이 어떻게 생각하는지, 정책결정자들이 어떻게 생각하는지 듣는 것이 중요하다.

또 AGI 이후 사회를 준비해야 한다. AGI는 사회를 움직이는 인간 지능을 복제하는 것이기 때문에 모든 사회를 바꿀 것이다. 그래서 대화를 시작해야 한다. 그리고 AGI 이후 가장 가치 있는 자산은 결국 사람, 인간관계, 신뢰라고 생각한다. AI가 많은 코딩과 생산적 작업을 대체하더라도, 인간관계와 신뢰는 시간이 걸려 형성되는 고유한 자산이다.

<hr />

<h2>7. 일본과 AI: 소비자에서 리더로 갈 수 있는가</h2>
<strong>사회자:</strong>
일본은 고령화, 재난, 에너지 회복력 같은 문제에서 세계적 실험실로 여겨진다. 일본은 어떻게 AI 소비자에서 벗어나, 이런 현실 문제에 AI를 적용하는 리더가 될 수 있을까?

<strong>무라카미 패널:</strong>
일본은 여러 어려운 문제의 최전선에 있는 나라다. 고령화, 재난 회복, 적은 인구로 많은 일을 해야 하는 문제 등이 있다. AI는 이런 문제를 해결하는 데 큰 도움을 줄 수 있다.

나는 원래 자연어처리 연구자였기 때문에, 지금의 AI 기술에 큰 충격을 받았다. 통역과 번역도 매우 좋아졌다. 일본은 더 적은 사람으로 더 많은 일을 해야 하므로 AI의 지원이 중요하다.

다만 통계 모델 시대의 AI와 생성형 AI 시대의 AI는 다르다. 과거 통계 모델은 데이터에서 과거에 있었던 답을 뽑아내는 성격이 강했다. 하지만 생성형 AI는 이전에 없던 답을 생성한다. 이것은 좋은 점이자 위험한 점이다.

좋은 점은 AI가 새로운 세계를 만드는 데 도움을 줄 수 있다는 것이다. 하지만 나쁜 점은 AI가 우리가 기대하는 행동 범위 안에 머물도록 해야 한다는 것이다. AGI 시대의 AI는 인간처럼 행동할 수 있다. 인간 행동을 완전히 통제할 수 없는 것처럼, AGI도 완벽히 통제할 수 없다. 그래서 AI safety와 데이터 거버넌스를 계속 고민해야 한다.

<hr />

<h2>8. AlphaGo와 현실 세계 AI의 안전성 차이</h2>
<strong>사회자:</strong>
AlphaGo는 닫힌 환경의 게임에서 승리하는 문제였다. 하지만 오늘날 AI는 훨씬 넓고 복잡한 현실 문제를 다룬다. 이런 열린 환경에서 인간에게 이익이 되도록 하고 안전하게 만들려면 어떻게 해야 하나?

<strong>세인 레그:</strong>
이것은 매우 중요한 질문이다. 과거 AI 시스템은 특정한 하나의 일만 했다. AlphaGo는 바둑 수만 둘 수 있었다. 바둑 수를 두는 것에서 오는 위험은 매우 제한적이다.

하지만 AI가 점점 일반화되고 현실 세계의 많은 것들과 상호작용하기 시작하면, 문제가 되는 행동의 범위가 매우 넓어진다. 우리는 세상의 모든 가능한 상황에서 모든 행동을 테스트할 수 없다. 그것은 불가능하다.

그래서 다른 접근이 필요하다.

우선 모델의 <strong>robustness</strong>, 즉 견고성을 확인해야 한다. 모델이 세상을 제대로 이해하고 있는지 봐야 한다. 또 적대적 상황에서 테스트해야 한다. 일부러 모델이 나쁘게 행동하도록 유도해보고, 그래도 적절한 행동을 유지할 수 있는지 확인해야 한다.

또 <strong>interpretability</strong>, 즉 해석가능성이 중요하다. 모델 내부에서 무슨 일이 벌어지는지 들여다봐야 한다. 모델이 말하고 행동하는 것과 내부에서 실제로 처리되는 내용이 일치하는지 봐야 한다. 사람의 말만 듣는 것이 아니라, 머릿속을 들여다보고 생각이 일관적인지 확인하는 것과 비슷하다.

그리고 배포 이후에는 <strong>monitoring</strong>이 필요하다. AI가 현실 세계에서 행동할 때, 다른 시스템이 그것을 관찰하고 문제 행동을 빠르게 감지할 수 있어야 한다.

또 하나 중요한 것은 AI 시스템의 <strong>constitution</strong>, 즉 일종의 헌법이다. AI가 어떤 가치와 선호, 사회적 규범을 가져야 하는지 적어주는 원칙 체계가 필요하다.

여기에는 어려운 철학적·윤리적 문제가 있다. 어떤 행동은 법 때문에 금지되어야 한다. 어떤 행동은 비윤리적이기 때문에 피해야 한다. 어떤 행동은 문화에 따라 다를 수 있다. 일본에서는 이렇게 행동해야 하지만 다른 나라에서는 다르게 행동해야 할 수도 있다. 기업 입장에서는 브랜드에 맞지 않는 행동을 제한하고 싶을 수도 있다.

따라서 AI의 가치와 행동 원칙을 어떻게 정할 것인가는 정부, 사회, 철학자, 윤리학자, 기업이 함께 고민해야 할 문제다.

<hr />

<h2>9. AGI라는 단어를 만든 사람으로서, 지금 우리는 AGI에 얼마나 가까운가</h2>
<strong>사회자:</strong>
검색해보면 박사님은 AGI라는 개념을 만든 사람으로 나온다. 실제로 AGI라는 단어를 만든 것인가? 그리고 우리는 AGI에 얼마나 가까운가? AGI에 도달하면 그 다음에는 무슨 일이 벌어지는가?

<strong>세인 레그:</strong>
나는 2002년에 AGI라는 용어를 제안했다. 당시 AI 연구는 매우 구체적인 문제를 다루는 경우가 많았다. 나는 오래된 꿈, 즉 다양한 일을 할 수 있는 일반적인 사고 기계를 가리킬 용어가 필요하다고 생각했다. 그래서 AGI라는 표현을 제안했다.

지금은 AGI에 대한 정의가 너무 많다. 그래서 혼란이 생긴다. 어떤 사람은 이미 AGI가 왔다고 하고, 어떤 사람은 2년 뒤라고 하고, 어떤 사람은 20년 뒤라고 한다. 하지만 서로 다른 정의를 쓰고 있기 때문에 혼란스럽다.

그래서 나는 최근 <strong>minimal AGI</strong>라는 표현을 쓴다. 내가 AGI라고 부르기 위해 필요한 최소 조건이라는 뜻이다.

minimal AGI는 AI가 보통 인간이 일반적으로 할 수 있는 모든 인지적 일을 할 수 있는 상태다. 어떤 영역에서는 인간보다 더 잘할 수도 있다. 하지만 적어도 보통 인간의 인지능력보다 아래에 있는 영역이 없어야 한다. 인간에게 일반지능이 있다고 말하듯이, 그 수준에 도달하면 AI에도 일반지능이 있다고 말할 수 있다.

몇 년 전만 해도 우리는 그 수준에서 매우 멀리 있었다. 그런데 최근 Claude, ChatGPT, Gemini 같은 AI 시스템들이 일반적인 인간이 할 수 있는 많은 인지적 일에 점점 가까워지고 있다. 물론 전문가 수준이 아니라, 일반적 인간 수준을 말하는 것이다.

아직 약점이 있다. 하나는 시각 이해다. 또 하나는 내가 앞서 말한 지속학습이다. AI는 아직 인간처럼 오랜 기간 계속 배우는 능력이 부족하다. 이것이 AI 능력을 크게 제한한다.

하지만 나는 앞으로 <strong>2년 안에 인간 수준의 지속학습과 시각 이해에 도달할 확률이 50% 정도</strong>라고 본다. 빠르면 1년일 수도 있고, 늦으면 3년, 4년, 5년이 걸릴 수도 있다. 하지만 5년보다 더 오래 걸린다면 나는 놀랄 것이다.

그렇다고 minimal AGI가 온 순간 세상이 하룻밤 사이에 완전히 바뀌지는 않는다. AI가 보통 인간이 할 수 있는 인지적 일을 한다는 뜻이지, 보통 사람이 양자이론의 후속 이론을 발명할 수 있는 것은 아니기 때문이다.

중요한 점은 AI 능력이 매우 <strong>jagged</strong>, 즉 들쭉날쭉하다는 것이다. 예를 들어 Gemini는 이미 150개 언어를 말할 수 있다. 언어 능력과 일반 세계지식에서는 이미 인간 평균을 넘어선다. 수학에서도 국제 수학대회 수준이나 일부 연구수학 수준에 이르는 경우가 있다.

하지만 어떤 영역에서는 아직 보통 인간보다 못하다. 그래서 minimal AGI에 도달한다는 것은 AI가 더 이상 인간이라면 하지 않을 이상한 실패를 하지 않는 수준의 견고성을 갖게 된다는 뜻이다. 그리고 산업 혁명은 특정 분야에서 AI가 전문가 수준이나 초인간 수준에 도달할 때 일어날 것이다.

<hr />

<h2>10. AI 멸종 위험 서명과 세인 레그의 걱정</h2>
<strong>사회자:</strong>
박사님은 AI가 인류 멸종 위험을 초래할 수 있다는 취지의 서명에 참여했다. 왜 그런 입장을 갖게 되었나? 무엇이 걱정되나?

<strong>세인 레그:</strong>
분명히 말하자면, 나는 앞으로 몇 년 동안의 AI에 대해 지나치게 걱정하지는 않는다. minimal AGI에 도달하더라도 당장 극단적인 위험이 생긴다고 보지는 않는다.

물론 강력한 기술에는 항상 오용 가능성이 있다. 어떤 사람들은 AI를 사이버 공격에 사용할 것이고, 범죄 활동에 사용할 것이고, 여러 나쁜 일에 사용할 것이다. 동시에 다른 사람들은 의료 연구, 과학 문제 해결, 사회 문제 해결에 사용할 것이다. 강력한 기술은 항상 이런 양면성을 가진다. 그래서 사회가 주의를 기울이고, 적절한 규칙과 규제를 만들어야 한다.

더 극단적인 위험은 미래에 AI가 매우 지능적이고, 초인간적으로 지능적인 존재가 될 때의 문제다. 인간 수준의 지능을 가진 AI를 안전하고 윤리적이고 신뢰할 수 있게 만드는 방법은 알 수 있을지도 모른다. 하지만 인간보다 훨씬 뛰어난 지능을 가진 시스템에 대해서도 그 방법을 아는가? 현재 우리는 답을 모른다. 그래서 위험 요소가 있다.

내 희망은 우리가 minimal AGI에 가까워지면서 이 시스템들을 인간 가치에 잘 정렬시키는 방법도 매우 잘 알게 되는 것이다. 실제로 지금은 정렬이 점점 나아지고 있다. 몇 년 전 사람들이 걱정했던 것보다 긍정적인 방향으로 가고 있다고 본다.

이 추세가 계속된다면 미래에는 초인간적 AI가 <strong>초인간적으로 윤리적이고 책임 있는 존재</strong>가 될 수도 있다. 그러면 우리는 엄청난 능력을 가진 동시에, 대부분의 인간보다 더 일관되게 윤리적인 AI와 함께 사는 좋은 세계를 가질 수 있다. 그것이 이상적인 미래다.

하지만 아직은 너무 먼 미래이고, 우리가 모든 답을 아는 것은 아니다. 그래서 위험은 남아 있다.

<hr />

<h2>11. 교육은 어떻게 바뀔 것인가</h2>
<strong>사회자:</strong>
나는 비즈니스 스쿨을 운영하고 있다. AI 시대에는 교육이 바뀔 것이라는 말이 많다. 필요한 스킬셋도 달라질 것이다. 학교는 어떻게 바뀌어야 한다고 보는가? 자녀나 손주가 있다면 어떻게 교육받기를 원하는가?

<strong>세인 레그:</strong>
좋은 질문이고 어려운 질문이다. 변화가 매우 많을 것이기 때문이다.

사회의 여러 영역을 생각해보자. 법, 회계, 금융, 교육, 문학, 의학, 수학, 대학의 거의 모든 학과에서 인간 지능이 중요하다. 그런데 값싸고 빠른 기계지능이 풍부해지면 이 모든 영역이 변한다. 법이 변하고, 경제가 변하고, 교육도 변한다.

교육에서 가장 큰 가능성 중 하나는 <strong>개인화된 튜터링</strong>이다. 예를 들어 내가 일본어를 배우고 싶다면, 꼭 일본인 선생님이 옆에 있을 필요가 없다. AI가 나와 대화하면서 일본어를 가르칠 수 있다. AI는 150개 언어를 알고 있고, 내가 무엇을 이해하고 무엇을 어려워하는지 파악할 수 있다. 발음, 문법, 개념 이해 등에서 내가 약한 부분에 맞춰 학습을 조정할 수 있다.

수학, 미적분, 프로그래밍 언어도 마찬가지다. 교육의 가능성은 엄청나다. 지금은 부유한 가정의 아이들이 개인 과외를 받을 수 있다. 하지만 미래에는 AI 덕분에 훨씬 더 많은 아이들이 저렴하게 개인 맞춤형 교육을 받을 수 있다.

하지만 또 다른 질문도 있다. 지금까지 교육은 문화적 풍요와 사고 확장을 위한 목적도 있었지만, 동시에 직업을 얻고 생계를 유지하기 위한 실용적 목적도 컸다. 그런데 미래에 AI가 많은 인지 노동을 잘하게 되면, 소프트웨어 엔지니어링이나 수학을 배우는 경제적 가치가 달라질 수 있다. AI가 회계, 금융, 세법, 이민법, 수학 등 많은 일을 하게 될 수 있기 때문이다.

따라서 우리는 교육의 우선순위와 목적 자체를 다시 생각해야 한다. 기계지능이 풍부한 사회에서 교육은 무엇을 위한 것인가? 이 질문이 중요해질 것이다.

<hr />

<h2>12. 왜 AI 능력은 들쭉날쭉한가</h2>
<strong>공동 패널:</strong>
세인 레그가 말한 AI 능력의 jaggedness, 즉 들쭉날쭉함에 대해 덧붙이고 싶다. 기술 발전 속도를 결정하는 요인은 두 가지다.

하나는 그 기술을 만드는 것이 얼마나 어려운가다. 어떤 영역은 데이터가 부족할 수 있고, 좋은 아키텍처가 없을 수 있고, GPU나 TPU 같은 하드웨어가 충분하지 않을 수 있다. 그래서 어렵다.

다른 하나는 그 기술이 얼마나 큰 경제적 가치를 가져오는가다. 이 두 축이 발전 속도를 결정한다.

예를 들어 시각 추론에서는 아직 약한 부분이 있다. 어떤 최근 벤치마크에서는 최고 모델이 Gemini였지만, 그래도 어린아이 수준의 시각 이해보다 못한 사례가 있다. 반면 같은 모델이 Google DeepMind, OpenAI 등의 최고의 소프트웨어 엔지니어보다 더 나은 경우도 있다. 이것이 AI 능력이 들쭉날쭉한 이유다.

<hr />

<h2>13. AGI 자체가 위험한가, 인간의 사용이 위험한가</h2>
<strong>무라카미 패널:</strong>
AGI 안전과 위험에 대해 하나 덧붙이고 싶다. 나는 세계경제포럼의 AGI 관련 위원회에서도 논의했는데, 결론은 AGI 자체가 위험이라기보다는, <strong>인간이 AI를 어떻게 사용하느냐가 위험</strong>이라는 것이다.

기술은 항상 중립적이다. 인간이 좋은 방식으로 사용하면 좋은 것이 되고, 나쁜 방식으로 사용하면 나쁜 것이 된다. 그러므로 AGI 자체가 위험이라기보다, AGI를 어떻게 다루고, 어떻게 사용하고, 어떻게 함께 살아갈지가 중요하다.

<strong>세인 레그:</strong>
나도 하나 더 추가하고 싶다. AGI가 오고, 많은 인지 노동을 할 수 있게 되고, 로보틱스까지 결합될 수 있다면 사회에 큰 혼란이 생길 수 있다. 이것은 정치적·사회적 불안정의 위험이다.

정부는 이 변화를 관리해야 한다. 새로운 기술을 받아들이지 않으면 뒤처진다. 엄청난 생산성 향상을 놓치게 된다. 하지만 동시에 변화가 너무 크기 때문에 사회가 적응할 수 있도록 관리해야 한다. 그렇지 않으면 여러 문제가 생길 수 있다.

그래서 나는 이런 사회적·정치적 위험도 매우 중요하다고 본다.

<hr />

<h2>14. 일본 정부는 무엇을 해야 하는가</h2>
<strong>사회자:</strong>
여기에는 정치인들도 많다. 일본 정부가 AI와 관련해서 무엇을 해야 한다고 조언하겠나?

<strong>세인 레그:</strong>
정부의 역할은 매우 중요하다. 이 기술은 특정 산업이나 특정 응용에만 국한된 기술이 아니다. <strong>사회 전체를 변형시키는 기술</strong>이다. 따라서 국민을 대표하는 정부가 이 변화를 이끌 책임이 있다.

기업들도 책임 있게 행동하려고 하겠지만, 궁극적으로는 선출된 정부가 국민을 대표한다. 그래서 정부가 매우 중요한 역할을 해야 한다.

지금 가장 중요한 변화는 <strong>정신적 태도의 변화</strong>다. 강력한 인공지능은 더 이상 흥미로운 아이디어나 개념적 가능성이 아니다. 그것은 이미 오늘 현실로 나타나고 있고, 앞으로 몇 년 동안 계속 전개될 것이다. 이것이 지금 오고 있다는 사실을 진지하게 받아들여야 한다.

그렇게 받아들인다면, 안전 연구기관을 강하게 지원해야 한다. AI에 대해 진지하게 논의하는 포럼도 있어야 한다. 고용 변화에 어떻게 대응할 것인지, 국가 전략에 어떤 영향을 줄 것인지, 어떤 조직을 만들어야 할지, 핵심 개발자들과 어떻게 상호작용해야 할지, 일본 안에서 무엇을 해야 하고 신뢰할 수 있는 국가들과 무엇을 협력해야 할지 논의해야 한다.

이 모든 질문을 지금부터 진지하게 다뤄야 한다. 그래야 AI가 계속 전개될 때 일본이 그 혜택을 제대로 얻을 수 있다.

<hr />

<h2>15. minimal AGI 이후 경쟁 구도</h2>
<strong>질문자:</strong>
나는 벤처캐피털리스트다. minimal AGI 이후 비즈니스와 경쟁 구도는 어떻게 변할까? AGI들 사이의 경쟁, 애플리케이션 레이어의 경쟁, 수직통합은 어떻게 될까?

<strong>세인 레그:</strong>
프런티어 모델 개발자는 앞으로도 많지 않을 것이다. 특히 중국 같은 곳에서도 플레이어들이 나오겠지만, 전 세계적으로 최전선에 있는 frontier lab의 수는 당분간 많아지기 어렵다. 비용이 너무 높기 때문이다.

최전선에서 경쟁하려면 매년 수십억 달러를 써야 한다. 그런 일을 100개 회사가 동시에 하는 것은 경제적으로 말이 안 된다. 그래서 현재는 OpenAI, Anthropic, Google DeepMind 정도가 진짜 프런티어에 있다고 볼 수 있다. 앞으로 5개가 될 수도 있고, 10개가 될 수도 있지만, 100개는 아닐 것이다. 만약 너무 많아지면 서로 합병해서 자원을 합칠 것이다.

다만 한 세대 뒤처진 모델을 쓰는 것은 훨씬 저렴해질 수 있다. 컴퓨팅 비용도 낮아지고, 알고리즘 효율도 매년 좋아진다. 6개월이나 1년 뒤처진 수준이면 훨씬 싸게 사용할 수 있다.

또 경쟁이 치열하기 때문에 프런티어 모델 접근 가격도 현재는 상당히 낮다. 회사들이 시장점유율을 얻기 위해 경쟁하고 있기 때문이다. 모델 접근 비용은 개발 고정비 전체보다는 실제 배포의 한계비용에 가까워지고 있다. 물론 미래에 발전 속도가 느려지면 경쟁 구조가 달라질 수 있다.

<hr />

<h2>16. 양자컴퓨팅은 AI에 얼마나 중요한가</h2>
<strong>질문자:</strong>
양자컴퓨팅이 예상보다 빨리 오고 있다는 말을 들었다. IBM 연구소에서도 초기 프로토타입이 나오고, 2028년쯤 은행 산업에 영향을 줄 수 있다고 하더라. 양자컴퓨팅의 발전은 AI에 어떤 영향을 줄까?

<strong>세인 레그:</strong>
개인적인 견해로는, 양자컴퓨팅은 대부분의 영역에서 그렇게 중요하지 않을 가능성이 크다.

양자컴퓨팅을 공부해보면, 대부분의 일반 알고리즘을 양자컴퓨터에서 그대로 실행할 수 없다. 양자 알고리즘은 잘못된 답들이 서로 상쇄되고 올바른 답이 남도록 매우 영리하게 설계해야 한다. 이것은 매우 어렵다.

양자컴퓨팅이 할 수 있는 몇 가지 특정한 일이 있다. 예를 들어 큰 수의 소인수분해는 일부 암호체계를 깨는 데 사용될 수 있다. 그런 일이 벌어지면 여러 암호체계가 깨질 수 있다. 하지만 사람들은 양자공격에 취약하지 않은 암호체계로 옮겨갈 것이다.

또 다른 예로 테이블 조회 같은 작업이 있지만, 이미 고전 컴퓨터에서도 이진트리 인덱싱 같은 방식으로 매우 빠르게 처리된다. 그래서 양자컴퓨팅으로 복잡도를 더 낮추는 것이 실제로는 큰 차이를 만들지 않을 수 있다.

내가 양자컴퓨팅이 정말 중요할 수 있다고 보는 분야는 <strong>재료과학</strong>이다. 분자 상호작용은 양자적 성격을 가지기 때문에, 양자컴퓨터가 고전컴퓨터보다 훨씬 효과적으로 탐색할 수 있다. 재료과학에서는 중요한 혁신이 될 수 있다.

하지만 대부분의 다른 분야에서는 그렇게 큰 영향을 주지 않을 수 있다. 그리고 앞으로 몇 년 동안은 고전적 컴퓨팅이 엄청나게 증가할 것이기 때문에, 그것만으로도 놀라운 결과가 나올 것이다.

<hr />

<h2>17. 개발도상국의 빅테크 의존 문제와 일본의 역할</h2>
<strong>질문자:</strong>
개발도상국과 이야기하다 보면, 미국이나 중국의 거대 기술기업에 너무 의존하게 되는 것에 대한 우려가 크다. 일본 산업의 어떤 제품이나 서비스가 이런 의존을 줄이는 데 도움이 될 수 있을까?

<strong>공동 패널:</strong>
한 줄로 답하면, 특히 로보틱스 영역에서는 미국과 유럽만으로는 중국과 경쟁하기 어렵다고 본다. 제조 공급망 전체가 중요하기 때문이다. 서방이 physical AI에서 중국과 경쟁하려면 일본 같은 나라가 반드시 필요하다. 일본은 거의 유일하게 그런 역할을 할 수 있는 동맹국이라고 생각한다.

<hr />

<h2>18. 인간이 AI에 제약을 거는 것이 AGI·ASI의 최대 장벽인가</h2>
<strong>질문자:</strong>
일부 전문가들은 AGI나 ASI 실현의 가장 큰 장벽은 인간이 AI에 부여하는 여러 제약이라고 말한다. 이 주장에 대해 어떻게 생각하나? 우리는 어떻게 해야 하나?

<strong>세인 레그:</strong>
전사본에서는 이 질문에 대한 직접 답변이 길게 나오지는 않는다. 다만 전체 맥락상 세인 레그의 입장은, AI에 아무 제약도 주지 말자는 쪽은 아니다. 오히려 그는 AI가 현실 세계에서 폭넓게 행동할수록 안전성, 견고성, 해석가능성, 모니터링, constitution이 필요하다고 본다.

즉 인간이 부여하는 제약이 발전을 늦출 수는 있지만, 강력한 AI가 사회 전체에 영향을 미치는 기술인 이상, 제약과 규범 설계는 피할 수 없는 문제라고 보는 쪽에 가깝다.

<hr />

<h2>19. Anthropic과 미국 정부·국방부의 관계</h2>
<strong>질문자:</strong>
최근 Anthropic과 미국 정부, 특히 국방부 사이의 상호작용을 어떻게 보는가? 그 함의는 무엇인가?

<strong>세인 레그:</strong>
우리는 큰 관심을 갖고 지켜보고 있다. 앞서 말했듯이 어느 시점이 되면 정부들은 이 기술에 관심을 갖게 된다. AI는 사회 변혁에 매우 중요한 기술이고, 전략적으로도 중요하며, 군사, 금융, 의학 등 거의 모든 영역에 중요하기 때문이다.

그래서 정부와 군이 점점 더 관심을 갖게 되는 것은 예상 가능한 일이다. 이것은 매우 강력하고 범용적인 기술의 현실이다.

다만 우리는 이 문제에 적극적으로 관여하고 있지는 않다. 현재로서는 Anthropic과 미국 정부 사이의 일이다. 우리는 관심 있게 지켜보고 있다.

<hr />

<h2>20. Human-centric AI와 human-in-the-loop</h2>
<strong>질문자:</strong>
AGI 시대에 human-centric AI 또는 human-in-the-loop에서 가장 중요한 것은 무엇인가? EU AI Act처럼 사전에 설계하려는 접근이 실패하고 있는 것처럼 보이기도 한다. 법과 정부는 무엇을 해야 하나?

<strong>무라카미 패널:</strong>
인간을 어떻게 포함시킬 것인가는 매우 중요한 주제다. 인간이 AI를 오용할 수 있기 때문이다. 모든 질문과 관련된 문제이기도 하다. 우리는 첨단기술과 관련된 문제를 어떻게 다룰지 계속 생각해야 한다.

전사본상 이 부분은 시간이 부족해서 짧게만 답변된다. 하지만 전체 대담의 흐름을 보면, 핵심은 인간이 통제권을 형식적으로 갖는 것만으로는 부족하고, 안전기관, 법, 윤리, 모니터링, 사회적 합의가 함께 필요하다는 방향이다.

<hr />

<h2>21. 마지막 메시지: 일본 지도자들에게 하고 싶은 말</h2>
<strong>사회자:</strong>
마지막으로 일본의 리더들에게 한마디씩 해달라.

<strong>공동 패널:</strong>
일본은 AI 시대를 맞이하는 데 매우 독특하게 기여할 수 있다. 우리는 함께 일하기를 기대한다.

<strong>무라카미 패널:</strong>
일본 정부에 말하고 싶은 것은 AI sovereignty를 너무 좁게 생각하지 말라는 것이다. 일본만의 기술, 일본 안에서만의 기술이라는 식으로 제한해서 생각해서는 안 된다. 더 글로벌하게 생각해야 한다. 일본만 생각하는 것이 아니라, 세계 속에서 일본의 역할을 봐야 한다.

<strong>세인 레그:</strong>
나도 두 사람의 말에 동의한다. 나는 전 세계에서 앞으로 올 일을 제대로 보고, 그것을 진지하게 받아들이고, 사회 전체가 구조적이고 계획적으로 대응할 수 있는 곳을 찾고 있다.

일본은 그런 능력을 가진 나라일 수 있다. 그래서 나는 일본의 비즈니스 리더와 정부 리더들이 이 기술이 매우 강력하며 일본을 변화시킬 것이라는 생각에 열려 있는지 보러 왔다.

일본은 지금부터 AI가 가져올 여러 측면을 진지하게 생각해야 한다. 그렇게 제대로 준비한다면 일본은 다른 나라의 모델이 될 수 있다.

다른 나라들이 나중에 “우리는 AI가 이렇게 올 줄 몰랐다. 이제 어떻게 해야 하지?”라고 할 때, 그들은 일본을 볼 수 있다. “일본은 좋은 계획을 갖고 있고, 올바른 정책과 조치를 마련하고 있다. 일본이 어떻게 생각하는지 배워야겠다”고 말할 수 있다.

내 꿈은 일본이 이 변화를 정말로 받아들이고, 다른 나라들의 롤모델이 되는 것이다.

<hr />

<h1>전체 핵심 요약</h1>
이 인터뷰에서 세인 레그는 매우 짧은 AGI 타임라인을 제시한다. 그는 <strong>지속학습과 시각 이해가 해결되면 minimal AGI에 도달할 수 있으며, 그 가능성이 2년 안에 50% 정도 있다고 본다.</strong> 다만 AGI가 온다고 해서 세상이 하루아침에 완전히 바뀌는 것은 아니고, 산업별로 AI가 전문가·초인간 수준에 도달하는 영역부터 혁명이 일어날 것이라고 본다.

그는 AI 발전에 낙관적이지만 무책임한 낙관론자는 아니다. 안전성, 정렬, 해석가능성, 모니터링, AI의 constitution, 정부의 역할, 교육 변화, 사회적 불안정까지 모두 중요하게 본다.

가장 중요한 메시지는 이거야.
<blockquote><strong>AGI는 더 이상 먼 미래의 철학적 가능성이 아니라, 지금 전개되고 있는 현실이다. 정부와 사회는 AI를 단순한 산업기술이 아니라 사회 전체를 바꾸는 범용 지능 인프라로 보고 지금부터 준비해야 한다.</strong></blockquote>]]></description>
			<author><![CDATA[하이룽룽]]></author>
			<pubDate>Sun, 21 Jun 2026 22:26:21 +0000</pubDate>
			<category domain="https://sub.strongai.kr/?kboard_redirect=5"><![CDATA[인터뷰]]></category>
		</item>
			</channel>
</rss>