인터뷰/예측
샘 알트만 "올해 9월까지, 우리는 AI 연구 인턴으로 50만 개의 A100급 gpu 컴퓨트 사용할 것"
작성자
작성일
2026-06-17 11:57
조회
5
우리는 이런 목표를 세워두고 있다. 올해 9월까지는 A100 기준으로 환산했을 때 GPU 50만 개에 해당하는, 엄청난 컴퓨팅 파워를 AI 연구 인턴처럼 사용하겠다는 것이다. 그리고 2028년 3월까지는 처음부터 끝까지 연구를 수행할 수 있는, 매우 유능한 연구자 수준의 AI를 갖추는 것이 목표다. 그 AI는 완전히 새로운 아키텍처까지 찾아낼 수 있어야 한다.
제가 여기서 여러 연구소들의 표현을 좀 섞고 있다는 건 압니다. 하지만 누군가는 이것을 “데이터센터 안의 천재들의 나라”라고 부르게 될 겁니다. 2년도 채 남지 않았고, 어쩌면 그보다 더 빨리 올 수도 있습니다.
샘 알트만 스탠퍼드 CS153 인터뷰 상세 정리
주제: 스케일, AGI, 스타트업, 교육, 컴퓨트, 그리고 AI의 미래
진행자:샘 알트만을 환영한다. 이 수업은 스탠퍼드에서 내가 학생이었을 때 들었던 여러 경험에서 영감을 받았다. 그중 하나는 테리 위노그라드의 CS47N, 또 하나는 2014년에 샘 알트만이 진행했던 CS183 “How to Start a Startup”이었다. 다시 스탠퍼드에 온 느낌이 어떤가?
샘 알트만:
걸어오면서 생각했다. 시간이 조금만 더 있다면 그 수업의 업데이트 버전을 다시 해보고 싶었다. 지금은 스타트업을 시작하는 방식이 정말 많이 바뀌었다. 그런데 아직 “지금 시대에 스타트업을 어떻게 해야 하는가”에 대해 제대로 된 버전을 본 적이 없다. 그래서 다시 하면 재미있겠다는 생각이 들었다.
진행자:
그 수업은 2014년에 했고, OpenAI는 2015년쯤 설립된 것으로 기억한다. 맞나?
샘 알트만:
거의 2016년이라고 보면 된다.
진행자:
겉에서 보기에는 당시 샘이 스타트업을 어떻게 해야 하는지에 대한 작동 이론을 갖고 있었고, 이후 OpenAI를 통해 그것을 실행해본 것처럼 보였다. 그런 평가가 맞나?
샘 알트만:
OpenAI는 지난 몇십 년간 실리콘밸리에서 가장 이상한 스타트업 중 하나였다고 생각한다. 처음에는 연구소였다. 사실상 회사가 아니었다.
보통 스타트업은 제품 회사로 시작한다. 제품을 만들고, 성장하다가, 성장 속도가 둔화되면 연구소를 붙인다. 다음에 무엇을 해야 할지 찾기 위해 연구 조직을 추가하는 식이다. 그런데 우리는 반대였다. 우리는 먼저 연구소였고, 나중에 스타트업을 덧붙여야 했다.
그런 방식은 추천하지 않는다. 매우 특이한 방식이다. 다만 내가 말하고 싶은 것은, 우리는 AI를 만들기 전까지는 여전히 “AI 이전 시대의 스타트업 규칙”을 따랐다는 것이다. 그런데 지금 최고의 스타트업들이 하는 방식을 보면, 몇 년 전과도 완전히 다르다. 누군가가 이 주제로 새 수업을 해야 한다고 생각한다. 아마 나는 못 하겠지만, 누군가는 해야 한다.
진행자:
그렇다면 지금 데이터를 바탕으로 그 수업을 업데이트한다면 가장 큰 변화는 무엇인가?
샘 알트만:
이제는 감당 가능한 수준의 토큰 비용만으로도, 예전 같으면 100명의 정말 뛰어난 엔지니어 팀이 해야 했던 일을 스타트업이 할 수 있다. 과거에는 그런 선택지가 아예 없었다. 그런데 지금은 가능하다.
그래서 스타트업이 감당할 수 있는 문제의 크기, 가질 수 있는 야망의 수준, 움직일 수 있는 속도, 동시에 처리할 수 있는 일의 양이 완전히 달라졌다.
진행자:
그렇다면 학생들에게 학기 말에 어떤 문제를 풀라고 할 것인가? 문제의 성격도 달라졌나?
샘 알트만:
나는 사람들이 풀 문제를 지정해주는 방식은 잘 작동하지 않는다고 생각한다. 내가 아주 좋은 스타트업 아이디어를 떠올릴 수 있다면, 그것은 이미 많은 사람에게도 꽤 명백한 아이디어일 가능성이 크다.
OpenAI를 시작했을 때, 전 세계에서 AGI를 진지하게 시도하는 곳은 후하게 봐도 네 곳 정도였다. 그런 걸 찾아야 한다. 지금도 자동화된 코딩 시대 이전에는 전혀 불가능했고, 아직 거의 아무도 알아차리지 못했지만, 곧 수조 달러 시장이 될 무언가가 있을 것이다. 지금은 네 회사 정도만 하고 있을 수도 있다.
하지만 나는 그게 뭔지 모른다. 학생들이 나보다 더 잘 알 가능성이 크다. 내 머리는 OpenAI에 너무 많이 점령되어 있다. 누군가가 정해준 아이디어로 일하는 것은 아마 원하는 방향이 아닐 것이다.
진행자:
이 수업은 시스템 수업이기 때문에, 특정 문제를 시스템 관점에서 어떻게 분해하고 해결하는지 이야기해보면 학생들에게 도움이 될 것 같다. 2014년 수업에서도 스케일에 대해 조금 이야기했었고, 이후 샘은 공개적으로도 계속 스케일을 강조해왔다. 지금은 스케일이라는 개념을 어떻게 이해하나?
샘 알트만:
내가 만족할 만한 이론적 설명은 없다. 그래서 이 말을 하기가 약간 조심스럽다. 하지만 경험적으로는 맞는 것처럼 보인다.
내 커리어에서 본 가장 흥미로운 일들은 거의 모두 스케일과 관련이 있었다. 어떤 것이 규모가 커졌을 때 새로운 성질이 나타나거나, 사람들이 예상한 것보다 훨씬 더 오래 스케일링의 수익이 지속되는 경우였다.
이건 AI 모델의 손실 곡선에서도 나타난다. 하지만 AI에만 국한된 것은 아니다. 똑똑한 사람들을 많이 모아 하나의 문제를 생각하게 할 때도 그렇고, 연구 환경에서도 그렇고, 기업의 규모의 경제에서도 그렇다.
나는 이것을 Y Combinator에서 배웠다. 많은 사람이 “YC가 너무 커졌다. 배치당 회사 수를 줄여야 한다. 예전처럼 한 배치에 10개 회사만 있을 때가 좋았다”고 말했다. 꽤 똑똑한 사람들도 그렇게 말했다. 솔직히 유혹적이었다. 그렇게 하면 일이 훨씬 줄어들었을 테니까.
하지만 YC가 작동한 마법의 큰 부분은 배치 내부의 네트워크 효과였다. 그것은 스케일에서 나타난 창발적 성질이었다. 아무도 같은 방식으로 스타트업을 대규모로 지원해본 적이 없었기 때문에, 그런 관찰을 한 적도 없었다. 10분의 1, 100분의 1 규모에서는 아예 존재하지 않던 무언가가 규모가 커지자 나타났다.
그래서 이미 작은 규모에서 흥미롭게 작동하는 무언가가 있고, 사람들이 아직 시도하지 않은 규모까지 밀어붙일 수 있다면, 대체로 좋은 생각인 경우가 많았다. 그리고 사람들은 그런 시도를 충분히 하지 않는다.
진행자:
AI 모델을 스케일링할 때도 그랬나?
샘 알트만:
그렇다. 우리가 AI 모델을 정말 스케일링하겠다고 했을 때, 이 분야의 천재들 중 많은 사람은 “이건 별로 작동하지 않는다”, “과학적으로 흥미로운 결과가 아니다”, “규모가 커지면 좋아진다는 건 이미 보여줬는데 왜 계속 키우냐”고 말했다.
YC 사례도 그렇고, 스타트업 창업자들을 볼 때도 그렇다. 사람들은 “이걸 키우면 뭔가 흥미로운 일이 생길 수도 있지만, 구체적이지 않은 이유로 걱정된다”고 말한다. 그런데 많은 사례를 돌아보면, 회사를 여러 방식으로 스케일한 사람들에게는 거의 항상 흥미로운 일이 있었다.
시스템 설계 관점에서 사람들이 스케일을 충분히 시도하지 않는 이유도 있다. 규모를 키우면 무언가가 더 빠른 속도로, 예측하기 어려운 방식으로 망가지기 때문이다. 진짜로 무언가를 스케일하려면 언제나 조금은 망가진 상태를 감수해야 한다. 그리고 똑똑한 사람들이 “왜 이렇게 하면 안 되는지”, “너무 야망을 갖지 말라”, “너무 커지지 말라”, “작게 해보자”고 말한다.
AI 모델을 키울 때도 문제가 여러 층위로 있었다. 기술적으로 가능한가? 1만 개, 10만 개 GPU에 걸친 학습을 하는 것은 당시 미친 일처럼 보였다. 거대한 엔지니어링 역량이 필요했다. 자본 요구도 컸다. 이 정도 위험을 감수할 사업이 어떻게 가능하냐는 질문도 있었다. 문화적 문제도 있었다. 연구자들은 “그 많은 컴퓨트를 왜 한 프로젝트에 몰아주냐, 여러 프로젝트에 나눠야 하는 것 아니냐”고 말했다.
그래서 각각의 어려운 영역, 각각의 하지 말아야 할 이유를 분해하고 하나씩 해결하는 것이 중요했다.
진행자:
스케일에서 가장 어려운 것은 인간 측면의 시스템 설계인 것 같다. 사람들은 과거의 정신 모델과 기대를 갖고 있고, 시스템이 커질수록 인간 쪽이 가장 고치기 어려운 부분이 된다. 새로운 시스템을 이해하지 못하는 사람들을 규모 있게 조직하는 문제에 대해 무엇을 배웠나?
샘 알트만:
명확한 목표, 거기에 도달하기 위한 명확한 계획, 그리고 그 과정에서 어떻게 의사결정을 할 것인지에 대한 명확한 답이 중요하다.
우리가 모델 스케일링을 결정했을 때도 많은 사람이 “이건 안 될 것이다”, “문제가 생길 것이다”, “더 다양한 포트폴리오가 필요하다”고 말했다. 하지만 우리가 “우리는 딥러닝 스케일링에 베팅한다. 이것이 우리의 방향이다. 틀리면 실패하겠지만, 우리는 이것을 한다”고 말하고, 왜 그렇게 믿는지, 성공하면 세계가 어떤 상태가 될 수 있는지 설명했을 때 그것은 강력했다.
또 한 가지는 사람은 지수적 변화를 생각하는 데 능숙하게 진화하지 않았다는 것이다. 사람들은 스케일링 법칙이 지수적으로 계속될 수 있다는 것, 매출이 지수적으로 성장할 수 있다는 것, 조직이 지수적으로 복잡한 일을 감당할 수 있다는 것을 상상하기 어려워한다. 그래서 사람들과 첫 원리부터 차근차근 추론하는 데 많은 시간이 필요하다.
진행자:
ChatGPT와 Codex 두 사례를 통해 이야기해보자. ChatGPT는 일반 모델을 위한 소비자용 킬러 앱이 되었고, 코딩은 기업용 킬러 앱이 된 것처럼 보인다. 이 두 사용 사례를 발견하고, 출시하고, 확장하고, 수익화한 방식에서 어떤 차이가 있었나?
샘 알트만:
우리는 GPT-3를 만들었고 돈을 벌어야 했다. 왜냐하면 10억 달러, 수십억 달러 규모의 컴퓨터로 스케일업하고 싶었기 때문이다. GPT-3는 흥미로운 데모였지만, 그걸 기반으로 어떤 제품을 만들어야 할지 알 수 없었다. 우리는 여러 가지를 생각하고 시도했지만 잘 작동하지 않았다.
모델이 더 좋아질 것이라는 건 알고 있었지만, 더 빨리 매출 엔진을 만들고 싶었다. 그래서 우리가 만들 제품을 못 찾겠다면 API로 내놓고, 누군가가 제품을 찾아주길 바라자고 했다. 그렇게 2020년 여름쯤 GPT-3 API를 출시했다.
처음에는 거의 반응이 없었다. 그런데 한 달쯤 뒤, 정확히 왜인지는 모르겠지만 같은 날 몇몇 개발자들이 GPT-3로 멋진 것을 만들어 트위터에 올렸고, 다른 사람들이 따라 해보기 시작하면서 API가 바이럴이 되었다.
하지만 지금 돌아보면 그 모델들은 충격적으로 나빴다. GPT-3나 3.5를 다시 써보면 당시의 흥분에 비해 얼마나 부족했는지 놀랄 것이다. 사람들이 여러 시도를 했지만, GPT-3로 의미 있게 사업이 된 것은 사실상 카피라이팅 정도였다. 그것도 그렇게 대단하거나 흥미롭지는 않았다.
그런데 개발자들이 API에 프롬프트를 넣고 모델과 채팅하는 방식을 찾아냈다. 우리는 사람들이 API를 사업에 활용하지는 못해도, 자신의 API 키로 그냥 채팅하는 모습을 많이 봤다. 그래서 “사람들이 분명히 이걸 원한다. 우리가 좋은 챗봇을 만들 수 있다”고 생각했다.
그때 우리는 GPT-4도 이미 완성해둔 상태였고, 그 사이에 출시할 3.5 모델도 있었다. 또한 모델이 지시를 더 잘 따르게 만드는 새로운 후처리 방식을 알아냈다. API 사업은 연 매출 1천만~2천만 달러 정도였지만, 사람들이 좋아하는 무언가가 있었다. YC 원칙대로 “사용자가 사랑하는 것을 보고 그것을 하라”는 방향으로 챗봇을 만들었다.
처음에는 그것이 그렇게 잘될 것이라고 생각하지 않았다. 연구 데모에 가까웠고, 다른 사람들이 채팅형 제품을 만들고 우리 API를 쓰도록 설득하려는 목적도 있었다. 그런데 엄청나게 바이럴이 되었다.
YC에서 배운 또 하나의 원칙이 있다. 무언가가 아주 빠르게 성장하는데 아직 제품이 별로 좋지 않다면, 손에 확실한 히트 상품을 쥔 것이다. ChatGPT 출시 후 5일 정도 동안 트래픽이 급증했다가 떨어지고, 다음 날 더 높은 고점을 찍고 다시 떨어지는 일이 반복됐다. 사람들은 “그냥 hype cycle이다”라고 했지만, 넷째 날이나 다섯째 날쯤 나는 “이게 어떻게 되는지 안다. 여기에는 킬러 제품의 가능성이 있다”고 생각했다.
그래서 모두를 모아 “이건 비상사태다. 좋은 종류의 비상사태지만, 우리는 회사와 제품을 동시에 만들어야 한다”고 말했다. 이후 두 달 동안 미친 듯이 스케일링했다. 일단 컴퓨트 비용 때문에 파산하지 않도록 유료화를 해야 했다. 장기적인 사업 모델은 나중에 생각하기로 했다. 그런데 그것도 작동했다.
Codex의 경우에는, 사실 ChatGPT 이전에는 우리가 코드에 올인하려고 했다. 우리는 모델이 코드를 쓸 수 있다는 것을 알고 있었고, 그것이 매우 가치 있는 영역이 될 것이라고 봤다. 내부적으로는 코딩이 모델이 컴퓨터를 제어하는 방식이고, 로봇은 모델이 물리 세계를 제어하는 방식이라고 생각했다. 충분히 똑똑한 모델이 코드 작성과 로봇 제어라는 작동 수단을 갖게 되면, 실제 세계에서 무언가를 해낼 수 있게 된다고 본 것이다.
Codex는 올해 초쯤 정말 좋아졌고, 5.5에서 큰 변곡점이 나타났다. 사람들이 이제 그것으로 놀라운 일들을 하고 있다.
진행자:
현재 AI 연구 파이프라인은 프리트레이닝, 미드트레이닝, 포스트트레이닝, RL과 지도 피드백 루프처럼 보인다. Codex의 능력 도약도 이런 파이프라인 덕분인가? 이 구조가 안정적으로 유지될까, 아니면 큰 변화가 올까?
샘 알트만:
그것이 현재의 파이프라인인 것은 맞다. 하지만 큰 재작성은 있을 것이라고 예상한다. 언제, 어떻게 일어날지는 모르겠다. 다만 현재 방식이 파이프라인 형태로 나뉘어 있다는 점이 조금 이상하게 느껴진다. 최적해처럼 느껴지지는 않는다.
진행자:
그렇다면 머릿속에서 생각하는 최적해는 무엇인가?
샘 알트만:
그건 AI들이 풀어야 할 연구 문제라고 생각한다. 우리는 올해 9월까지 50만 A100 상당의 GPU를 AI 연구 인턴처럼 쓰겠다는 목표를 세웠다. 그리고 2028년 3월까지는 완전한 엔드투엔드의 매우 뛰어난 연구자, 즉 새로운 아키텍처를 처음부터 끝까지 찾아낼 수 있는 AI 연구자를 갖는 것이 목표다.
현재 파이프라인과 현재 아키텍처만으로도, AI가 믿기 어려울 정도의 연구 작업을 할 수 있는 선을 넘을 것이라고 본다.
진행자:
방금 “AI 연구 인턴”이라는 비유를 썼다. 실리콘밸리나 이 수업의 맥락에서는 유용한 은유지만, 이것이 전 세계로 확장되면 사람들이 모델을 잘못 비유할 위험도 있다. 어떤 비유는 유용하고, 어떤 비유는 한계가 있다고 보나?
샘 알트만:
나는 지금 우리가 새로운 유틸리티를 만드는 과정에 있다고 생각한다. 이런 일은 자주 일어나지 않는다. 전기, 인터넷, 물 정도가 유틸리티라고 할 수 있다. 그래서 참고할 만한 사례가 많지 않다.
최근 전기가 유틸리티가 되었을 때 무슨 일이 있었는지 살펴봤다. 여러 면에서 좋은 비유이지만 완벽하지는 않다. 전기 회사들은 처음에 “전기”를 판다고 말하지 않았다. 사람들은 전기가 뭔지도 모르고, 왜 원하는지도 몰랐다. 집에 들어와서 사람을 끔찍하게 죽일 수도 있는 무서운 것으로 느껴졌을 것이다.
그래서 그들이 사람들에게 판 것은 전기가 아니라 “밤의 빛”이었다. “우리가 당신에게 주는 것은 전기가 아니라 밤에 빛을 켤 수 있는 능력이다”라고 한 것이다. 그리고 같은 시스템으로 나중에는 세탁기 같은 것도 돌릴 수 있다고 말했을 것이다. 하지만 사람들에게는 그건 너무 먼 이야기였을 수 있다.
AI도 마찬가지다. 우리가 “지능을 판다”고 말하는 것이 지금 당장 맞는 표현인지 모르겠다. 설령 우리가 맞고, 지능이 새로운 유틸리티가 되어 모든 기업, 모든 소비자, 모든 정부가 접근해야 하는 것이 된다고 해도, “우리는 지능을 판매합니다”라는 표현은 아직 사람들에게 잘 와닿지 않는 것 같다.
전기에서 “밤의 빛”에 해당하는 AI의 표현이 무엇일지는 모르겠다. 하지만 우리가 정말 새로운 유틸리티가 되려면, 사람들이 이 “지능 파이프”가 무엇을 의미하는지 이해할 수 있는 방식으로 설명해야 한다.
진행자:
이 수업에서 여러 연사들이 유틸리티 비유를 언급했다. 젠슨 황은 컴퓨트를 유틸리티에 비유했다. 샘은 지능을 유틸리티에 비유했다. 컴퓨트와 토큰, 칩과 지능 중 무엇이 유틸리티가 되는가?
샘 알트만:
소비자나 기업 입장에서는 토큰에 가까운 것을 생각하게 될 것이다. 아니면 토큰보다 한 단계 위일 수도 있다. 사용자들은 하드웨어가 어디 있는지, 어떤 칩을 쓰는지, 무엇으로 전력을 공급하는지 별로 신경 쓰지 않을 것이다. 그런 것들은 추상화될 것이다.
사용자가 신경 쓰는 것은 시스템을 많이 쓸 수 있는가, 싸게 쓸 수 있는가, 잘 작동하는가다. 지금은 토큰이라는 단위로 생각하지만, 앞으로는 우리 모두를 위해 항상 돌아가는 에이전트가 있는 세계로 가면 토큰보다 한 단계 위의 방식으로 생각할 수 있다.
휴대폰 요금을 낼 때를 생각해보면 된다. 우리는 기지국의 하드웨어가 무엇인지, 인터넷과 어떻게 연결되는지보다는, 전체 시스템에 접근할 수 있는지를 생각한다. AI도 그렇게 될 가능성이 크다.
진행자:
이 수업의 최종 프로젝트는 “1인 프론티어 랩”이다. 학생들이 혼자서 프론티어 랩처럼 행동하면서 프로젝트를 진행한다. 샘이 이 수업을 듣는다면 어떤 프로젝트를 할 것인가?
샘 알트만:
정말 멋진 프로젝트라고 생각한다. 지금 유틸리티 프레임워크 이야기를 해서 더 떠오르는 것인데, 많은 똑똑한 사람들이 훌륭한 학습 아이디어에 대해 연구하고 있다. 우리는 어쨌든 곧 놀라운 모델들을 갖게 될 것이다.
하지만 나는 거대한 양의 저렴한 지능을 대규모로 전달하는 능력에는 충분히 투자하지 않았다고 생각한다. 그래서 나라면 스택의 추론 부분을 연구할 것 같다. 어떻게 이 놀라운 지능을 싸고 풍부하게 만들 것인가. 나는 이 영역이 과소투자되어 있다고 본다. 모든 프론티어 랩은 상당한 정도로 추론 회사가 되어야 할 것이다.
학생 질문:
얀 르쿤은 LLM이 인간 수준 지능에 도달하기 위한 막다른 길이라고 보는 듯하다. 이에 대한 의견은?
샘 알트만:
인간 수준 지능이라는 관점에서 보면, 이 모델들은 이미 어떤 면에서는 인간 지능을 훨씬 넘어섰고, 다른 면에서는 훨씬 못하다. 예를 들어 매우 긴 시간 지평의 높은 판단력이 필요한 과제에서는 사람보다 훨씬 못한 것처럼 보인다.
하지만 어제 우리 모델 중 하나가 에르되시 문제 중 하나의 추측을 반박하거나 증명했다. 오랫동안 똑똑한 사람들이 연구했던 문제였다. 많은 과학자들이 최근까지도 그런 일이 일어나지 않을 것이라고 말했다. 그런데 모델이 해냈다. 지금 수학자들은 “수학은 끝난 것인가? 우리 분야는 어떻게 되는가?” 같은 질문을 하고 있다.
따라서 LLM이 새로운 지식을 발견할 수 있다는 것은 분명하다. 인간이 못 하는 일부 지능 작업을 할 수 있다는 것도 분명하다. 그리고 이 모델들은 훨씬 더 스케일할 것이다. 얼마나 더 좋아질지, 어떤 작업 분포에서 인간보다 나아질지는 지켜봐야 한다. 하지만 나는 그 범위가 상당히 클 것이라고 본다.
이전에 이야기한 것처럼 사람들은 지수적 성장을 믿기 어려워한다. 이 분야는 한 세대의 과학자들 때문에 솔직히 지연되었다고 생각한다. 그들은 스케일링이 무엇을 만들어내지 못할 것인지에 대해 너무 확신했다. 반면 어떤 사람들은 그래프를 보고 “계속 아름답게 이어지고 있다. 계속 가자”고 생각했다.
월드 모델은 중요하다. 로보틱스 같은 영역에서는 필요할 것이다. 하지만 지금 시점에서 LLM 스케일링에 베팅하지 않는 것은 매우 잘못된 판단처럼 느껴진다.
진행자:
“내가 말했잖아”라고 말하는 사람이 되는 것은 짜증나지 않나?
샘 알트만:
아니다. 예전에는 트위터 트롤들이 “이건 안 된다”, “멍청하다”, “사기다”, “이 회사는 실패할 것이다”, “이 연구 방향은 실패할 것이다”라고 계속 말하는 것에 더 신경이 쓰였다.
하지만 지금은 “내가 말했잖아”라고 말하고 싶은 기분도 별로 없다. 데이터는 우리 편에 꽤 강하게 있다. 그런데도 여전히 우리가 틀렸다고 말하는 사람들도 있다. 별로 신경 쓰이지 않는다.
어떤 믿음이 자신의 정체성이 되어버리면 문제가 생긴다. 어떤 것이 작동할지 말지에 대한 믿음을 자기 정체성과 결합해버리면, 과학적 결과나 경험적 데이터가 그 믿음을 반박해도 놓아주지 못한다. 진실을 볼 수 없게 된다. 이것은 양쪽 모두에게 중요한 경고다.
학생 질문:
교육은 어떻게 될 것이라고 보나?
샘 알트만:
교육은 완전히 적응해야 한다. 나는 걱정하고 있다. 사실 지금쯤이면 이미 적응했을 것이라고 생각했다.
우리가 여전히 AGI 이전 세계처럼 학생들을 가르치고 평가한다면, 작동하지 않을 것이다. 그리고 사고하는 법을 배우는 능력이 위축될 것이다.
ChatGPT가 출시됐을 때 나는 이렇게 생각했다. “1년 정도는 학생들이 부정행위를 하고 많이 배우지 못하는 시기가 있을 것이다. 하지만 곧 교육 시스템이 스스로를 재설계할 것이다.” 우리는 학생들에게 AI를 반드시 사용해야만 할 수 있는 프로젝트를 주고, 동시에 학생들이 더 많이 생각하고, 새로운 것을 발견하도록 만들 수 있을 것이라고 봤다.
하지만 ChatGPT 출시 후 3년 반이 지났는데, 교육 시스템 전반에서 의미 있는 시스템적 변화가 있었다고 말하기 어렵다. 이것은 내 예측 실패였다.
물론 우리는 이전의 모든 기술적 도약에서 그랬던 것처럼 교육을 재설계할 수 있다. 여전히 사고하는 법을 배우게 만들 수 있다. 어떤 것들은 기계가 더 잘하더라도 사람에게 가르칠 필요가 있다. 예를 들어 나는 글을 쓰면서 생각하는 사람이다. 남에게 보여주지 않는 글도 많이 쓴다. 그래도 어떤 것을 이해하는 데 중요하다. 그래서 글쓰기를 배운 것에 감사한다.
프로그래밍에 대해서도 같은 말을 하는 사람들이 있다. 기계가 더 잘하더라도, 그것을 배우는 과정은 사고와 학습이라는 메타 기술을 기르는 데 도움이 될 수 있다. 하지만 다른 많은 것들은 우리가 가르치고 배우고 평가하는 방식을 완전히 바꿔야 한다. 그렇게 하지 않으면 사람들의 비판적 사고 능력이 상당히 위축될 것이다.
학생 질문:
스탠퍼드에서 가장 좋아했던 수업은 무엇이고, 어떤 수업을 더 들었으면 좋았겠다고 생각하나?
샘 알트만:
스탠퍼드에 아직 IntroSem이 있나? 나는 1학년 때 한 학기에 세 개씩 들을 정도로 많이 들었다. 정말 좋아했다. 서로 완전히 다른 수업들이었다.
돌아보면 여러 분야에 얕게나마 폭넓게 노출될 수 있었던 것이 엄청나게 좋았다. 그게 아니었다면 나는 CS와 물리 수업만 들었을 것이다. 그것도 좋았겠지만, 지금 생각하면 내 일과 직접 관련 없어 보이는 무작위 수업들이 오히려 중요한 관점을 줬다.
당시에는 “이것도 멋지지만 결국 중요한 건 CS를 배우는 것”이라고 생각했다. 나는 학교를 2년만 다녔기 때문에 듣고 싶었지만 못 들은 수업이 많았다. 하지만 놀랍게도 지금 더 자주 생각나는 것은 전공과 직접 관련 없던 수업들이다.
학생 질문:
가장 매운 의견, 가장 논쟁적인 견해는 무엇인가?
샘 알트만:
시간을 더 주면 더 매운 의견을 말할 수 있을지도 모르겠다. 하지만 지금 떠오르는 것은 AI가 계속 나아갈 것이라는 점이다. 나는 이것이 아직 널리 믿어지는 것 같지 않다고 생각한다.
만약 정말 많은 사람이 이것을 믿고 있다면, 지금 사회 전반에서 훨씬 더 큰 반향이 나타나고 있어야 한다. ChatGPT가 나온 지 3년 반이 지났다. 만약 앞으로 3년 반만 더 같은 궤적으로 간다면, 세계가 할 수 있는 일, 사회가 가능한 일은 완전히 달라질 것이다.
진행자:
샘을 하나의 예측 엔진처럼 취급해보자. 앞으로 10년 동안 우주가 갈라질 가장 중요한 세 갈래의 분기점은 무엇이고, 각각의 확률은 어떻게 보는가?
샘 알트만:
하나의 매우 중요한 분기점은 이 기술이 얼마나 널리 민주화될 것인가, 아니면 소수 기업 안에 머물 것인가다.
이 기술이 소수 기업에 집중되고, 그 회사들이 지구 부의 상당 부분을 차지하게 되는 세계를 상상할 이유는 많다. 그것은 명백히 끔찍한 일이다. 우리는 그것에 강하게 반대하려고 노력한다. 하지만 그런 방향으로 끌고 가는 힘이 있다.
그래서 유틸리티 모델로 가는 것이 중요하다고 생각한다. 소수 기업만 이 기술을 갖는 세계는 매우 불안정하고 나쁘며 불공정하게 느껴질 것이다. 또한 나는 거기에 진짜 정렬 실패가 있다고 본다. 모두가 이기고, 모두의 가치가 반영되고, 모두가 주체성을 가지는 세계로 가는 가장 좋은 방법은 이 기술을 세상으로 밀어내는 것이다.
하지만 안전과 안정성을 이유로 이것에 반대하는 강한 주장도 있을 것이다. 이것이 큰 분기점이다. 학생들이 자신의 커리어에서 이 기술이 널리 퍼지는 방향으로 강하게 밀어붙이기를 바란다. 이 기술은 놀라운 SF적 미래를 가져올 수 있다. 삶은 믿기 어려울 정도로 좋아질 수 있다. 거기에 도달하기 위해 약간의 위험은 감수해야 한다. 하지만 소수 기업에 이 힘을 집중시키는 위험은, 비록 우리가 그 소수 기업 중 하나가 될 수 있다 하더라도, 용납해서는 안 된다.
확률로 보면, 세계가 그렇게 되는 데 너무 큰 이해관계를 갖고 있기 때문에 민주적 경로로 갈 확률을 80% 정도로 본다. 하지만 안전이라는 메시지도 강할 것이고, 권력을 집중시키고 싶어 하는 권력 추구자들도 많을 것이다.
진행자:
그 예측을 하면, 동시에 당신은 그 예측에 영향을 미칠 수 있는 행위자이기도 하다.
샘 알트만:
그렇다. 우리는 우리의 행위성을 어디에 쓸지 분명히 알고 있다. 우리는 이 방향을 믿는다. 그래서 가능한 모든 것을 해서 이 방향으로 밀 것이다. 다만 반대 방향의 힘도 보고 있다.
관련된 또 다른 분기점은 미래의 경제 모델이다. 사람들은 보편기본소득을 이야기하고, 모두가 모든 회사의 일부를 소유하는 방식을 이야기하고, 자본주의가 그대로 유지될지, 완전한 공산주의가 될지 같은 이야기를 한다.
그런데 내가 보기에 충분히 이야기되지 않는 것은 컴퓨트를 구체적으로 어떻게 분배할 것인가다.
경제의 많은 부분은 기존 방식대로 작동할 수도 있다. 나는 단기 일자리 비관론자에서는 훨씬 덜 비관적인 쪽으로 바뀌었다. 우리는 새로운 일을 찾을 것이라고 늘 낙관해왔고, 단기적으로는 내가 처음 생각한 것만큼 일자리가 파괴되지 않을 수도 있다.
하지만 지금도 컴퓨트 부족이 나타나고 있다. 이것이 훨씬 악화될 수 있다. 컴퓨트가 사람들이 필요로 하는 가장 중요한 유틸리티가 될 수도 있다. 만약 공급과 수요 관점에서 컴퓨트 가격이 크게 어긋난다면, 컴퓨트를 공정하게 분배한다는 것이 무엇을 의미하는지에 대한 매우 흥미로운 분기점이 생길 것이다.
진행자:
경제 모델 이야기에서 보편기본소득이나 모두가 주식을 소유하는 방식 같은 이야기가 나왔다. 노르웨이 국부펀드처럼 이미 세계 상장기업의 상당 부분을 소유하고 사실상 보편적 복지에 가까운 시스템도 있다. 이런 해결책은 완전히 새로워야 하나, 아니면 기존 시스템을 이 시대에 맞게 조정하면 되나?
샘 알트만:
나는 이런 것들이 깊이 새로운 아이디어를 요구한다고 생각하지 않는다. 다만 고정된 월 현금 배당보다, 사람들이 어떤 종류의 소유 지분을 갖는 방식에 훨씬 더 흥미를 느낀다.
나는 예전에 대규모 보편기본소득 연구를 지원한 적이 있다. 또 사람들이 스타트업에 투자할 때 어떤 일이 일어나는지도 봤다. 인간 심리에 더 잘 맞는 모델이 무엇인지는 어느 정도 안다고 생각한다.
세계의 레버리지가 노동에서 자본으로 계속 이동한다면, 나는 국가나 결국 세계 차원에서 시민 부 펀드 같은 것이 생기면 좋겠다. 사람들이 자본주의의 한 조각, 이 회사들의 한 조각을 소유하는 방식이다.
진행자:
컴퓨트 병목에 대해 이야기해보자. 현재 H100이나 Blackwell 가격에서 장기 예약과 현물 가격의 스프레드가 매우 큰 것으로 보인다. H100은 올해 물량을 찾기조차 어렵다는 말도 있다. 맞나?
샘 알트만:
그 정도로 높은지는 지금은 조금 나아졌을 수 있다. 하지만 반론은 없다. 거대한 컴퓨트 부족이 있다.
진행자:
컴퓨트 시대에서 화장지가 모두 사라진 것 같은 상황처럼 보인다. 왜 사람들이 더 크게 패닉하지 않나?
샘 알트만:
사람들은 현재 하드웨어에서 큰 추론 효율 개선이 있을 것이라고 가정하는 것 같다. 또 엄청난 하드웨어 공급 물결이 오고 있다고 생각한다. 하지만 수요의 쓰나미가 더 클 수도 있다. 사람들은 어느 정도는 패닉해야 한다고 본다.
진행자:
이 컴퓨트 부족은 얼마나 지속될 것이라고 보나?
샘 알트만:
전 세계 전력 수요를 이야기할 때 가격을 빼고 말할 수 없는 것과 같다. 에너지 가격이 10분의 1로 내려가거나 10배로 올라가면 사람들이 사용하고 싶어 하는 에너지 양은 완전히 달라진다. AI도 그렇다.
모델을 충분히 똑똑하고 충분히 저렴하게 만들 수 있다면, 수요는 사실상 무제한에 가깝다고 생각한다. 그런 의미에서 우리가 계속 진전을 이룰 수 있는 한, 부족은 영원히 계속될 수도 있다. 사람들은 우리가 생각하는 적정 가격보다 높은 가격을 계속 지불하려 할 것이다.
정말 훌륭한 개인 에이전트를 만들고, 사람들이 자신을 위해 항상 일하는 에이전트 10개를 돌릴 수 있다면, 아마 100개도 원할 것이다. 그것은 엄청난 추론 수요를 만든다.
진행자:
오늘 와줘서 감사하다.
샘 알트만:
초대해줘서 고맙다. 모두 고맙다.
전체 0