인터뷰/예측
샘 알트만 "올해 말쯤이면 훌륭한 음성 모드가 나올 것"
🎙️ 샘 알트만(Sam Altman) 인터뷰 전문
Q (호스트): 쇼에 오신 것을 환영합니다, 샘. 다시 뵙게 되어 반갑습니다. 오늘 큰 발표가 있었는데요, 모델 이야기부터 시작할까요? 아니면 '프런티어(Frontier)'부터 시작할까요?
A (샘 알트만): 모델 이야기부터 하죠. 제가 요즘 재밌게 쓰고 있거든요.
Q: 좋습니다. 무엇을 출시했는지 설명해 주시죠.
A: 우리는 'GPT-5.3 코덱스(Codex)'를 출시했습니다. 제 생각엔 세계 최고의 코딩 모델입니다. 사람들이 5.2 버전에 대해 줬던 피드백을 많이 반영해서 하나로 합쳤죠. 프로그래밍에 있어서 훨씬 똑똑하지만 속도도 엄청나게 빠릅니다. 그리고 작업 중간에 개입(mid-turn interaction)할 수 있습니다. 성격도 훨씬 좋아졌고, 컴퓨터 사용 능력도 뛰어납니다. 오늘 아침 배포할 때 전문가들이 "코덱스가 뭔가 확실히 달라졌다"며 즉각적으로 알아차리더군요.
Q: '작업 중간 개입'이 어떻게 작동하는 건가요? 그게 왜 중요하고 어떤 가능성을 열어주나요?
A: 사람들은 이제 몇 시간씩 걸리는 긴 작업을 모델에게 시키기 시작했습니다. 때로는 처음에 설정을 잘못하거나 중간에 꼬일 때가 있죠. 모델이 방향을 잃지 않도록 중간에 사용자가 개입해서 조종(steer)해 줄 수 있다면 훨씬 더 놀라운 결과물을 만들 수 있습니다.
Q: '프런티어(Frontier)'와 오케스트레이션(조율)에 대해 이야기해 보죠. 5.3 모델을 쓰면 개발자들의 경험이 어떻게 바뀔까요?
A: 앞으로 많은 사람들이 여러 '에이전트(Agent)' 팀을 관리하는 방식의 워크플로우로 가게 될 겁니다. 에이전트들이 똑똑해질수록 사람들은 더 높은 수준의 추상화 단계에서 관리만 하게 되겠죠. 현재 모델들은 이미 너무 똑똑해서 도구가 그 지능을 다 따라가지 못하는 '지능 오버행(capability overhang)' 상태입니다. 그래서 사람들이 에이전트를 잘 관리할 수 있게 해주는 도구를 만드는 것이 지금은 지능 자체를 높이는 것보다 더 중요할 수 있습니다.
Q: OpenAI가 수백 명의 컨설턴트(전진 배치 엔지니어)를 채용한다는 소식이 있던데, 이들의 역할은 무엇인가요? '지능 오버행' 상태라면 이들이 할 일이 많겠군요.
A: 맞습니다. 결국 모델이 너무 좋아지면 기업들이 알아서 도입하겠지만, 지금 당장은 AI 네이티브가 아닌 기업들에 가서 "어떻게 시스템에 연결하고, 코드를 미세 조정하며, 데이터 보안을 유지하면서 에이전트를 쓸 수 있는지" 알려줘야 합니다. 이 엔지니어들은 기업을 우리의 AI 플랫폼(프런티어)에 연결해 주는 역할을 합니다.
Q: 긴 작업을 수행하는 능력(Task Horizon) 벤치마크에서 1위를 차지했는데요, 이제 에이전트들이 떼(swarm)로 움직이며 작업을 나누는 세상이 오면 새로운 측정 기준이 필요하지 않을까요?
A: 두 가지 통찰이 있네요. 첫째, AI 분야에서 몇 년 이상 지속되는 차트(기준)는 없습니다. 둘째, 현재 코딩 에이전트들이 작업을 쪼개고 조율하는 걸 보면 이미 놀라운 수준입니다. 우리 내부 농담 중 하나는, 조만간 유일하게 중요한 차트는 'GDP에 미치는 영향(GDP Impact)'이 될 거라는 겁니다.
Q: GDP 다음에는 무엇이 올까요?
A: 모르겠습니다. 아마 '행복' 같은 게 아닐까요? AI가 가져올 엄청난 디플레이션(가격 하락) 속에서 단순히 GDP 수치보다는 삶의 질이 올라가는 게 중요하겠죠.
Q: 실리콘밸리에 새로운 연구소들이 많이 생겨나고 있습니다. 이에 대해 어떻게 생각하시나요?
A: 환상적입니다. 우리가 OpenAI를 시작할 때 목표 중 하나가 기업도 다시 연구를 할 수 있다는 걸 보여주는 것이었는데, 이제 그게 유행이 되어서 기쁩니다.
Q: 앞으로 2년 동안 제품 회사를 인수할 것 같나요, 아니면 연구소를 인수할 것 같나요?
A: 가장 훌륭한 곳들은 제품과 연구가 혼합된 하이브리드 형태일 겁니다. 그런 형태가 미래의 모습일 것 같네요.
Q: 데이터가 '새로운 석유'인가요?
A: 그 표현은 10년 전에 이미 소비된 표현이라 지금 쓰긴 좀 그렇지만, 어느 정도 사실에 가깝습니다. 하지만 저는 '컴퓨팅 파워(Compute)가 새로운 석유'라는 말이 더 와닿습니다. 자원을 투입할수록 모델이 더 좋아지는 법칙은 여전히 유효하니까요.
Q: 소프트웨어는 죽었나요?
A: 죽진 않았지만 완전히 달라졌습니다. 소프트웨어를 만드는 방식, 사용하는 방식이 바뀔 겁니다. 최근 2주 동안 가장 기억에 남는 말은 "원하든 원치 않든 모든 회사는 이제 API 회사다"라는 말입니다. 에이전트들이 서비스를 이용해야 하니까요. SaaS(서비스형 소프트웨어) 기업들은 당분간 변동성이 크겠지만, 살아남는 곳들은 엄청난 가치를 가질 겁니다.
Q: '코덱스 데스크톱(Codex Desktop)' 앱이 출시되었는데 모바일 통합 계획은 없나요?
A: 코덱스 데스크톱은 저 자신도 놀랄 만큼 만족도가 높습니다. 사용자 경험(UX)을 10%만 개선해도 엄청난 차이를 만듭니다. 당연히 모바일에서도 작업을 시작할 수 있게 될 겁니다. 궁극적으로는 데스크톱이든 모바일이든 상관없이, 내 모든 맥락을 알고 있는 '단일 AI'가 내 업무를 처리해 주길 원하게 될 겁니다. 예를 들어, 제가 만든 '자동 완성되는 할 일 목록'처럼 말이죠.
Q: 오픈 소스인 '오픈 클로드(Open Claw)' 같은 프로젝트를 보며 놀라지 않으셨나요?
A: 저는 그런 정신을 사랑합니다. 거대 기업은 소송이나 데이터 프라이버시 때문에 주저할 때, 1인 오픈 소스 프로젝트는 그런 걸 해낼 수 있죠. 홈브루 컴퓨터 클럽의 정신이 이어지는 것 같아 중요하다고 봅니다.
Q: 소셜 미디어의 미래는 어떻게 보시나요? 현재 봇들이 너무 많은데요.
A: 기존 소셜 플랫폼에 AI 봇을 잔뜩 풀어놓는 건 사람들을 미치게 만들 뿐입니다. 미래의 소셜은 에이전트들이 사람을 대신해 소셜 공간에서 상호작용하는 흥미로운 형태가 될 겁니다. AI 감지보다는 '인간임 증명(assertion of humanity)'이 더 중요해질 것 같습니다.
Q: 소라(Sora) 비디오 모델의 진화는 어떤가요? 도구 사용(Tool use) 기능이 추가되나요?
A: 네, 모델들은 영상 편집 도구를 쓰는 데 능숙해질 겁니다. 하지만 한 가지 문제는, 사람들이 영상을 '생성'하는 건 좋아하지만 남이 만든 AI 영상을 '시청'하는 건 별로 좋아하지 않는다는 점입니다. 다만 그룹 채팅방에서 쓰는 밈(Meme) 같은 건 예외죠.
Q: 디즈니와의 협업은 어떻게 되어가나요?
A: 디즈니와 좋은 파트너가 되려고 노력 중입니다. 개인적으로는 캐릭터 생성 기능을 대대적으로 풀고 싶습니다. 사람들은 자신을 특정 캐릭터로 변환하거나 캐리커처를 만드는 것을 좋아합니다.
Q: 슈퍼볼 광고 이야기로 넘어가죠. 앤스로픽(Anthropic)이 광고를 통해 "챗봇에 광고가 들어가는 미래"를 비판했는데요, 어떻게 생각하시나요?
A: 그건 틀렸습니다. 우리는 멍청하지 않고 사용자를 존중합니다. LLM 대화창에 광고를 넣는 디스토피아적인 짓은 하지 않을 겁니다. 앤스로픽이 '기만적인 광고'를 비판하기 위해 '기만적인 광고'를 만든 것 같아 좀 씁쓸하네요. 하지만 광고 자체는 재밌었습니다.
Q: 음성 모드에서 끊김 현상은 언제 해결되나요?
A: 새 모델이 필요합니다. 아마 올해 말쯤이면 훌륭한 음성 모드가 나올 겁니다.
Q: 현재 가장 큰 병목은 에너지인가요, 칩인가요?
A: 왔다 갔다 하지만, 지금은 다시 '칩(Chips)'입니다.
Q: 모델 지능(IQ)에 상한선이 있을까요?
A: 모르겠습니다. IQ 2,000이나 10,000이 어떤 느낌일지 상상조차 안 되지만, 막상 닥치면 생각보다 덜 기괴할 수도 있습니다. 우리는 여전히 인간 중심적인 삶을 살 테니까요.
Q: 우주 데이터 센터가 향후 10년 내에 OpenAI에 의미 있는 컴퓨팅 파워를 제공할까요?
A: 아니요. (웃음) 행운을 빕니다만.
Q: 광고 도입이 늦었다고 후회하시나요?
A: 아직 테스트도 시작 안 했습니다. 우리는 3년 전만 해도 연구소였는데 지금은 거대 제품 기업이 됐습니다. 코딩이나 과학 연구를 가속화하는 것이 광고보다 더 우선순위가 높습니다.
Q: 마지막 질문입니다. 미디어에서 OpenAI 내부가 혼란스럽다는 보도가 많은데, 실제로는 어떤가요?
A: 정말 이상한 삶입니다. 미디어는 우리가 붕괴 직전이라거나 난리가 났다고 떠들지만, 내부는 너무 바빠서 오히려 고요합니다. 뉴스를 보면 현실과 99% 동떨어진 이야기를 하고 있어서 "와, 미친 소리네" 하고 다시 일하러 갑니다. 밖에서 보기엔 혼란스러워 보일지 몰라도 내부는 생각보다 덜 혼란스럽습니다.
Q: 시간 내주셔서 감사합니다, 샘.
A: 불러주셔서 감사합니다.
꿀잼ㅋㅋ ㄹㅇ 읽을거 많은 인터뷰노