트윗

Exa CEO "o1은 트랜스포머의 AlphaGo 순간"

작성자
하이룽룽
작성일
2024-09-14 12:00
조회
1902


scale is all you need



o1은 트랜스포머 이후 가장 큰 AI 업데이트이며 AGI로 가는 명확한 길을 열어줍니다. Ilya가 본 것이 바로 그것입니다. Sam이 수조 달러의 컴퓨팅을 원했던 이유입니다. Leopold가 우리에게 경고한 것도 바로 이것입니다. 트랜스포머와 마찬가지로 o1을 사용하면 컴퓨팅을 정확도와 효율적으로 교환할 수 있지만, 사전 학습 시간이 아닌 추론 시간에 가능합니다. 트랜스포머의 AlphaGo 순간입니다. 모든 대형 랩이 이를 위해 노력했고 OpenAI가 가장 먼저 출시했습니다. AGI로 가는 길은 이제 명확해졌습니다. 이미지, 비디오, 웹 상호 작용, 로봇 감각 데이터, 우리가 얻은 모든 데이터 소스에 대해 이를 학습시킵니다. 작업에 대한 RL 보상 함수를 구성할 수 있다면(코드와 수학을 위해 쉽게 수행할 수 있음) 이제 더 많은 RL + 추론 컴퓨팅을 적용하여 해당 작업을 더 잘 수행할 수 있습니다. OpenAI는 추론을 위해 놀라운 새로운 로그 스케일링 법칙을 도입했습니다. 이것이 현재 가장 중요한 스케일링 법칙입니다. 그들은 이것을 10, 100, 1000배로 확장할 것입니다. 물론 발전소가 컴퓨터보다 가동하기 어려워지고 규제가 연구 흐름을 제한함에 따라 여기저기서 차질이 생길 수 있습니다. 그러나 이점이 너무 크고 국가적 영향이 너무 심각해서 이런 일이 멈추지 않을 것입니다. 저는 정말 기대가 큽니다. 저는 공상과학 미래를 꿈꾸며 자랐습니다. 여러분은 그렇지 않으셨나요? 그리고 이것이 바로 그 길입니다. 저는 아이언맨 슈트, 깨끗한 도시, 27살의 기분을 느낄 수 있는 천년, 1시간 걸리는 유럽 여행, 1년 걸리는 유로파 여행을 원합니다. 인간은 너무 느리고 게으르며 정치적이어서 스스로 이 미래에 도달할 수 없습니다. 우리는 차라리 스스로를 없애버릴 것입니다. 풍부한 지능은 우리가 이 미래에 안전하게 도달할 수 있는 방법입니다. 물론 위험은 있지만 OpenAI 보고서에서 나온 또 다른 주목할 만한 결과는 o1이 실제로 규칙을 따르는 데 더 능숙해진다는 것입니다. 저는 AI 자체가 혼돈을 선택할까봐 덜 걱정하고, 나쁜 행위자가 이 기술에 접근하여 혼돈으로 만들까봐 훨씬 더 걱정합니다. 우리는 분명히 조심스럽게 전진해야 합니다. 이 에이전트의 미래를 몇 년 동안 계획해 왔는데, 이제 마침내 그것이 도착하는 것을 보는 것은 이상한 느낌입니다. Greg는 아마 이것을 기억하지 못할 것입니다. 하지만 저는 GPT-2 시절에 ​​OpenAI WestWorld 시청 파티에서 그와 함께 빈백에 앉아 있었고, 우리는 스케일링 법칙에 대해 논쟁을 벌였습니다. 저는 AGI에 도달하려면 새로운 알고리즘이 필요하다고 생각했습니다. 그는 스케일만 있으면 된다고 주장했습니다. GPT-3 이후에는 그가 옳다고 느꼈습니다. GPT-4 이후에는 알았습니다. 이제 o1이 있어서 준비가 되었습니다. 에이전트의 시대가 공식적으로 시작되었고, 저와 제 팀은 준비가 되었습니다. OpenAI는 저희 사무실에서 단 한 블록 떨어져 있고, 우리는 평행한 에너지를 느낍니다. 많은 추론으로 구동되는 에이전트는 우리 사회를 빠르게 바꿀 것입니다. 위험은 더 높을 수 없습니다. 이를 잘 탐색하려면 다양한 종류의 도움이 필요합니다. 제 계획은 이러한 에이전트에게 매우 강력한 웹 검색을 제공하는 것입니다. 아무도 그것에 집중하지 않고 있고, 올바르게 하는 것이 매우 중요하기 때문입니다. 당신의 계획은 무엇입니까?
전체 0