인터뷰/예측
중국 ai연구원 "AGI가 곧 도래할 것"


AGI의 도래: ChatGPT와 대형 모델의 발전으로 AGI가 생각보다 빠르게, 5~20년 안에 도래할 가능성이 높아졌다.
멀티모달 대형 모델의 발전: 텍스트뿐 아니라 다양한 형태의 데이터를 학습하는 멀티모달 대형 모델이 더욱 발전하고, 인간의 뇌처럼 세상을 이해하고 추론하는 능력을 갖추게 될 것이다.
개인 비서 및 구현 지능의 보편화: 멀티모달 AI가 스마트폰, PC 등 개인 장비에 탑재되어 24시간 개인 비서 역할을 수행하고, 다양한 하드웨어에 탑재되어 자율주행차, 로봇 등 구현 지능 형태로 발전할 것이다.
산업 전반의 변화: AGI와 구현 지능은 모든 산업 분야에 걸쳐 혁신적인 변화를 가져올 것이며, 특히 자율주행과 로봇 분야에서 큰 발전이 예상된다.
AGI에 대해 이야기하고 왜 AGI가 곧 도래할 것이라고 생각하는지, 그리고 그것이 우리의 미래 삶을 어떻게 변화시킬지에 대한 내용입니다.
AGI는 인공지능의 궁극적인 형태로, 인간의 지능 수준 또는 그 이상에 도달하는 것을 의미합니다. 인간의 지능은 뇌에서 비롯되지만, 과학자들은 아직 뇌의 작동 메커니즘을 완전히 이해하지 못하고 있습니다.
발표자는 두 가지 가상의 동물 Kiki와 Booba를 예시로 인간의 뇌가 소리와 이미지 패턴을 연관 짓고 자동으로 추론하는 방식을 설명합니다. AGI 연구자들은 이러한 뇌의 신경망 추론 방식을 모방하여 AGI를 구현하려고 노력하고 있습니다.
발표자는 AGI 구현을 20년 넘게 연구해 왔으며, 2023년 ChatGPT의 발표를 통해 대형 모델의 잠재력을 확인하고 AGI 도래 가능성을 인지하게 되었다고 말합니다. 하지만 대부분의 사람들은 아직 AI의 지능적 능력을 체감하지 못하고 있습니다.
이러한 온도 차의 원인은 대형 모델이 인간의 인지 수준에 미치지 못하기 때문입니다. 발표자는 지난 몇 개월 동안 전 세계 140개 이상의 대형 모델을 대상으로 초등학교 3학년부터 고등학교 3학년까지의 시험 문제를 풀게 하는 평가를 진행했습니다. 결과적으로 대형 모델은 아직 해당 지역 학생들의 평균 수준에 미치지 못하지만, 빠른 속도로 발전하고 있습니다. 이는 전 세계 전문가들이 AGI가 향후 5~20년 안에 도래할 것으로 예측하는 이유입니다.
발표자는 AGI 시대의 의미를 설명하기 위해 초등학교 3학년 학생들에게 AI 수업을 진행했던 경험을 이야기합니다. 아이들은 AI가 숙제를 대신 해줄 수 있다는 사실에 흥분했지만, 한 여학생이 "만약 AI가 모든 것을 할 수 있다면 우리는 미래에 무엇을 해야 하나요?"라는 질문을 던졌습니다. 이 질문에 대한 답을 찾기 위해 발표자는 개인적인 경험을 공유합니다.
발표자는 어느 날 5성급 카페를 찾았지만, 실제 카페는 평점과는 달리 매우 실망스러웠습니다. 수천 개의 긍정적인 리뷰가 조작된 것이 아닌지 의심했지만, 기술팀의 분석 결과 모든 리뷰는 진짜였습니다. 이 경험을 통해 발표자는 자신의 인지와 다른 사람들의 인지 사이에 큰 차이가 있음을 깨달았습니다. 이 문제를 해결하기 위해 발표자의 팀은 세분화된 감정 분석 AI 모델을 개발하여 수천 개의 리뷰를 분석했습니다. 분석 결과, 사람들은 카페의 서비스와 맛에는 만족했지만 위치, 주차, 공간 등에는 불만족스러워한다는 사실을 알게 되었습니다. 이처럼 약인공지능은 특정 문제 해결에 유용하지만 범용성은 부족합니다.
발표자는 과거 70-80년 동안 인공지능의 발전 과정을 설명하며, 2023년 이전의 인공지능은 모두 약인공지능이었다고 말합니다. 약인공지능은 특정 문제, 특정 상황, 특정 작업만 해결할 수 있으며, 범용성과 일반화 능력이 부족합니다.
하지만 ChatGPT의 등장으로 대형 모델의 잠재력이 확인되었고, Scaling Law라는 현상을 통해 데이터, 컴퓨팅 파워, 매개변수가 증가함에 따라 대형 모델은 언어, 수학, 물리 등 다양한 문제를 해결할 수 있게 되었습니다. 발표자는 대형 모델의 매개변수가 인간 뇌의 매개변수보다 100배 적지만, 매년 10배씩 증가하고 있기 때문에 AGI가 곧 도래할 것이라고 예측합니다. 또한, 텍스트 데이터보다 10배 많은 멀티모달 데이터를 학습하게 되면 대형 모델의 지능은 비약적으로 향상될 것입니다.
발표자는 지웬 연구원에서 개발한 멀티모달 대형 모델을 시연하며, 텍스트를 이미지로, 이미지를 비디오로 변환하는 기능, 이미지와 텍스트를 결합하여 비디오를 생성하는 기능, 이미지 추론 기능 등을 보여줍니다. 이처럼 대형 모델이 우리의 세상을 이해하게 되면 인간의 뇌처럼, 심지어 더 똑똑해질 수 있습니다.
미래에는 멀티모달 대형 모델이 스마트폰과 개인용 컴퓨터에 탑재되어 24시간 개인 비서 역할을 할 것이며, 이러한 변화는 산업 전반에 걸쳐 엄청난 발전을 가져올 것입니다. 나아가 이러한 AI가 하드웨어와 결합하면 자율주행처럼 하드웨어를 지능적으로 만들 수 있게 되는데, 이를 구현 지능이라고 합니다. 현재 최첨단 자율주행 기술은 시각 정보만을 사용하는 종단 간 학습 방식으로 대형 모델을 훈련하고 있으며, 이미 인간보다 훨씬 안전한 주행 성능을 보여주고 있습니다. 이러한 자율주행 기술의 발전은 자동차 산업 전체에 큰 발전을 가져올 것입니다.
마지막으로 발표자는 인간형 로봇과 산업용 로봇 등에 대해 언급하며, 과거에는 로봇이 특정 작업만 수행할 수 있었지만, 멀티모달 대형 모델과 구현 지능 덕분에 로봇이 스스로 생각하고 세상을 이해하며 상호작용하고 의사결정을 내릴 수 있게 되면서 모든 산업 분야에 혁신적인 변화가 일어날 것이라고 예측합니다. 발표자는 현재 중국에서 가장 발전된 로봇의 성능을 보여주는 영상을 시연하며, 기술 혁명의 속도는 과대평가될 수 있지만, 그 광범위한 영향력과 깊이는 결코 과소평가해서는 안 된다고 강조합니다.