트윗
딥마인드 최고연구원 난도 데 프레이타스 "다음 단어를 "단지" 예측하는 것만으로도 언어 모델이 방대한 지식을 학습하여 코딩, 질문에 답하고, 많은 주제를 이해하고, 채팅 등을 할 수 있게 하는 데 충분"
작성자
ㅇㅇ
작성일
2024-07-04 09:22
조회
1585
"only"라는 다음 단어를 예측하는 것만으로도 언어 모델이 코딩, 질문 답변, 많은 주제 이해, 채팅 등을 가능하게 하는 방대한 지식을 학습하는 데 충분합니다.
이는 이제 많은 연구자들에게 분명하며 이것이 압축에 의존하여 작동하는 이유에 대한 훌륭한 튜토리얼이 있습니다. 그러나 이해 유형의 출현은 언어 모델에만 국한되지 않습니다. https://arxiv.org/pdf/1804.06318.pdf by @notmisha 및 @brandondamos 에서 저자는 100개가 넘는 로봇 손 센서(터치, 자이로, 가속도계, 관절 정보, 액추에이터 정보 등)의 다음 몇 시간 줄기를 예측하기 위해 모델을 훈련했습니다. 그들은 프로브를 사용하는 신경망의 활성화를 통해 손이 만지고 있는 사물의 모양을 회귀할 수 있다는 사실을 발견했습니다. 즉, 모델은 단순히 다음 몇 가지 감각을 "오직" 예측하는 데 사용되었음에도 불구하고 모양의 내부 표현을 개발했습니다. 인식은 단순한 예측과 세상과의 상호작용을 통해 이루어집니다.
터치 센서를 통해 다음에 감지할 내용을 예측하는 시각 장애인 로봇은 세상이 어떻게 생겼는지에 대한 내부 표현을 학습합니다. 이 경우 손 센서를 예측하면 로봇이 녹색 케이크 조각의 방향을 이해할 수 있습니다.
나는 이것이 텍스트, 오디오, 비디오를 넘어 촉각, 전정 정보 및 고유 감각으로 나아가야 할 필요성을 강조한다고 믿습니다. 자기 인식은 다중 모드 데이터 스트림을 예측함으로써 발생하는 새로운 속성일 가능성이 높습니다. 이는 확장 가능한 실험을 통해 추가 조사가 필요한 흥미로운 연구 가설입니다.
전체 0