최신논문

언어모델을 넘어: 바이트 모델은 디지털 세계 시뮬레이터입니다.

작성자
dd
작성일
2024-07-04 01:20
조회
325
https://arxiv.org/abs/2402.19155
기존의 딥 러닝은 종종 디지털 세계의 기본 단위인 바이트를 간과합니다. 바이트는 모든 형태의 정보와 작업이 이진 형식으로 인코딩되고 조작됩니다. 자연어 처리에서 다음 토큰 예측의 성공에서 영감을 받아 디지털 세계를 시뮬레이션하기 위한 다음 바이트 예측이 있는 모델인 bGPT를 소개합니다. bGPT는 텍스트, 오디오, 이미지를 포함한 다양한 모달리티에서 성능에 특화된 모델을 매치하고 알고리즘이나 하드웨어 동작을 예측, 시뮬레이션, 진단할 수 있는 새로운 가능성을 제공합니다. ABC 표기법을 MIDI 형식으로 변환할 때 바이트당 0.0011비트의 낮은 오류율을 달성하여 기호 음악 데이터를 변환하는 프로세스를 거의 완벽하게 복제했습니다. 또한 bGPT는 다양한 작업을 실행할 때 99.99%를 초과하는 정확도로 CPU 동작을 시뮬레이션하는 데 뛰어난 기능을 보여줍니다. 다음 바이트 예측을 활용하여 bGPT와 같은 모델은 방대한 이진 데이터에서 직접 학습하여 디지털 세계의 복잡한 패턴을 효과적으로 시뮬레이션할 수 있습니다.
전체 0