최신논문

전체 257
번호 제목 작성자 작성일 추천 조회
39
(2023년 10월) 알파제로와 유사한 트리 검색으로 대규모 언어모델 디코딩 및 학습 가이드
| 2024.07.01 | 추천 0 | 조회 359
2024.07.01 0 359
38
공동 사례 선택을 통한 데이터 큐레이션으로 다중 모드 학습이 더욱 가속화됩니다.
| 2024.06.27 | 추천 0 | 조회 430
2024.06.27 0 430
37
(2023년 9월) 멀티모달 기반 모델: 전문가에서 범용 보조자까지
| 2024.06.26 | 추천 0 | 조회 466
2024.06.26 0 466
36
(2023년 9월) 언어 모델링은 압축이다
| 2024.06.26 | 추천 1 | 조회 545
2024.06.26 1 545
35
(2023년 9월) 자동회귀 다음 토큰 예측자는 범용 학습기입니다.
| 2024.06.26 | 추천 0 | 조회 412
2024.06.26 0 412
34
(2023년 9월) Vision Transformers에서 Softmax를 ReLU로 교체
| 2024.06.26 | 추천 0 | 조회 392
2024.06.26 0 392
33
(2023년 8월) 대규모 언어모델은 인간과 유사한 개념 구성으로 수렴됩니다
| 2024.06.26 | 추천 0 | 조회 470
2024.06.26 0 470
32
(2023년 9월) 자기 지도 시퀀스 모델의 월드모델에서의 새로운 선형 표현
| 2024.06.25 | 추천 0 | 조회 340
2024.06.25 0 340
31
(2023년 9월) 컴파일러 최적화를 위한 대규모 언어모델
| 2024.06.25 | 추천 0 | 조회 346
2024.06.25 0 346
30
(2023년 9월) RAIN: 언어모델은 미세조정 없이 스스로 정렬될 수 있습니다.
| 2024.06.25 | 추천 0 | 조회 329
2024.06.25 0 329