최신논문

전체 257
번호 제목 작성자 작성일 추천 조회
37
(2023년 9월) 멀티모달 기반 모델: 전문가에서 범용 보조자까지
| 2024.06.26 | 추천 0 | 조회 466
2024.06.26 0 466
36
(2023년 9월) 언어 모델링은 압축이다
| 2024.06.26 | 추천 1 | 조회 545
2024.06.26 1 545
35
(2023년 9월) 자동회귀 다음 토큰 예측자는 범용 학습기입니다.
| 2024.06.26 | 추천 0 | 조회 412
2024.06.26 0 412
34
(2023년 9월) Vision Transformers에서 Softmax를 ReLU로 교체
| 2024.06.26 | 추천 0 | 조회 392
2024.06.26 0 392
33
(2023년 8월) 대규모 언어모델은 인간과 유사한 개념 구성으로 수렴됩니다
| 2024.06.26 | 추천 0 | 조회 470
2024.06.26 0 470
32
(2023년 9월) 자기 지도 시퀀스 모델의 월드모델에서의 새로운 선형 표현
| 2024.06.25 | 추천 0 | 조회 340
2024.06.25 0 340
31
(2023년 9월) 컴파일러 최적화를 위한 대규모 언어모델
| 2024.06.25 | 추천 0 | 조회 346
2024.06.25 0 346
30
(2023년 9월) RAIN: 언어모델은 미세조정 없이 스스로 정렬될 수 있습니다.
| 2024.06.25 | 추천 0 | 조회 329
2024.06.25 0 329
29
(2023년 9월) Transformers에서 메사 최적화 알고리즘 발견
| 2024.06.25 | 추천 0 | 조회 337
2024.06.25 0 337
28
(2023년 9월) 표면 통계 너머: 잠재 확산 모델의 장면 표현
| 2024.06.25 | 추천 0 | 조회 307
2024.06.25 0 307