최신논문

전체 257
번호 제목 작성자 작성일 추천 조회
47
(2023년 10월) 거의 무한한 컨텍스트를 위한 Blockwise Transformers를 사용한 링 어텐션
| 2024.07.01 | 추천 0 | 조회 530
2024.07.01 0 530
46
(2023년 10월) 신경망의 관계적 제약은 추상적 기하학적 규칙성에 대한 인간의 편견을 재현합니다.
| 2024.07.01 | 추천 0 | 조회 335
2024.07.01 0 335
45
(2023년 10월) 말하기 전에 생각하세요: 일시정지 토큰을 사용한 언어 모델 훈련
| 2024.07.01 | 추천 0 | 조회 312
2024.07.01 0 312
44
(2023년 10월) Self-Taught Optimizer(STOP): 반복적으로 자체 개선
| 2024.07.01 | 추천 0 | 조회 316
2024.07.01 0 316
43
(2023년 10월) 의심 에이전트: 마음 이론 인식 GPT-4를 사용하여 불완전한 정보 게임하기
| 2024.07.01 | 추천 0 | 조회 479
2024.07.01 0 479
42
(2023년 10월) RLAdapter: 오픈월드에서 대규모 언어모델과 강화학습 연결
| 2024.07.01 | 추천 0 | 조회 383
2024.07.01 0 383
41
(2023년 10월) 알파제로와 유사한 트리 검색으로 대규모 언어모델 디코딩 및 학습 가이드
| 2024.07.01 | 추천 0 | 조회 359
2024.07.01 0 359
40
혼합 RL 설정의 전문가 혼합
| 2024.06.27 | 추천 0 | 조회 560
2024.06.27 0 560
39
공동 사례 선택을 통한 데이터 큐레이션으로 다중 모드 학습이 더욱 가속화됩니다.
| 2024.06.27 | 추천 0 | 조회 430
2024.06.27 0 430
38
더 크고, 정규화되고, 낙관적입니다. 컴퓨팅 및 샘플 효율적 연속 제어를 위한 확장
| 2024.06.27 | 추천 0 | 조회 434
2024.06.27 0 434