최신논문

전체 252
번호 제목 작성자 작성일 추천 조회
112
Mobile-Agent-v2: 다중 에이전트 협업을 통한 효과적인 탐색 기능을 갖춘 모바일 장치 작동 도우미
dd | 2024.07.04 | 추천 0 | 조회 423
dd 2024.07.04 0 423
111
체스를 두는 신경망에서 학습된 예측의 증거발견
dd | 2024.07.04 | 추천 0 | 조회 462
dd 2024.07.04 0 462
110
지능형 Go-Explore: 거대한 기초모델의 어깨 위에 서기
ㅇㅇ | 2024.07.04 | 추천 0 | 조회 443
ㅇㅇ 2024.07.04 0 443
109
Grokked Transformers는 암묵적 추론자입니다: 일반화의 한계에 대한 기계적 여정
dd | 2024.07.04 | 추천 0 | 조회 617
dd 2024.07.04 0 617
108
OMNI-EPIC: 코드로 프로그래밍된 환경을 통한 인간의 흥미 개념 모델을 통한 개방성
dd | 2024.07.04 | 추천 0 | 조회 416
dd 2024.07.04 0 416
107
월드 모델링을 위한 확산: Atari에서는 시각적 세부 사항이 중요합니다
dd | 2024.07.04 | 추천 0 | 조회 397
dd 2024.07.04 0 397
106
플라톤적 표현 가설
ㅇㅇ | 2024.07.04 | 추천 2 | 조회 507
ㅇㅇ 2024.07.04 2 507
105
xLSTM: 확장된 장단기 메모리
dd | 2024.07.04 | 추천 0 | 조회 567
dd 2024.07.04 0 567
104
대표성 없음, 신뢰 없음: PPO에서 대표성, 붕괴, 신뢰 문제 연결
dd | 2024.07.04 | 추천 0 | 조회 435
dd 2024.07.04 0 435
103
세계 모델을 통한 다양한 도메인 마스터링 (DreamerV3)
dd | 2024.07.04 | 추천 0 | 조회 402
dd 2024.07.04 0 402
102
NExT: 대규모 언어 모델에 코드 실행에 대한 추론을 가르치기
ㅇㅇ | 2024.07.04 | 추천 0 | 조회 417
ㅇㅇ 2024.07.04 0 417
101
KAN: 콜모고로프-아놀드 네트웍스
dd | 2024.07.04 | 추천 0 | 조회 369
dd 2024.07.04 0 369
100
다중 토큰 예측을 통한 더 나은, 더 빠른 대규모 언어 모델
dd | 2024.07.04 | 추천 0 | 조회 324
dd 2024.07.04 0 324
99
점 하나하나씩 생각하자: Transformer 언어모델의 숨겨진 계산
dd | 2024.07.04 | 추천 0 | 조회 299
dd 2024.07.04 0 299
98
언어모델은 비밀리에 Q-함수입니다
dd | 2024.07.04 | 추천 0 | 조회 312
dd 2024.07.04 0 312
97
자가 플레이 적대 언어 게임은 LLM 추론을 향상시킵니다.
dd | 2024.07.04 | 추천 0 | 조회 522
dd 2024.07.04 0 522
96
여러 시뮬레이션된 세계에서 Instructable 에이전트 확장
dd | 2024.07.04 | 추천 0 | 조회 433
dd 2024.07.04 0 433
95
압축은 지능을 선형적으로 나타냅니다.
dd | 2024.07.04 | 추천 0 | 조회 431
dd 2024.07.04 0 431
94
Generalist Vision Transformer를 향하여
dd | 2024.07.04 | 추천 0 | 조회 297
dd 2024.07.04 0 297
93
Quiet-STaR: 언어 모델은 말하기 전에 스스로 생각하는 법을 배울 수 있습니다.
dd | 2024.07.04 | 추천 0 | 조회 517
dd 2024.07.04 0 517