최신논문

전체 257
번호 제목 작성자 작성일 추천 조회
17
(2023년 8월) AI 다양화: AlphaZero를 통한 창의적인 체스를 향하여
| 2024.06.25 | 추천 0 | 조회 334
2024.06.25 0 334
16
(2023년 8월) 언어 모델링을 위한 강화된 자기 훈련(ReST)
| 2024.06.25 | 추천 0 | 조회 434
2024.06.25 0 434
15
(2023년 8월) 트랜스포머 아키텍처를 위한 구성 가능한 기능 보존 확장
| 2024.06.25 | 추천 0 | 조회 353
2024.06.25 0 353
14
(2023년 8월) 딥마인드 AlphaStar Unplugged: 대규모 오프라인 강화학습
| 2024.06.25 | 추천 0 | 조회 344
2024.06.25 0 344
13
(2023년 5월) 직접적인 선호 최적화: 당신의 언어모델은 비밀리에 보상모델입니다
| 2024.06.25 | 추천 0 | 조회 349
2024.06.25 0 349
12
(2023년 5월) 뒤늦은 경험의 사슬에서 나온 긴급 에이전트 트랜스포머
| 2024.06.25 | 추천 0 | 조회 352
2024.06.25 0 352
11
(2023년 6월) 딥마인드 자가개선 로봇 에이전트 RoboCat
| 2024.06.25 | 추천 0 | 조회 364
2024.06.25 0 364
10
(2023년 5월) Voyager: 대규모 언어모델을 사용하는 개방형 구현 에이전트
| 2024.06.25 | 추천 0 | 조회 361
2024.06.25 0 361
9
(2023년 6월) 감독된 사전훈련은 상황 내 강화학습을 학습할 수 있음
| 2024.06.25 | 추천 0 | 조회 445
2024.06.25 0 445
8
(2023년 8월) AutoGen: 다중 에이전트 대화를 통해 차세대 LLM 애플리케이션 활성화
| 2024.06.25 | 추천 0 | 조회 535
2024.06.25 0 535