최신논문

전체 256
번호 제목 작성자 작성일 추천 조회
16
(2023년 8월) 언어 모델링을 위한 강화된 자기 훈련(ReST)
admin | 2024.06.25 | 추천 0 | 조회 426
admin 2024.06.25 0 426
15
(2023년 8월) 트랜스포머 아키텍처를 위한 구성 가능한 기능 보존 확장
admin | 2024.06.25 | 추천 0 | 조회 346
admin 2024.06.25 0 346
14
(2023년 8월) 딥마인드 AlphaStar Unplugged: 대규모 오프라인 강화학습
admin | 2024.06.25 | 추천 0 | 조회 337
admin 2024.06.25 0 337
13
(2023년 5월) 직접적인 선호 최적화: 당신의 언어모델은 비밀리에 보상모델입니다
admin | 2024.06.25 | 추천 0 | 조회 340
admin 2024.06.25 0 340
12
(2023년 5월) 뒤늦은 경험의 사슬에서 나온 긴급 에이전트 트랜스포머
admin | 2024.06.25 | 추천 0 | 조회 344
admin 2024.06.25 0 344
11
(2023년 6월) 딥마인드 자가개선 로봇 에이전트 RoboCat
admin | 2024.06.25 | 추천 0 | 조회 355
admin 2024.06.25 0 355
10
(2023년 5월) Voyager: 대규모 언어모델을 사용하는 개방형 구현 에이전트
admin | 2024.06.25 | 추천 0 | 조회 352
admin 2024.06.25 0 352
9
(2023년 6월) 감독된 사전훈련은 상황 내 강화학습을 학습할 수 있음
admin | 2024.06.25 | 추천 0 | 조회 436
admin 2024.06.25 0 436
8
(2023년 8월) AutoGen: 다중 에이전트 대화를 통해 차세대 LLM 애플리케이션 활성화
admin | 2024.06.25 | 추천 0 | 조회 526
admin 2024.06.25 0 526
7
(2023년 8월) 구글 딥마인드 Soft MoE
admin | 2024.06.25 | 추천 0 | 조회 643
admin 2024.06.25 0 643
6
(2023년 8월) 히드라 효과: 언어모델 계산의 새로운 자가 복구
admin | 2024.06.25 | 추천 0 | 조회 485
admin 2024.06.25 0 485
5
(2023년 5월) Spring: GPT-4는 논문과 추론을 연구하여 RL 알고리즘을 능가합니다.
admin | 2024.06.25 | 추천 0 | 조회 844
admin 2024.06.25 0 844
4
(2023년 7월) LongNet: 트랜스포머를 1,000,000,000 토큰으로 확장
admin | 2024.06.25 | 추천 1 | 조회 928
admin 2024.06.25 1 928
3
(2023년 6월) Block-State Transformer
admin | 2024.06.25 | 추천 0 | 조회 735
admin 2024.06.25 0 735
2
(2023년 7월)딥마인드 유전 프로그래밍 분야의 최신 작업 AutoRobotics-Zero
admin | 2024.06.25 | 추천 0 | 조회 594
admin 2024.06.25 0 594
1
(2023년 7월) No Train No Gain
admin | 2024.06.25 | 추천 0 | 조회 409
admin 2024.06.25 0 409