최신논문
전체 252
| 번호 | 제목 | 작성자 | 작성일 | 추천 | 조회 |
| 인기글 |
Transfusion: 다음 토큰을 예측하고 하나의 Multi-Modal 모델로 이미지를 확산시킵니다.
하이룽룽
|
2024.08.21
|
추천 1
|
조회 588
|
하이룽룽 | 2024.08.21 | 1 | 588 |
| 인기글 |
코딩할 것인가, 코딩하지 않을 것인가? 사전 교육에서 코드의 영향 탐색
하이룽룽
|
2024.08.21
|
추천 1
|
조회 798
|
하이룽룽 | 2024.08.21 | 1 | 798 |
| 인기글 |
일반 에이전트에는 세계 모델이 필요합니다. (4)
하이룽룽
|
2025.06.04
|
추천 0
|
조회 253
|
하이룽룽 | 2025.06.04 | 0 | 253 |
| 인기글 |
V-JEPA 2 소개
하이룽룽
|
2025.06.15
|
추천 2
|
조회 226
|
하이룽룽 | 2025.06.15 | 2 | 226 |
| 인기글 |
AlphaProof 방법론 공개
하이룽룽
|
2025.11.13
|
추천 2
|
조회 73
|
하이룽룽 | 2025.11.13 | 2 | 73 |
| 인기글 |
트랜스포머만으로도 이론상 AGI(범용 인공지능)에 도달할 수 있다 (3)
하이룽룽
|
2025.12.07
|
추천 2
|
조회 101
|
하이룽룽 | 2025.12.07 | 2 | 101 |
| 인기글 |
재귀적 자기 집계는 대규모 언어 모델에서 심층적 사고를 가능하게 합니다
하이룽룽
|
2026.01.25
|
추천 2
|
조회 42
|
하이룽룽 | 2026.01.25 | 2 | 42 |
| 인기글 |
플라톤적 표현 가설
ㅇㅇ
|
2024.07.04
|
추천 2
|
조회 507
|
ㅇㅇ | 2024.07.04 | 2 | 507 |
| 인기글 |
(2023년 7월) LongNet: 트랜스포머를 1,000,000,000 토큰으로 확장
admin
|
2024.06.25
|
추천 1
|
조회 880
|
admin | 2024.06.25 | 1 | 880 |
| 인기글 |
New 닉 보스트롬 2026년 논문 - 초지능을 위한 최적의 시기
하이룽룽
|
2026.02.13
|
추천 1
|
조회 11
|
하이룽룽 | 2026.02.13 | 1 | 11 |
| 52 |
고밀도 비전 작업을 위한 확산 기반 일반주의자를 향하여
ㅇㅇ
|
2024.07.02
|
추천 0
|
조회 266
|
ㅇㅇ | 2024.07.02 | 0 | 266 |
| 51 |
대규모 멀티모달 언어모델에서는 인간과 유사한 객체 개념 표현이 자연스럽게 나타납니다.
ㅇㅇ
|
2024.07.02
|
추천 0
|
조회 295
|
ㅇㅇ | 2024.07.02 | 0 | 295 |
| 50 |
(2023년 10월) 파운데이션 강화 학습: 파운데이션 사전 지원을 통해 구체화된 일반 요원을 향함
admin
|
2024.07.01
|
추천 0
|
조회 268
|
admin | 2024.07.01 | 0 | 268 |
| 49 |
1,000,000,000개의 페르소나로 합성 데이터 생성 확장
ㅇㅇ
|
2024.07.01
|
추천 0
|
조회 268
|
ㅇㅇ | 2024.07.01 | 0 | 268 |
| 48 |
(2023년 10월) 언어모델은 공간과 시간을 표현합니다
admin
|
2024.07.01
|
추천 0
|
조회 364
|
admin | 2024.07.01 | 0 | 364 |
| 47 |
(2023년 10월) 거의 무한한 컨텍스트를 위한 Blockwise Transformers를 사용한 링 어텐션
admin
|
2024.07.01
|
추천 0
|
조회 477
|
admin | 2024.07.01 | 0 | 477 |
| 46 |
(2023년 10월) 신경망의 관계적 제약은 추상적 기하학적 규칙성에 대한 인간의 편견을 재현합니다.
admin
|
2024.07.01
|
추천 0
|
조회 292
|
admin | 2024.07.01 | 0 | 292 |
| 45 |
(2023년 10월) 말하기 전에 생각하세요: 일시정지 토큰을 사용한 언어 모델 훈련
admin
|
2024.07.01
|
추천 0
|
조회 266
|
admin | 2024.07.01 | 0 | 266 |
| 44 |
(2023년 10월) Self-Taught Optimizer(STOP): 반복적으로 자체 개선
admin
|
2024.07.01
|
추천 0
|
조회 272
|
admin | 2024.07.01 | 0 | 272 |
| 43 |
(2023년 10월) 의심 에이전트: 마음 이론 인식 GPT-4를 사용하여 불완전한 정보 게임하기
admin
|
2024.07.01
|
추천 0
|
조회 435
|
admin | 2024.07.01 | 0 | 435 |
| 42 |
(2023년 10월) RLAdapter: 오픈월드에서 대규모 언어모델과 강화학습 연결
admin
|
2024.07.01
|
추천 0
|
조회 337
|
admin | 2024.07.01 | 0 | 337 |
| 41 |
(2023년 10월) 알파제로와 유사한 트리 검색으로 대규모 언어모델 디코딩 및 학습 가이드
admin
|
2024.07.01
|
추천 0
|
조회 315
|
admin | 2024.07.01 | 0 | 315 |
| 40 |
혼합 RL 설정의 전문가 혼합
ㅇㅇ
|
2024.06.27
|
추천 0
|
조회 515
|
ㅇㅇ | 2024.06.27 | 0 | 515 |
| 39 |
공동 사례 선택을 통한 데이터 큐레이션으로 다중 모드 학습이 더욱 가속화됩니다.
admin
|
2024.06.27
|
추천 0
|
조회 380
|
admin | 2024.06.27 | 0 | 380 |
| 38 |
더 크고, 정규화되고, 낙관적입니다. 컴퓨팅 및 샘플 효율적 연속 제어를 위한 확장
ㅇㅇ
|
2024.06.27
|
추천 0
|
조회 384
|
ㅇㅇ | 2024.06.27 | 0 | 384 |
| 37 |
(2023년 9월) 멀티모달 기반 모델: 전문가에서 범용 보조자까지
admin
|
2024.06.26
|
추천 0
|
조회 423
|
admin | 2024.06.26 | 0 | 423 |
| 36 |
(2023년 9월) 언어 모델링은 압축이다
admin
|
2024.06.26
|
추천 1
|
조회 500
|
admin | 2024.06.26 | 1 | 500 |
| 35 |
(2023년 9월) 자동회귀 다음 토큰 예측자는 범용 학습기입니다.
admin
|
2024.06.26
|
추천 0
|
조회 369
|
admin | 2024.06.26 | 0 | 369 |
| 34 |
(2023년 9월) Vision Transformers에서 Softmax를 ReLU로 교체
admin
|
2024.06.26
|
추천 0
|
조회 352
|
admin | 2024.06.26 | 0 | 352 |
| 33 |
(2023년 8월) 대규모 언어모델은 인간과 유사한 개념 구성으로 수렴됩니다
admin
|
2024.06.26
|
추천 0
|
조회 430
|
admin | 2024.06.26 | 0 | 430 |