최신논문
전체 252
| 번호 | 제목 | 작성자 | 작성일 | 추천 | 조회 |
| 인기글 |
Transfusion: 다음 토큰을 예측하고 하나의 Multi-Modal 모델로 이미지를 확산시킵니다.
하이룽룽
|
2024.08.21
|
추천 1
|
조회 588
|
하이룽룽 | 2024.08.21 | 1 | 588 |
| 인기글 |
코딩할 것인가, 코딩하지 않을 것인가? 사전 교육에서 코드의 영향 탐색
하이룽룽
|
2024.08.21
|
추천 1
|
조회 798
|
하이룽룽 | 2024.08.21 | 1 | 798 |
| 인기글 |
일반 에이전트에는 세계 모델이 필요합니다. (4)
하이룽룽
|
2025.06.04
|
추천 0
|
조회 253
|
하이룽룽 | 2025.06.04 | 0 | 253 |
| 인기글 |
V-JEPA 2 소개
하이룽룽
|
2025.06.15
|
추천 2
|
조회 226
|
하이룽룽 | 2025.06.15 | 2 | 226 |
| 인기글 |
AlphaProof 방법론 공개
하이룽룽
|
2025.11.13
|
추천 2
|
조회 73
|
하이룽룽 | 2025.11.13 | 2 | 73 |
| 인기글 |
트랜스포머만으로도 이론상 AGI(범용 인공지능)에 도달할 수 있다 (3)
하이룽룽
|
2025.12.07
|
추천 2
|
조회 101
|
하이룽룽 | 2025.12.07 | 2 | 101 |
| 인기글 |
재귀적 자기 집계는 대규모 언어 모델에서 심층적 사고를 가능하게 합니다
하이룽룽
|
2026.01.25
|
추천 2
|
조회 42
|
하이룽룽 | 2026.01.25 | 2 | 42 |
| 인기글 |
플라톤적 표현 가설
ㅇㅇ
|
2024.07.04
|
추천 2
|
조회 507
|
ㅇㅇ | 2024.07.04 | 2 | 507 |
| 인기글 |
(2023년 7월) LongNet: 트랜스포머를 1,000,000,000 토큰으로 확장
admin
|
2024.06.25
|
추천 1
|
조회 880
|
admin | 2024.06.25 | 1 | 880 |
| 인기글 |
New 닉 보스트롬 2026년 논문 - 초지능을 위한 최적의 시기
하이룽룽
|
19:43
|
추천 1
|
조회 10
|
하이룽룽 | 19:43 | 1 | 10 |
| 92 |
1비트 LLM 시대: 모든 대규모 언어 모델은 1.58비트입니다.
dd
|
2024.07.04
|
추천 0
|
조회 318
|
dd | 2024.07.04 | 0 | 318 |
| 91 |
언어모델을 넘어: 바이트 모델은 디지털 세계 시뮬레이터입니다.
dd
|
2024.07.04
|
추천 0
|
조회 280
|
dd | 2024.07.04 | 0 | 280 |
| 90 |
그리핀: 효율적인 언어 모델을 위한 지역적 주의와 게이트 선형 재귀를 혼합
ㅇㅇ
|
2024.07.04
|
추천 0
|
조회 276
|
ㅇㅇ | 2024.07.04 | 0 | 276 |
| 89 |
트랜스포머가 경사 하강을 통해 인과 구조를 학습하는 방법
dd
|
2024.07.04
|
추천 0
|
조회 280
|
dd | 2024.07.04 | 0 | 280 |
| 88 |
Genie: 생성적 상호 작용 환경
dd
|
2024.07.04
|
추천 0
|
조회 280
|
dd | 2024.07.04 | 0 | 280 |
| 87 |
강력한 에이전트는 인과 세계 모델을 학습합니다.
dd
|
2024.07.04
|
추천 0
|
조회 261
|
dd | 2024.07.04 | 0 | 261 |
| 86 |
전문가의 혼합으로 심층 RL을 위한 매개변수 스케일링 잠금 해제
dd
|
2024.07.04
|
추천 0
|
조회 266
|
dd | 2024.07.04 | 0 | 266 |
| 85 |
전문가의 세분화된 혼합을 위한 스케일링 법칙
dd
|
2024.07.04
|
추천 0
|
조회 328
|
dd | 2024.07.04 | 0 | 328 |
| 84 |
OS-Copilot: 자기 개선을 통한 일반 컴퓨터 에이전트를 향하여
dd
|
2024.07.04
|
추천 0
|
조회 256
|
dd | 2024.07.04 | 0 | 256 |
| 83 |
LLM 에이전트는 웹사이트를 자율적으로 해킹할 수 있습니다
dd
|
2024.07.04
|
추천 0
|
조회 266
|
dd | 2024.07.04 | 0 | 266 |
| 82 |
대규모 언어 모델을 위한 시간의 화살표
dd
|
2024.07.04
|
추천 0
|
조회 269
|
dd | 2024.07.04 | 0 | 269 |
| 81 |
신경망의 학습가능성의 경계는 프랙탈이다
ㅇㅇ
|
2024.07.04
|
추천 0
|
조회 279
|
ㅇㅇ | 2024.07.04 | 0 | 279 |
| 80 |
자기 보상 언어모델
dd
|
2024.07.04
|
추천 0
|
조회 296
|
dd | 2024.07.04 | 0 | 296 |
| 79 |
GATS: 모으다-참석하다-흩어지다
dd
|
2024.07.04
|
추천 0
|
조회 463
|
dd | 2024.07.04 | 0 | 463 |
| 78 |
자가 재생 미세 조정을 통해 약한 언어 모델을 강력한 언어 모델로 변환
dd
|
2024.07.04
|
추천 0
|
조회 423
|
dd | 2024.07.04 | 0 | 423 |
| 77 |
ReST는 ReAct를 만납니다: 다단계 추론을 위한 자기개선 LLM 에이전트
dd
|
2024.07.03
|
추천 0
|
조회 285
|
dd | 2024.07.03 | 0 | 285 |
| 76 |
비지도 LLM 지식 발견의 과제
dd
|
2024.07.03
|
추천 0
|
조회 261
|
dd | 2024.07.03 | 0 | 261 |
| 75 |
인간 데이터를 넘어서: 언어 모델을 통한 문제 해결을 위한 자체 훈련 확장
ㅇㅇ
|
2024.07.03
|
추천 0
|
조회 245
|
ㅇㅇ | 2024.07.03 | 0 | 245 |
| 74 |
MatterGen: 무기 재료 설계를 위한 생성 모델
dd
|
2024.07.03
|
추천 0
|
조회 274
|
dd | 2024.07.03 | 0 | 274 |
| 73 |
잠재 변수 추론을 통한 사고 사슬 훈련
dd
|
2024.07.03
|
추천 0
|
조회 264
|
dd | 2024.07.03 | 0 | 264 |