최신논문

전체 254
번호 제목 작성자 작성일 추천 조회
94
Generalist Vision Transformer를 향하여
dd | 2024.07.04 | 추천 0 | 조회 336
dd 2024.07.04 0 336
93
Quiet-STaR: 언어 모델은 말하기 전에 스스로 생각하는 법을 배울 수 있습니다.
dd | 2024.07.04 | 추천 0 | 조회 553
dd 2024.07.04 0 553
92
1비트 LLM 시대: 모든 대규모 언어 모델은 1.58비트입니다.
dd | 2024.07.04 | 추천 0 | 조회 354
dd 2024.07.04 0 354
91
언어모델을 넘어: 바이트 모델은 디지털 세계 시뮬레이터입니다.
dd | 2024.07.04 | 추천 0 | 조회 318
dd 2024.07.04 0 318
90
그리핀: 효율적인 언어 모델을 위한 지역적 주의와 게이트 선형 재귀를 혼합
ㅇㅇ | 2024.07.04 | 추천 0 | 조회 311
ㅇㅇ 2024.07.04 0 311
89
트랜스포머가 경사 하강을 통해 인과 구조를 학습하는 방법
dd | 2024.07.04 | 추천 0 | 조회 315
dd 2024.07.04 0 315
88
Genie: 생성적 상호 작용 환경
dd | 2024.07.04 | 추천 0 | 조회 316
dd 2024.07.04 0 316
87
강력한 에이전트는 인과 세계 모델을 학습합니다.
dd | 2024.07.04 | 추천 0 | 조회 298
dd 2024.07.04 0 298
86
전문가의 혼합으로 심층 RL을 위한 매개변수 스케일링 잠금 해제
dd | 2024.07.04 | 추천 0 | 조회 302
dd 2024.07.04 0 302
85
전문가의 세분화된 혼합을 위한 스케일링 법칙
dd | 2024.07.04 | 추천 0 | 조회 365
dd 2024.07.04 0 365
84
OS-Copilot: 자기 개선을 통한 일반 컴퓨터 에이전트를 향하여
dd | 2024.07.04 | 추천 0 | 조회 293
dd 2024.07.04 0 293
83
LLM 에이전트는 웹사이트를 자율적으로 해킹할 수 있습니다
dd | 2024.07.04 | 추천 0 | 조회 305
dd 2024.07.04 0 305
82
대규모 언어 모델을 위한 시간의 화살표
dd | 2024.07.04 | 추천 0 | 조회 309
dd 2024.07.04 0 309
81
신경망의 학습가능성의 경계는 프랙탈이다
ㅇㅇ | 2024.07.04 | 추천 0 | 조회 321
ㅇㅇ 2024.07.04 0 321
80
자기 보상 언어모델
dd | 2024.07.04 | 추천 0 | 조회 337
dd 2024.07.04 0 337
79
GATS: 모으다-참석하다-흩어지다
dd | 2024.07.04 | 추천 0 | 조회 501
dd 2024.07.04 0 501
78
자가 재생 미세 조정을 통해 약한 언어 모델을 강력한 언어 모델로 변환
dd | 2024.07.04 | 추천 0 | 조회 465
dd 2024.07.04 0 465
77
ReST는 ReAct를 만납니다: 다단계 추론을 위한 자기개선 LLM 에이전트
dd | 2024.07.03 | 추천 0 | 조회 327
dd 2024.07.03 0 327
76
비지도 LLM 지식 발견의 과제
dd | 2024.07.03 | 추천 0 | 조회 298
dd 2024.07.03 0 298
75
인간 데이터를 넘어서: 언어 모델을 통한 문제 해결을 위한 자체 훈련 확장
ㅇㅇ | 2024.07.03 | 추천 0 | 조회 280
ㅇㅇ 2024.07.03 0 280