자유게시판
엔비디아 네모트론 3 나노 발표
작성자
하이룽룽
작성일
2025-12-15 23:39
조회
3
https://research.nvidia.com/labs/nemotron/Nemotron-3/?ncid=ref-inor-399942
https://docs.unsloth.ai/models/nemotron-3
https://huggingface.co/unsloth/Nemotron-3-Nano-30B-A3B-GGUF
Super와 Ultra 모델은 향후 몇 달 내에 출시될 예정
Nemotron 3 Nano는 다른 주요 오픈 소스 모델과 경쟁력이 있지만 속도는 1.5~3.3배 더 빠릅니다.
Nemotron 3 Super (Nano보다 약 4배 큼)와 Ultra (Nano보다 약 16배 큼)는 새로운 "잠재적 전문가 혼합(Latent Mixture of Experts)" 아키텍처인 NVFP4와 다중 토큰 예측(Multi-Token Prediction)을 사용하여 사전 학습되었습니다. 이 아키텍처를 통해 동일한 추론 비용으로 4배 더 많은 전문가를 사용할 수 있습니다.
https://docs.unsloth.ai/models/nemotron-3
https://huggingface.co/unsloth/Nemotron-3-Nano-30B-A3B-GGUF
Super와 Ultra 모델은 향후 몇 달 내에 출시될 예정
Nemotron 3 Nano는 다른 주요 오픈 소스 모델과 경쟁력이 있지만 속도는 1.5~3.3배 더 빠릅니다.
Nemotron 3 Super (Nano보다 약 4배 큼)와 Ultra (Nano보다 약 16배 큼)는 새로운 "잠재적 전문가 혼합(Latent Mixture of Experts)" 아키텍처인 NVFP4와 다중 토큰 예측(Multi-Token Prediction)을 사용하여 사전 학습되었습니다. 이 아키텍처를 통해 동일한 추론 비용으로 4배 더 많은 전문가를 사용할 수 있습니다.
전체 0