뉴스/정보
Qwen2-Math 발표
작성자
하이룽룽
작성일
2024-08-08 23:39
조회
751
https://qwenlm.github.io/blog/qwen2-math/

작년에 우리는 대규모 언어 모델의 추론 능력을 연구하고 향상시키는 데 상당한 노력을 기울였으며, 특히 산술 및 수학 문제를 해결하는 능력에 중점을 두었습니다. 오늘 우리는 Qwen2 시리즈의 수학 전문 대규모 언어 모델인 Qwen2-Math와 Qwen2-Math-Instruct-1.5B/7B/72B를 소개하게 되어 기쁩니다. Qwen2-Math는 Qwen2 LLM을 기반으로 구축된 일련의 전문 수학 언어 모델로, 오픈 소스 모델과 심지어 폐쇄 소스 모델(예: GPT-4o)의 수학적 능력을 크게 능가합니다. 우리는 Qwen2-Math가 복잡한 수학 문제를 해결하는 커뮤니티에 기여할 수 있기를 바랍니다.
우리는 일련의 수학 벤치마크에서 수학 전용 모델을 평가합니다. 아래 결과는 우리의 가장 큰 수학 전용 모델인 Qwen2-Math-72B-Instruct가 GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro, Llama-3.1-405B를 포함한 최첨단 모델보다 성능이 우수하다는 것을 보여줍니다.

작년에 우리는 대규모 언어 모델의 추론 능력을 연구하고 향상시키는 데 상당한 노력을 기울였으며, 특히 산술 및 수학 문제를 해결하는 능력에 중점을 두었습니다. 오늘 우리는 Qwen2 시리즈의 수학 전문 대규모 언어 모델인 Qwen2-Math와 Qwen2-Math-Instruct-1.5B/7B/72B를 소개하게 되어 기쁩니다. Qwen2-Math는 Qwen2 LLM을 기반으로 구축된 일련의 전문 수학 언어 모델로, 오픈 소스 모델과 심지어 폐쇄 소스 모델(예: GPT-4o)의 수학적 능력을 크게 능가합니다. 우리는 Qwen2-Math가 복잡한 수학 문제를 해결하는 커뮤니티에 기여할 수 있기를 바랍니다.
우리는 일련의 수학 벤치마크에서 수학 전용 모델을 평가합니다. 아래 결과는 우리의 가장 큰 수학 전용 모델인 Qwen2-Math-72B-Instruct가 GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro, Llama-3.1-405B를 포함한 최첨단 모델보다 성능이 우수하다는 것을 보여줍니다.
전체 0