Qwen | |
<colbgcolor=#ddd,#000> 분류 | 소형 언어 모델 |
개발사 | 알리바바 클라우드 |
출시일 | Qwen-1 2023년 8월 3일Qwen-1.5 2024년 2월 4일Qwen-2 2024년 6월 7일Qwen-2.5 2024년 9월 19일 |
버전 | 2.5 |
링크 |
[clearfix]
1. 개요
Qwen은 알리바바 클라우드의 오픈소스 언어 모델이다.2. 제품
2.1. Qwen-1
1.8B, 7B, 14B, 72B 4가지 크기의 모델로 출시되었다. 2023년 8월 3일에 7B가, 9월 25일에 14B가, 11월 30일에 1.8B와 72B가 출시되었다. GPT-3.5와 GPT-4에 근접하는 성능을 보여준다는 자체적인 평가 데이터가 공개되었다.2.2. Qwen-1.5
2024년 2월 4일에 공개되었으며, 0.5B, 1.8B, 4B, 7B, 14B, 72B 6가지 모델로 출시되었다. GPT-3.5 대비 언어를 이해하는 능력이 월등하다는 평가 데이터가 공개되었다. 2024년 4월 2일에 32B가, 4월 25일에 110B 모델이 추가로 공개되었다.2.3. Qwen-2
2024년 6월 7일에 공개되었으며, 0.5B, 1.5B, 7B, 57B-A14B, 72B 5가지 모델로 출시되었다. 72B 모델의 경우, 벤치마크에서 Llama 3 70B, Mixtral 8x22B와 Qwen 1.5-110B 모델을 완전히 제압하는 성능을 과시했다.2024년 8월 8일에 Qwen2를 기반으로 한 수학 특화 모델인 "Qwen2-Math"[1] 모델과 음성 분석 특화 모델인 "Qwen2-Audio"[2] 모델을 발표했다.
2024년 8월 29일에 Qwen2를 기반으로 한 이미지 분석 특화 모델인 "Qwen2-VL"[3] 모델을 발표했다. GPT-4o-0513과 Claude 3.5-Sonnet을 압도적으로 앞서는 성능을 보여줬다.#
2.4. Qwen-2.5
2024년 9월 19일에 Qwen2보다 개선된 2.5 모델을 발표했다. 0.5B, 1.5B, 3B, 7B, 14B, 32B, 72B 7가지의 모델로 구성되어 있으며, 이 중 3B와 72B를 제외하고 나머지 모델들은 모두 Apache 2.0 라이센스가 적용되었다. 수학 특화 모델인 "Qwen2.5-Math"[4] 모델 또한 공개되었다.2024년 11월 12일에는 코딩 특화 모델인 "Qwen2.5-Coder"[5] 모델을 발표했다.