Qwen | |
<colbgcolor=#ddd,#000> 분류 | 소형 언어 모델 |
개발사 | 알리바바 클라우드 |
출시일 | Qwen-1 2023년 8월 3일Qwen-1.5 2024년 2월 4일Qwen-2 2024년 6월 7일Qwen-2.5 2024년 9월 19일 |
버전 | 2.5 |
링크 | 체험 사이트 |
[clearfix]
1. 개요
Qwen은 알리바바 클라우드의 오픈 소스 언어 모델이다.2. 제품
2.1. Qwen-1
1.8B, 7B, 14B, 72B 4가지 크기의 모델로 출시되었다. 2023년 8월 3일에 7B가, 9월 25일에 14B가, 11월 30일에 1.8B와 72B가 출시되었다. GPT-3.5와 GPT-4에 근접하는 성능을 보여준다는 자체적인 평가 데이터가 공개되었다.2024년 1월 25일에 영상 분석 특화 모델인 Qwen-VL이 공개되었다.
2.2. Qwen-1.5
2024년 2월 4일에 공개되었으며, 0.5B, 1.8B, 4B, 7B, 14B, 72B 6가지 모델로 출시되었다. GPT-3.5 대비 언어를 이해하는 능력이 월등하다는 평가 데이터가 공개되었다. 2024년 4월 2일에 32B가, 4월 25일에 110B 모델이 추가로 공개되었다.2024년 4월 16일에 Qwen-1.5를 기반으로 한 CodeQwen1.5을 공개했다.
2024년 5월 11일에 Qwen-1.5-110B을 파인-튜닝한 Qwen-Max-0428을 공개했다.
2.3. Qwen-2
2024년 6월 7일에 공개되었으며, 0.5B, 1.5B, 7B, 57B-A14B, 72B 5가지 모델로 출시되었다. 72B 모델의 경우, 벤치마크에서 Llama 3 70B, Mixtral 8x22B와 Qwen 1.5-110B 모델을 완전히 제압하는 성능을 과시했다.2024년 8월 8일에 Qwen2를 기반으로 한 수학 특화 모델인 Qwen2-Math[1] 모델과 음성 분석 특화 모델인 Qwen2-Audio[2] 모델을 발표했다.
2024년 8월 29일에 Qwen2를 기반으로 한 이미지 분석 특화 모델인 Qwen2-VL[3] 모델을 발표했다. GPT-4o-0513과 Claude 3.5-Sonnet을 압도적으로 앞서는 성능을 보여줬다.#
2.4. Qwen-2.5
2024년 9월 19일에 Qwen2보다 개선된 2.5 모델을 발표했다. 0.5B, 1.5B, 3B, 7B, 14B, 32B, 72B 7가지의 모델로 구성되어 있으며, 이 중 3B와 72B를 제외하고 나머지 모델들은 모두 Apache 2.0 라이센스가 적용되었다. 수학 특화 모델인 Qwen2.5-Math[4] 모델 또한 공개되었다.2024년 11월 12일에는 코딩 특화 모델인 Qwen2.5-Coder[5] 모델을 발표했다.
2025년 1월 26일에 Qwen2.5-VL[6] 모델을 발표했다.
기존 2.0-VL 모델 대비 큰폭의 성능 향상이 돋보인다.
2025년 1월 27일에 대화 토큰을 1M까지 가능하게 발전시킨 Qwen2.5-1M[7]을 공개했다.
2025년 1월 28일에 Qwen2.5-Max 모델을 공개했다.
모든 밴치마크 영역에서 DeepSeek-V3를 뛰어넘은것으로 평가되었으며, 100B 크기의 모델인것으로 밝혀졌다.
알리클라우드에서 API로 호출해 사용이 가능하며, 주기적으로 롤링 모드 업데이트를 한다고 밝혔다.