Qwen

언어 모델
{{{#!wiki style="margin:-0px -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"	OpenAI	GPT (1 · 2 · 3 · 4.x · 5.x · 6^{개발 중}) GPT-OSS (20B · 120B) OpenAI (o1 · o3 · o4)
구글	Gemini (1 · 1.5 · 2 · 2.5 · 3 · 3.1 · 3.5) Gemma · LaMDA · PaLM 2
Anthropic	Claude (~~Fable~~ · Opus · Sonnet · Haiku)
xAI	Grok
메타	LLaMA · Muse Spark
기타	HyperCLOVA(네이버) · 카나나(카카오) · 삼성 가우스(삼성전자) · 엑사원(LG AI연구원) · 믿:음(KT) · A.X(SK텔레콤) · Solar(업스테이지) NVIDIA Nemotron(NVIDIA) · Phi(Microsoft) · Apple Foundation Models · OpenELM(Apple) DeepSeek · Qwen(알리바바) · 어니봇(바이두) · Kimi(Moonshot AI) · MiniMax · Z.ai(GLM) 나마즈(Sakana AI)	}}}}}}}}}

<colbgcolor=#615ced,#615ced><colcolor=#fff,#fff> Qwen

분류	언어 모델
개발사	Tongyi Lab [1]
출시일	Qwen-1 2023년 8월 3일 Qwen-1.5 2024년 2월 4일 Qwen-2 2024년 6월 7일 Qwen-2.5 2024년 9월 19일 Qwen-3 2025년 4월 29일 Qwen-3.5 2026년 2월 16일 Qwen-3.6 2026년 4월 2일 Qwen-3.7 2026년 5월 20일
버전	Qwen-3.7
링크	[2]

1. 개요2. 제품

2.1. Qwen-12.2. Qwen-1.52.3. Qwen-22.4. Qwen-2.52.5. Qwen-3

2.5.1. Qwen-3-Next

2.5.1.1. Qwen3-Coder-Next

2.6. Qwen-3.52.7. Qwen-3.62.8. Qwen-3.72.9. Qwen-Image

2.9.1. Qwen-Image-Edit

2.10. QwQ

2.10.1. QwQ-Max2.10.2. QwQ-32B

2.11. QVQ

2.11.1. QVQ-Max

3. 챗봇4. 브라우저

1. 개요

알리바바 클라우드 산하 연구소 通义(Tong yi)에서 개발하는 오픈 소스 언어 모델이다. 이름은 千问(Qianwen)[3]에서 유래했다고 한다. 퀜 또는 쿠엔 이라고 읽는다.[4]

2025년 4월 25일 드디어 앱을 출시했다. 다만, 한국과 독일을 비롯한 많은 곳에서는 지역 문제로 다운로드가 불가하나 추후 가능해질 것이라고 한다.

2025년 11월 13일 블룸버그 소식으로, 알리바바가 Qwen을 ChatGPT와 유사한 형태로 전면 개편하는 작업을 진행 중에 있으며, 향후 몇 달 안에 자사의 소비자용 AI앱인 '통이(Tongyi)'와 '쿼크(QUARK)'앱을 Qwen으로 통합함과 동시에, Qwen 앱의 글로벌 버전도 출시하는 것이 목표라고 한다. 지난 몇 달 동안 이를 위해 비밀리에 프로젝트를 실행해 왔으며, 100명 이상의 개발자를 알리바바 소유 건물 2개 층을 통으로 사용하게 할 정도로 공을 크게 들였다고 한다. #

마침내 2025년 11월 17일, 알리바바 그룹에서 직접 새로운 Qwen 앱을 발표했다. 다만 중국 내 한정으로 베타를 시작했으며, 글로벌 버전은 더 기다려야 한다고 한다.

2026년 3월 4일, 3.5버전 공개 후 핵심 개발자 륀쥔양의 사퇴를 시작으로 기존 개발진의 사의가 잇따르는 중이다. 중국 언론에선 내부조직 개편과정에서 불화가 있었다고 추정 중이다.

2. 제품

2.1. Qwen-1

1.8B, 7B, 14B, 72B 4가지 크기의 모델로 출시했다. 2023년 8월 3일에 7B가, 9월 25일에 14B가, 11월 30일에 1.8B와 72B가 출시됐다. GPT-3.5와 GPT-4에 근접하는 성능을 보여준다는 자체적인 평가 데이터가 공개됐다.

2024년 1월 25일에 영상 분석 특화 모델인 Qwen-VL이 공개됐다.

2.2. Qwen-1.5

2024년 2월 4일에 공개되었으며, 0.5B, 1.8B, 4B, 7B, 14B, 72B 6가지 모델로 출시됐다. GPT-3.5 대비 언어를 이해하는 능력이 월등하다고 주장했다. 2024년 4월 2일에 32B가, 4월 25일에 110B 모델이 추가로 공개됐다.

2024년 4월 16일에 Qwen-1.5를 기반으로 한 CodeQwen1.5을 공개했다.

2024년 5월 11일에 Qwen-1.5-110B을 파인-튜닝한 Qwen-Max-0428을 공개했다.

2.3. Qwen-2

2024년 6월 7일에 공개되었으며, 0.5B, 1.5B, 7B, 57B-A14B, 72B 5가지 모델로 출시됐다. 72B 모델의 경우, 벤치마크에서 Llama 3 70B, Mixtral 8x22B와 Qwen 1.5-110B 모델을 완전히 제압하는 성능을 과시했다.

2024년 8월 8일에 Qwen2를 기반으로 한 수학 특화 모델인 Qwen2-Math [5] 모델과 음성 분석 특화 모델인 Qwen2-Audio [6] 모델을 발표했다.

2024년 8월 29일에 Qwen2를 기반으로 한 이미지 분석 특화 모델인 Qwen2-VL [7] 모델을 발표했다. GPT-4o-0513과 Claude 3.5-Sonnet을 압도하는 성능을 보여줬다.#

2.4. Qwen-2.5

2024년 9월 19일에 Qwen2보다 개선된 2.5 모델을 발표했다. 0.5B, 1.5B, 3B, 7B, 14B, 32B, 72B 7가지의 모델로 구성되어 있으며, 이 중 3B와 72B를 제외하고 나머지 모델들은 모두 Apache 2.0 라이센스가 적용됐다. 수학 특화 모델인 Qwen2.5-Math [8] 모델 또한 공개됐다.

2024년 11월 12일에는 코딩 특화 모델인 Qwen2.5-Coder [9] 모델을 발표했다.

2025년 1월 26일에 Qwen2.5-VL [10] 모델을 발표했다.
기존 2.0-VL 모델 대비 큰폭의 성능 향상이 돋보인다.

2025년 1월 27일에 대화 토큰을 1M까지 가능하게 발전시킨 Qwen2.5-1M [11]을 공개했다.

2025년 1월 28일에 Qwen2.5-Max 모델을 공개했다.
모든 밴치마크 영역에서 DeepSeek-V3를 뛰어넘은 것으로 평가되었으며, 100B 크기의 모델인 것으로 밝혀졌다.
알리클라우드에서 API로 호출해 사용이 가능하며, 주기적으로 롤링 모드 업데이트를 한다고 밝혔다.

2025년 2월 25일에 Qwen2.5-Max의 오픈소스 출시가 임박했다고 공지가 나왔다.#

2025년 3월 24일에 Qwen2.5-VL-32B가 공개됐다. 기존 2.5-VL 모델에 추가 학습과 지속적인 최적화를 한 끝에 32B 모델을 만들어 냈으며, 2-VL-72B 모델과 거의 동급의 성능을 보여주고 있다.

2025년 3월 27일에 Qwen2.5-Omni [12]가 공개됐다. 텍스트, 이미지, 오디오, 비디오를 모두 인식하고, 매우 빠른 속도의 텍스트나 음성 합성으로 응답을 할 수 있는 멀티-모달 모델이다.

2025년 5월 1일에 Qwen2.5-Omni의 3B 버전이 공개됐다. 기존 7B 버전 대비 VRAM 사용률을 50% 절감하는 데 성공, 7B모델 대비 90% 수준의 성능을 유지하는 데 성공했다고 한다. 그 결과, 24GB정도의 GPU에서 30초이상의 오디오-비디오 상호작용을 지원할 수 있게 됐다고 한다.

2.5. Qwen-3

2025년 4월 29일, Qwen3가 modelscope과 Huggingface에서 공개됐다. 동시에, 블로그에도 소개글이 같이 올라왔다.

0.6, 1.7, 4, 8, 14, 32B 일반모델 6가지와 30B-A3B, 235B-A22B의 MoE 모델 2가지로 구성되어 있다.
참고로, 0.6, 1.7, 4, 8, 14B모델은 32B 모델에서, 30B-A3B는 235B-A22B에서 증류시켜 만든 소형화 모델이다고 한다.

가장 큰 235B 모델은, 벤치마크에서 OpenAI o1, o3-mini-medium, DeepSeek R1, Grok 3-Thinking을 모조리 이겨버리는 매우 뛰어난 성능을 보여줬다.

이보다 작은 30B-A3B 모델은, gemma3, Deepseek-v3, GPT-4o(24-11-20)을 매우 높은 격차로 이겨버리는 성능을 보여줬다.

모든 Qwen3 모델은 119가지의 언어와 방언을 학습해 글로벌하게 사용할 수 있다. 코딩, 에이전트 기능에 모델들을 최적화했으며, MCP 지원도 가능해졌다. 게다가 이 모든 모델에 Apache 2.0 라이센스를 적용해 광범위한 사용도 허락했다!

2025년 7월 21일, Qwen3-235B-A22B의 비추론 영역을 따로 독립시켜 추가적인 강화학습을 많이 진행시킨 Qwen3-235B-A22B-Instruct-2507 를 공개했다.
동시에, 업데이트된 추론모델과 더 다양한 크기의 모델들을 공개할 예정이라고 밝혔다.

파일:Qwen3-235B-A22B-Instruct-2507-Bench.jpg

비추론 모델중에서는 최고수준이라고 할 수 있을 정도로, 매우 큰 폭의 성능향상을 보여줬다. 1T크기의 모델인 Kimi-k2와, 현존 최강의 모델이라 불리던 claude 4 opus도 꺾었다. 추가로, 최대 컨텍스트 길이를 256K까지 늘렸다고 한다.

2025년 9월 23일, Qwen3-Omni를 공개했다.
텍스트, 오디오, 비디오, 이미지 등 모든 종류의 자료를 처리할 수 있으며 실시간 답변을 오디오로 생성하는 기능까지 포함한다.
기존 2.5-Omni보다 성능이 훨씬 좋아졌으며, Gemini-2.5-Pro와 맞먹는 성능을 보여주고 있다.
오디오로만 대화를 할 경우, 단 0.21초 만에 답변을 할 수 있으며 오디오-비디오 시나리오의 경우 0.507초 만에 답할 수 있다고 한다. 30분 분량의 오디오를 이해할 수 있으며, 툴 호출도 가능하다고 한다. 아에 자막 생성 전문 모델인 Captioner 버전도 따로 존재한다.
119가지의 언어를 텍스트로 구사할 수 있으며, 19가지 언어의 오디오를 이해할 수 있고, 10가지 언어로 오디오 답변 생성을 할 수 있다.

같은 날에 Qwen3-VL 모델도 공개했는데, 공개된 크기 중 235B-A22B 모델이 선출시되었으며, 30B-A3B, 8B, 4B 순으로 공개됐다. 이미지 입력과 도구 사용을 강점으로 코딩 시각 처리에 주목을 받고 있다.

2025년 9월 24일, Qwen3-Max를 공개했다.
MoE 구조를 갖췄고, 1T 파라미터중에 36B 영역만 활성화되는 초거대 모델이다. 2.5-MAX가 100B 정도의 모델임을 감안하면 거의 10배나 커진 셈.

DeepSeek-V3.1과 Claude Opus 4를 씹어먹는 강력한 성능을 보여준다지만, 발표 시점 DeepSeek V3.1-Terminus 와 Claude Opus 4.1 이 나와 있던 시점이라 비교결과가 아쉬운 부분이 있다.

추론이 가능한 Qwen3-Max-Thinking의 개발 현황도 같이 공개했는데, GPT-5 Pro와 Grok 4 heavy와 사실상 동등한 위치에 섰다는 벤치마크 결과가 나와 세계를 경악시키고 있다.

2025년 11월 3일에 Max-Thinking의 초기 버전을 공개했다. API와 Qwen Chat에서 사용해 볼 수 있다.

2.5.1. Qwen-3-Next

2025년 9월 11일 공개됐다.#

완전히 새로운 개념의 아키텍쳐를 도입했는데, Gated DeltaNet + Gated Attention 이라고 부르고 있다.

선형 어텐션은 빠르지만 성능이 떨어지고, 표준 어텐션은 훈련비용의 수직상승과 추론과정이 매우 느리다는 단점이 있다.

이를 해결하기 위해, Gated DeltaNet으로 대부분을 처리하고, 주기적으로 Attention이 전역을 재점검 하도록 구성한 뒤, 양쪽에 "출력 게이트"를 달아 정보 흐름을 정밀하게 제어하도록 개선했다.

초보자가 알아 들을 수 있을 난이도로 설명하자면, 긴 글을 보고 메모장에 요약을 쓰다가, 가끔씩 원문 전체를 읽고 수정하는 일을 계속 반복한다고 이해하면 된다.

추가로, "다중 토큰 예측" 메커니즘을 도입하여 모델의 전반적 성능 향상을 꾀할뿐만 아니라, 훈련과 실제 추론의 일관성을 유지하도록 하여 정확도를 향상시키도록 하였다.

덕분에, QwQ-32B 모델 훈련 시간보다 10.7배 빠르게 훈련이 가능했으며 기반이 되는 Qwen3-30B-A3B보다 성능이 더 좋아지는 결과를 보였다.

파일:Qwen3-Next-80B-A3B.jpg

비추론 모델 기준 80B모델이 235B 모델과 맞먹는 놀라운 성능을 보여준다.

추론 모델 기준 Gemini 2.5 Flash는 물론 뛰어넘었고, 기존 모델인 30B-A3B-Thinking-2507보다는 미세하게 좀 더 좋아진 것이 증명됐다.

이로써 아키텍쳐의 효과가 증명되었으며, 앞으로 개발될 Qwen 3.5의 핵심 아키텍쳐로 적용될 것이라고 밝혔다.

2.5.1.1. Qwen3-Coder-Next

2026년 2월 4일에 공개됐다.#

기존의 Qwen3-Next 모델을 코딩 특화로 훈련시킨 것으로, 활성영역이 3B밖에 안 되는데도 GLM 4.7, DeepSeek 3.2, Kimi K2.5 등 중국 내에서 SOTA라고 불리는 모델들을 모조리 가성비로 압살하는 결과가 나와 모두를 경악하게 하고 있다.

단순히 모델 성능에만 집중한 것이 아닌, 에이전틱 능력도 같이 강화해 지시 이행률도 타 모델대비 높은 수준이라고 한다. (대략 280~290회 도구 호출 가능)

2.6. Qwen-3.5

2026년 2월 16일, Qwen3.5가 HuggingFace에서 공개됐다. 블로그에도 소개글이 같이 올라왔다.
397B-A17B 모델 단독으로 공개됐고, 아에 비전 기능을 통합한 모델이자 3-Next에서 소개했던 아키텍쳐를 적용해 큰 성능향상을 꾀했고, 지원 언어를 119개에서 201개로 늘렸다.

공식 블로그에 따르면 어떤 용도로 쓰든 부족함이 없는 범용 모델로서의 방향성을 가지고 만들었다고 한다.

2026년 2월 25일, 122B-A10B, 35B-A3B, 27B 3가지 모델을 추가로 공개했다.#

비슷한 체급 모델들 대비 높은 성능을 보여줘 매우 준수한 성능을 보여준다.

특히 이후 공개된 9B 모델의 경우 매개변수가 약 17배 이상 차이나는 gpt-oss-120b보다도 더 우수한 성능을 보여주는 엄청난 효율을 보여준다.

2.7. Qwen-3.6

2026년 3월 30일, Qwen3.6 Plus Preview 라는 모델이 OpenRouter에 등장했다. 최대 1M Context 지원, 3.5 시리즈 대비 훨씬 더 향상된 성능을 보여준다고 설명하고 있다.#

2026년 4월 2일, Qwen3.6 Plus가 정식으로 공개됐다. 3.5를 다듬어서 에이전틱 코딩과 시각 추론 능력을 향상시키는 것을 중점으로 뒀다고 한다.# Plus 모델 자체는 오픈소스로 공개하지 않을것이지만, 다른 파생 모델들은 오픈소스로 공개할 것이라고 밝혔다. 모델은 Qwen Chat에서 무료로 사용해 볼 수 있다.

2026년 4월 16일, 3.6 시리즈의 첫 오픈소스 모델인 35B-A3B가 공개됐다.#
MoE 구조인데도 불구하고 3.5-27B 모델과 거의 비슷한 성능을 보여줘 훌륭한 가성비와 성능을 증명했다.

2026년 4월 22일, 두 번째 오픈소스 모델인 27B가 공개됐다.# 출시 당시 최신 오픈소스 모델이었던 구글의 Gemma 4 31B를 완전히 꺾어버리고 Claude 4.5 Opus와 비슷한 성능을 보여주며 매우 뛰어난 성능을 증명했다.

2.8. Qwen-3.7

2026년 5월 20일에 Qwen3.7-Max 모델을 공개했다.# Claude Opus 4.6 Max와 동급의 성능을 가지고 있으며 대부분의 에이전틱 작업에서 압도적인 두각을 드러내는 결과를 보여줬다.

2026년 6월 1일에 Qwen3.7-Plus 모델을 공개했다.# 매우 큰 모델로 알려진 DeepSeek V4 Pro, Kimi-K2.6과 완전히 동급의 성능을 보여주고 있으며 GPT-5.4, Gemini-3.1 Pro, Claude Opus 4.6과도 동급인걸 알 수 있다. Max 모델보다 살짝 부족하지만 여전히 타사 모델대비 압도적인 성능을 유지하도록 힘조절을 잘 했다고 할 수 있다.

2.9. Qwen-Image

🎨 그림 인공지능
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px)" {{{#!folding [ 펼치기ㆍ접기 ] {{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"	생성형 인공지능	DALL·E · Firefly · FLUX · Gaugan2 · GPT-Image · Grok Imagine · Imagen · Midjourney · 나노 바나나 · NAI Diffusion · Qwen-Image · Samsung Gauss Image · Seedream · Stable Diffusion · Z-Image
학습 방해 프로그램	Glaze (Nightshade) · Mist

}}}}}}}}} ||
2025년 8월 4일에 공개된 모델이다. 20B정도의 크기로, FLUX.1 보다는 조금 더 크다.
아주 복잡하게 지시를 하더라도 그 의도에 맞춰 구현하는 능력이 뛰어나다고 주장하고 있다. 특히, 영어와 중국어로 지시를 내려도 매우 정확하게 구현한다고 한다.
편집 작업에서, 작품의 일관성을 매우 높게 유지한다고 한다. 다른 이미지 생성 AI들이 편집을 할수록 일그러지거나 의도와 매우 다르게 나오는 걸 생각한다면 그런 현상을 최소화 이해하면 편하다.

밴치마크 결과는 거의 모든 영역에서 GPT IMAGE 1을 찍어누르는 강력한 성능을 보여줬다. 좌측 그래프는 이미지 품질을, 우측은 텍스트로 지시를 내렸을 때 반영 정확도를 평가했다.
중국어, 영어 모두 Qwen-Image가 우세함에 있어 DeepSeek의 Janus-Pro의 재림이라고 평가할 수 있다고 볼 수 있다. 이 강력한 모델도 Qwen Chat에서 "이미지 생성"을 선택 후 무료로 사용할 수 있다.

2025년 12월, 업그레이드 된 모델이 공개됐다. 기존 버전 대비 이미지 속 글씨를 더욱 정확하게 생성할 수 있으며, 인간 묘사를 좀 더 실사에 가깝게, 그리고 자연풍경의 디테일을 업그레이드 했다고 밝혔다.

2.9.1. Qwen-Image-Edit

2025년 9월 23일에 공개된 모델로, Qwen-Image 모델을 기반으로 이미지 편집 능력을 강화시킨 모델이다.
지원하는 기능과 이미지 편집 성능이 가히 구글의 나노 바나나를 능가하는 수준인 데다 오픈 소스라는 점으로 폭발적인 인기를 끌고 있다.
주요 강점으로는 (사람+사람), (사람+물체), (사람+배경) 같이 최대 3장의 이미지를 동시에 넣고 편집할 수 있다. 이미지의 일관성이 나노-바나나와 비빌정도로 매우 향상됐다.
이 모델 또한 Qwen Chat에서 "이미지 편집"을 선택 후 무료로 사용할 수 있다.

새로운 스냅샷을 준비 중인 걸로 확인됐다.
2025년 12월 18일에 2511 버전을 공개했다.

2.10. QwQ

Qwen with Questions. AI의 추론 능력에 집중한 특화 모델이다. 비교하자면 OpenAI o시리즈, Deepseek-R 시리즈가 있다.

2.10.1. QwQ-Max

Qwen 2.5-Max를 기반으로 개발된 모델이며, 수학, 코딩 및 일반 영역 작업에서 탁월한 성능을 발휘하는 동시에 에이전트 관련 워크플로우에서 뛰어난 성능을 제공한다고 한다.
조만간 Qwen 2.5-Max와 함께 Apache 2.0 라이센스로 오픈소스 공개를 진행할 예정이다.

2.10.2. QwQ-32B

확장 강화 학습을 적용해 훨씬 작은 모델[13]로 DeepSeek-R1[14]과 동일한 성능이 나오도록 만든 모델이다.
에이전트 관련 기능을 모델이 사용 가능하도록 통합해 도구를 활용하며 비판적으로 사고하고 환경 피드백에 따라 추론을 조정할 수 있다고 한다.
Apache 2.0 라이센스로 오픈소스 공개가 이뤄졌다.

공개된 벤치마크 데이터에 의하면, DeepSeek-R1와 동일한 성능이며, OpenAI-o1-mini보다 압도적인 성능을 보여주고 있다.

QwQ-32B 모델 벤치마크

2.11. QVQ

AI의 시각적 추론 능력을 향상하기 위해 개발 중인 실험적 연구 모델이다. 모델의 크기는 72B 하나만 제공된다. 공개된 벤치 데이터에 의하면 OpenAI o1-2024-12-17에 근접한 성능을 보여주고 있다. #

2.11.1. QVQ-Max

QVQ 모델을 지속적으로 학습과 최적화를 시켜 2025년 3월 29일에 발표했다.

3. 챗봇

chat.qwen.ai에서 Qwen 기반으로 하여 제작된 대화형 인공지능 서비스를 제공하고 있다.

검열은 같은 중국계인 DeepSeek 이상으로 빡센 편이다. 조금이라도 정치적인 요소가 나오면 빨간 창과 함께 그대로 대화를 중지한다.

4. 브라우저

Qwen 모델을 통합한 QUARK 라는 에이전틱 웹 브라우저를 개발했다.

[1] 通义[2] 블로그[3] 천문, 1000개의 질문[4] 중화권에서는 첸원(千问)이라고 부른다[5] 1.5B, 7B, 72B[6] 7B[7] 2B, 7B, 72B[8] 1.5B, 7B, 72B[9] 72B 버전 X[10] 3B, 7B, 72B[11] 7B, 14B[12] 7B[13] 32B[14] 671B

Qwen

1. 개요

2. 제품

2.1. Qwen-1

2.2. Qwen-1.5

2.3. Qwen-2

2.4. Qwen-2.5

2.5. Qwen-3

2.5.1. Qwen-3-Next

2.5.1.1. Qwen3-Coder-Next

2.6. Qwen-3.5

2.7. Qwen-3.6

2.8. Qwen-3.7

2.9. Qwen-Image

2.9.1. Qwen-Image-Edit

2.10. QwQ

2.10.1. QwQ-Max

2.10.2. QwQ-32B

2.11. QVQ

2.11.1. QVQ-Max

3. 챗봇

4. 브라우저

분류