Qwen(AI)

생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"	유니모달 모델 기반
<colkeepall> 텍스트	[[소설\| 소설 ]] NovelAI · AI Dungeon · AI Novelist · GPTRPG
대화형	[[챗봇\| 챗봇 ]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI · Grok · Xtion AI(액션 AI)
대화형	[[언어 모델\| 언어모델 ]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · LLaMA · Gemma · Claude · Phi · Exaone · OpenELM · Qwen
코드	[[코드#컴퓨터 소프트웨어\| 코드 ]] GitHub Copilot · Devin · Phind
이미지	[[그림 인공지능\| 그림 ]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · FLUX.1 · Gaugan2 · Dream by WOMBO · Adobe Firefly · Deep Dream Generator
	[[영상 인공지능\| 영상 ]] Stable Video · Sora · Meta Movie gen · Lumiere · Veo · Runway AI · Luma Dream Machine · Kling AI
	[[모델링\| 모델링 ]] LATTE3D
오디오 소리	[[음성\| 음성 ]] A.I.VOICE · DeepVocal · Voice Engine
	[[음악\| 음악 ]] Suno · Stable Audio · Udio · AIVA · SOUNDRAW · keeneat · Mix.audio · vio.dio
	[[효과음\| 효과음 ]] OptimizerAI
멀티모달 모델 기반
대화형	+이미지 Exaone 3.5 · Samsung Gauss
	+음성/이미지 GPT-4o · ~~GPT-5~~ · Gemini · o1 · o3 · Qwen
	+에이전트 Galaxy AI · Claude 3.5 Sonnet
행위 동작	[[지능형 에이전트\| 에이전트 ]] Apple Intelligence · Project Astra · ~~Google Jarvis~~
행위 동작	[[인공지능 로봇\| 체화 ]] Tesla optimus · Google RT-X · Project Gr00t	}}}}}}}}}

Qwen

<colbgcolor=#ddd,#000> 분류	소형 언어 모델
개발사	알리바바 클라우드
출시일	Qwen-1 2023년 8월 3일 Qwen-1.5 2024년 2월 4일 Qwen-2 2024년 6월 7일 Qwen-2.5 2024년 9월 19일
버전	2.5
링크

1. 개요2. 제품

2.1. Qwen-12.2. Qwen-1.52.3. Qwen-22.4. Qwen-2.5

3. 실험 모델

3.1. QwQ3.2. QVQ

[clearfix]

1. 개요

Qwen은 알리바바 클라우드의 오픈소스 언어 모델이다.

2. 제품

2.1. Qwen-1

1.8B, 7B, 14B, 72B 4가지 크기의 모델로 출시되었다. 2023년 8월 3일에 7B가, 9월 25일에 14B가, 11월 30일에 1.8B와 72B가 출시되었다. GPT-3.5와 GPT-4에 근접하는 성능을 보여준다는 자체적인 평가 데이터가 공개되었다.

2.2. Qwen-1.5

2024년 2월 4일에 공개되었으며, 0.5B, 1.8B, 4B, 7B, 14B, 72B 6가지 모델로 출시되었다. GPT-3.5 대비 언어를 이해하는 능력이 월등하다는 평가 데이터가 공개되었다. 2024년 4월 2일에 32B가, 4월 25일에 110B 모델이 추가로 공개되었다.

2.3. Qwen-2

2024년 6월 7일에 공개되었으며, 0.5B, 1.5B, 7B, 57B-A14B, 72B 5가지 모델로 출시되었다. 72B 모델의 경우, 벤치마크에서 Llama 3 70B, Mixtral 8x22B와 Qwen 1.5-110B 모델을 완전히 제압하는 성능을 과시했다.

2024년 8월 8일에 Qwen2를 기반으로 한 수학 특화 모델인 "Qwen2-Math"[1] 모델과 음성 분석 특화 모델인 "Qwen2-Audio"[2] 모델을 발표했다.

2024년 8월 29일에 Qwen2를 기반으로 한 이미지 분석 특화 모델인 "Qwen2-VL"[3] 모델을 발표했다. GPT-4o-0513과 Claude 3.5-Sonnet을 압도적으로 앞서는 성능을 보여줬다.#

2.4. Qwen-2.5

2024년 9월 19일에 Qwen2보다 개선된 2.5 모델을 발표했다. 0.5B, 1.5B, 3B, 7B, 14B, 32B, 72B 7가지의 모델로 구성되어 있으며, 이 중 3B와 72B를 제외하고 나머지 모델들은 모두 Apache 2.0 라이센스가 적용되었다. 수학 특화 모델인 "Qwen2.5-Math"[4] 모델 또한 공개되었다.

2024년 11월 12일에는 코딩 특화 모델인 "Qwen2.5-Coder"[5] 모델을 발표했다.

3. 실험 모델

3.1. QwQ

Qwen with Questions. AI의 추론 능력을 향상하기 위해 개발 중인 실험적 연구 모델이다. 모델의 크기는 32B 하나다.

3.2. QVQ

AI의 시각적 추론 능력을 향상하기 위해 개발 중인 실험적 연구 모델이다. 모델의 크기는 72B 하나다. 공개된 벤치 데이터에 의하면 OpenAI o1-2024-12-17에 근접한 성능을 보여주고 있다.[6]

[1] 1.5B, 7B, 72B[2] 7B[3] 2B, 7B, 72B[4] 1.5B, 7B, 72B[5] 72B 버전 X[6] https://modelscope.cn/models/Qwen/QVQ-72B-Preview

Qwen(AI)

1. 개요

2. 제품

2.1. Qwen-1

2.2. Qwen-1.5

2.3. Qwen-2

2.4. Qwen-2.5

3. 실험 모델

3.1. QwQ

3.2. QVQ

분류