나무모에 미러 (일반/어두운 화면)
최근 수정 시각 : 2026-01-29 22:29:08

LMArena


{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-6px -1px -11px"
<bgcolor=#2e3039,#2e3039> 자체 개발 모델 기반
ChatGPT · Gemini(음성: Gemini Live) · Claude · Grok · DeepSeek · Kimi · Qwen · Le Chat · CLOVA X(검색: Cue:) · 삼성 가우스 어시스턴트(음성 비서: 빅스비) · 어니봇 · Pi · Reka · 인셉션 랩스 · 구버 · 업스테이지
AI wrapper
타사 LLM 활용 Microsoft Copilot · Perplexity · SAIP · 운세박사 · 뤼튼 · 캐럿 · YouChat · Phind · GPTeens · 페르소라이브 · Genspark · FlakeLLM
인격
챗봇
Character.AI · CAVEDUCK · MyShell AI · 로판AI · Rolp.AI · zeta · 티카 · BabeChat · 크랙(뤼튼) · 레플리 · Elyn · 리플리챗 · 루나톡 · GPTRPG · 버터컵 AI · aira · 케밍 · 랜덤테일즈 · Gooka · 멜팅 · SpeakEasy · 러비더비 · 피즈챗 · 알플챗 · 츄챗 · 코멧 · 위프 · 라크 · 미라이 · 이브챗 · 베이글챗 · 티팟
컴패니언 이루다 2.0 · 강다온 · 허세중 · 러브퍼센트 · Neuro-sama · 라디안 · 냥아지·쿠로냥아지 · oshikoi
셀프 호스팅 Open WebUI · RisuAI }}}}}}}}}
<colbgcolor=#e5e7eb> Arena
<bgcolor=#fff,#fff> 파일:Arena(AI)_로고.svg
종류 대화형 인공지능 비교, 평가 플랫폼
국가
#!if 행정구 == null && 속령 == null
[[미국|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일:미국 국기.svg|width=24]]}}} {{{#!if 출력 == null
미국}}}{{{#!if 출력 != null
}}}}}}]]
#!if 국명 == null && 속령 == null
[[틀:국기|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일: 특별행정구기.svg|width=24]]}}} {{{#!if 출력 == null
행정구}}}{{{#!if 출력 != null
}}}}}}]]
#!if 국명 == null && 행정구 == null
[[틀:국기|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일: 기.svg|width=24]]}}} {{{#!if 출력 == null
속령}}}{{{#!if 출력 != null
}}}}}}]]
언어 영어
회원가입 비회원제[1]
개설 주체 UC 버클리 연구진
개설 2023년
영리 여부 영리[2]
접속 상태 접속 가능
링크 파일:홈페이지 아이콘.svg
파일:X Corp 아이콘(블랙).svg
1. 개요2. 상세3. 리더보드4. 기타

1. 개요

미국인공지능(AI) 언어 모델(LM) 비교·평가 이용 플랫폼.

2. 상세

LM 기반 대화형-생성형 AI들을 자유롭게 이용해보고 비교하며 평가할 수 있는 웹사이트로, 글·이미지·영상·개발·리서치 등 다양한 분야에 걸친 대화형-생성형 AI 툴 최신 버전들을 무료로 사용할 수 있다.

부작위 비교 투표 방식을 채용하여 공정하고 투명한 평가를 지향한다. 사용자가 직접 프롬프트를 입력하고 모델명이 블라인드 처리된 두 답변에 대해 평가하는 식으로, 이후 두 답변중에 선택을 하면 어떤 모델이였는지 표기하는 방식이다. AI판 히든싱어라고 생각하면 편하다. 현재 일반 답변, 웹 검색, 이미지 생성, 코딩 등 4가지 테스트를 지원하고 있다.

2026년 1월 28일 부로 'Arena'로 이름이 바뀌었다.

3. 리더보드

여러 모델에 대한 평가를 종합하여 순위를 제공한다. 리더보드
Text Arena
2026년 1월 28일 기준 top10, 동일 모델 제외
순위 <colbgcolor=#fff,#000> 모델
1 파일:Gemini(앱) 아이콘 (2025).pngGemini 3 Pro
2 파일:Grok_로고.svg파일:Grok_로고_다크.svg Grok 4.1
3 파일:Gemini(앱) 아이콘 (2025).pngGemini 3 Flash
4 파일:claude 심플 로고.svg Claude opus 4.5 (2025-11-01)
5 파일:OpenAI-black-monoblossom.svg파일:OpenAI-white-monoblossom.svg GPT-5.1
6 Ernie 5.0 (2026-01-10)
7 파일:claude 심플 로고.svg Claude Sonnet 4.5 (2025-09-29)
8 파일:Gemini(앱) 아이콘.svg Gemini 2.5 Pro
9 파일:claude 심플 로고.svg Claude opus 4.1 (2025-08-05)
10 파일:Kimi_로고.svg Kimi-K2.5

4. 기타


[1] 로그인하여 이용할 수 있는데 구글 계정으로만 로그인할 수 있다.[2] 연구 프로젝트로 시작했지만 현재는 스타트업 투자 유치 등으로 운영되고 있어 영리라 볼 수 있다.