나무모에 미러 (일반/어두운 화면)
최근 수정 시각 : 2024-09-19 16:56:56

OpenAI o1

파일:OpenAI 로고.svg파일:OpenAI 로고 화이트.svg
{{{#!wiki style="margin:0 -10px -5px"
{{{#000,#fff {{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-6px -1px -11px"
{{{#000,#e5e5e5
제품군
서비스 ChatGPT · OpenAI(인공지능)
모델 GPT-1 · GPT-2 · GPT-3(GPT-3.5) · GPT-4(GPT-4 Turbo · GPT-4o · GPT-4o mini) · GPT-5(개발 중)
o1(o1-preview · o1-mini)
DALL·E · Codex · CLIP · Whisper · Voice Engine · Sora · SearchGPT
관련 인물
일론 머스크 · 샘 올트먼 · 미라 무라티 · 일리야 수츠케버 · 안드레 카파시 · 그렉 브록만 · 다리오 아모데이
관련 기업
마이크로소프트
}}}}}}}}}}}}}}} ||
생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
텍스트 [[소설|
소설
]] NovelAI · AI Dungeon · AI 노벨리스트 · GPTRPG
대화형 [[챗봇|
챗봇
]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI · Grok
[[언어 모델|
언어모델
]] GPT-1 · GPT-2 · GPT-3 · GPT-4· LLaMA · Gemma · Claude · Phi · 엑사원
코드 [[코드#컴퓨터 소프트웨어|
코드
]] GitHub Copilot · Devin · Phind
그림/영상 [[그림 인공지능|
그림
]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · FLUX.1 · Gaugan2 · Dream by WOMBO · Adobe Firefly · Deep Dream Generator
[[영상|
영상
]] Stable Video · Sora · Lumiere · Veo · Runway AI · Luma Dream Machine
[[모델링|
모델링
]] LATTE3D
오디오/소리 [[음성|
음성
]] A.I.VOICE · DeepVocal · Voice Engine
[[음악|
음악
]] Suno · Stable Audio · Udio · AIVA · SOUNDRAW · keeneat · Mix.audio · vio.dio
멀티모달 [[멀티모달 모델|
멀티모달
]] GPT-4o · o1 · GPT-5 · Gemini · 삼성 가우스
행위/동작 [[인공지능 로봇|
로봇
]] Robot Operating Syetem(ROS) · Google RT-X · 프로젝트 그루트
}}}}}}}}}

OpenAI o1
출시일 2024년 9월 12일
개발사 OpenAI
기능 추론 특화 멀티모달 모델
하드웨어 NVIDIA H100
라이선스 Proprietary Software
관련 링크 파일:홈페이지 아이콘.svg

1. 개요2. 특징3. 모델
3.1. o1-preview3.2. o1-mini
4. 요금제5. 평가

[clearfix]

1. 개요

OpenAI가 개발한 추론형 멀티모달 모델.

2. 특징

반응하기 전에 생각하는 데 더 많은 시간을 할애하도록 설계되어 복잡한 작업을 추론하고 과학, 코딩, 수학 분야의 이전 모델보다 더 어려운 문제를 해결할 수 있다.

o1 모델은 물리학, 화학, 생물학 등 까다로운 벤치마크 과제에서 박사 과정 학생과 비슷한 수준을 보였으며, 국제 수학 올림피아드(IMO) 예선 시험에서 83%의 성적을 받아, 이전 모델인 'GPT-4o'의 13%를 크게 넘어섰다. 코딩 능력을 가리는 코드포스에서는 89번째 백분위에 올랐으며, 백준의 일부 다이아몬드 5 문제도 잘 풀이하는 모습을 보여주었다.

테스트-시간 계산(test-time computation)' 학습법을 도입했다. 이는 강화 학습(훈련 시간 컴퓨팅)이 더 많아지고 사고에 더 많은 시간을 할애할수록(테스트 시간 컴퓨팅) 지속적으로 향상된다는 개념이다.

또 '생각의 흐름(CoT)'을 사용해 생각하는 방법을 향상했다. 이에 따라 사용자가 별도의 프롬프트 엔지니어링을 사용하지 않아도, 모델이 스스로 문제를 분석할 수 있다.

3. 모델

3.1. o1-preview

o1의 미리보기 모델. 지속적으로 업데이트가 이루어질 예정이며 정식 버전 때는 preview 모델보다 더 높은 성능으로 출시될 것으로 보인다.

3.2. o1-mini

o1의 경량화 모델. o1-preview에 비해 약 80% 저렴하며 코딩에 특화되어 있다. 80% 저렴함에도 모든 모델을 통틀어서 o1-preview 다음가는 성능을 가지고 있다. 이 모델 또한 GPT-4o에 비교해보았을 때 추론 능력이 좋은 편이며, 논리나 수학적 사고가 요구되는 분야의 성능이 크게 향상되었다.

4. 요금제

ChatGPT Plus(유료) 가입자들을 대상으로 우선 공개되었다.

5. 평가

기존 생성형 인공지능으로 해결이 어려웠던 논리적인 문제를 풀어가는 돌파구를 마련했다는 평이 있다. 다만 작문 등 문학적인 부분의 답변 품질은 종전과 비슷하다.

한국에서는 preview 수준만 놓고 보아도 수능, 회계사 시험 문제, PSAT 등에서 종전 GPT 대비 성과가 매우 뛰어나다는 평도 있다. 수식을 LaTeX로 변환한 다음 풀게 하면 종종 풀린다. 이공계 학문을 중심으로 답변의 품질이 좋아졌다는 평이 있다. 특히 수능을 푸는 성능이 완벽은 아니어도 종전에 비해서는 꽤 좋아진 상황이라 이 속도로 인공지능의 성능 개선이 지속된다면 교육계에도 어떤 영향이 있을 것이라는 평도 있다.