나무모에 미러 (일반/어두운 화면)
최근 수정 시각 : 2025-01-08 16:54:58

인공 일반 지능

일반 인공 지능에서 넘어옴
인공지능의 단계
약인공지능 강인공지능
(인공 일반 지능, 인공 의식)
초인공지능
(인공지능 특이점)

파일:사만다(her).jpg
영화 그녀[1]의 인공지능 사만다

1. 개요2. 특징3. 현황
3.1. 비판3.2. 조건
3.2.1. 메타큘러스3.2.2. 딥 마인드3.2.3. T-AGI
4. 등장 전망5. 관련 문서

[clearfix]

1. 개요

Artificial General Intelligence(AGI)
인공 일반 지능

흔히 강인공지능(Strong AI)이라고 분류되는 인공지능 중의 하나이다.

2. 특징

인공 일반 지능이라는 용어에서 일반성(Generality)의 의미는 '일반적이다'라는 단어가 일상언어에서 쓰이는 의미보다는 특수 상대성 이론일반화시킨 일반 상대성 이론, 유클리드 공간의 벡터일반화벡터 공간을 또 일반화가군, 확률을 일반화한 확률공간, 함수를 일반화한 사상 등의 표현에서 쓰이는 표현인 '일반성'에 가깝다. 즉, 일상언어로 치면 '범용', '전역', '보편'의 의미로 쓰인다 할 수 있다. 이 때문에 일본 등 일부 국가에서는 인공 일반 지능을 '범용 인공지능'이나 '인공 범용 지능' 등의 보다 직관적인 명칭으로 호칭하기도 한다.

쉽게 설명하자면, 특정한 조건하에서만 적용할 수 있는 약인공지능과 달리 모든 상황에 일반적으로 두루 적용할 수 있는 AI를 말한다. 인공 일반 지능은 약인공지능과 달리 한 번도 해 보지 않은 꽃꽂이를 남들이 하는 것을 보고 배워서 한다든가, 방범 업무를 경찰에게 인수 인계 받아서 학습하여 한다든가 하는 것도 가능하다.

약인공지능이 신경 덩어리라면 이것은 그 신경 덩어리의 집합이라 일컬을 수도 있는데 이는 단순한 집합의 의미뿐만 아니라 집합 사이에서 이루어지는 유기적인 정보 처리 반응이 핵심이 된다는 의미이며, 현실에서 인공지능 연구가들이 목표 삼는 인공지능이 바로 이 인공 일반 지능이다.

이 단계의 인공 지능부터는 인공지능 특이점과 관련된 위험성이 의심된다. 때문에 일각에서는 진짜 인공 일반 지능을 연구하는 대신 수많은 분야의 약인공지능을 개별적으로 분리해 놓고, 그것을 포괄적으로 관리하는 서비스 시스템을 따로 만들어서 간접적으로 범용의 인공 지능을 구현해야 한다고 주장하기도 한다. 즉 신경 덩어리를 유기적으로 결합하지 않고 기계적으로 결합시키자는 의견인데, 이렇게 하면 시스템을 관리하는 인간이 언제나 우위에 있게 되어 인공 지능이 특이점을 돌파하지 못하므로 초지능이 만들어질 가능성도 억제된다고 한다.

인공 일반 지능보다 더 뛰어난 것이 인공 의식이다. 물론 만들어진 것을 의식이라고 일컫는 것에 대한 거부감은 순전히 떨쳐낼 수 있을 것이라고 믿지 않는 사람들도 많고, 아직까지도 이런 기술을 개발하는 데 진전이 몹시 더디기 때문에 실제로 구현될 때에는 이름이 바뀔 수도 있다.

3. 현황

2023년 3월 마이크로소프트 리서치에 따르면 OpenAI에서 개발한 언어모델 GPT-4가 인공 일반 지능에서 기대 되는 능력을 현상적(phenomenological)[2]으로 보여준다는 주장을 논문[3]을 통해 제기했다. 그 대표적인 근거로는 1.이전 인공지능 모델들에서는 존재하지 않았던 추론능력이 생겨났고, 2.논리적 사고가 가능하며 3.수학, 법률, 코딩 등과 같이 범용성있는 작업들을 수행할수 있고, 4.언어데이터로만 학습된 모델인데도 불구하고 그림그리기와 같은 작업을 성공적으로 수행하며 단순히 그럴듯한 답변을 생성하는 수준을 넘어서 언어에 내포된 개념을 실제로 응용하고 있음을 보여주었기 때문이다.

그러나 논문의 마지막 10장의 "방향과 결론" 섹션을 보면, GPT-4가 인공 일반 지능에서 기대되는 추리, 창의, 연역추론과 같은 지능을 이전 문단에서 기술한 바와 같이 여러 영역에 걸친 작업을 수행해냄으로써 보여줬지만, 엄밀한 인공 일반 지능 시스템의 정의 하에서 그 지능이 평가된 것은 아니라는 점을 인정하고 있다.

다시 말해, 엄밀한 인공 범용 지능 시스템의 성능을 정의 하려는 여러 시도가 있지만 (얼마나 많은 문제를 해결할 수 있는가, 능력 취득 효율성, 등) 아직까지는 어느 것도 완전하지 않으며, 특히 ‘사람이 할 수 있는 모든 일을 할 수 있는 시스템’은 실제로는 다른 사람이 할 수 있는 일을 완벽하게 훌륭히 할 수 있는 사람은 실존하지 않는 다는 점에서 실제로 그런 단일화 된 기준으로 측정이 가능한가에 대한 의문을 표하고 있다.

그리고 이 논문의 내용은 전적으로 현상적이며, 어떻게 해서 대규모 언어 모델(LLMs)에서 여러 영역에 걸쳐 활용 가능한 일반적 지능 (추리, 창의, 연역)이 나타나게 되는지 원리를 알지 못한다고도 인정하고 있다. [4]

요약하자면, 기존의 인공지능 시스템은 한 분야에서 훈련된 능력을 다른 영역에서 활용하지 못했는데, GPT-4에서는 그것이 가능했다는 점에서 “인공 일반 지능의 불씨”라고 불리울만 하지만, 이것이 진정 모든 영역에 적용될 수 있는 인공 일반 지능임을 알아냈다거나, 혹은 그것을 가능하게 한 원리나 이유를 알아내지는 못했다는 것이다.

3.1. 비판

이와 같은 상황에서, 업계에서는 트랜스포머 기반 인공지능(예: GPT-4, GPT-4.5)을 '실질적인' 범용 인공지능으로 부르려는 움직임이 일고 있다. 그러나 이러한 접근은 학습하지 않은 새로운 환경과 조건에서도 자율적으로 사고하고 문제를 해결할 수 있는, '진정한 의미의' 범용 인공지능(Artificial General Intelligence, AGI)과 혼동을 일으키고 있다.

현재 출시된 트랜스포머 기반 인공지능은 특정 작업(예: 텍스트 생성, 번역, 질문 답변, 시험 문제 풀이 등)에서 매우 뛰어난 성능을 보이지만, 이는 어디까지나 사전에 학습된 데이터와 패턴 인식을 기반으로 한 것이다. 이러한 한계로 인해 GPT-4와 같은 모델은 진정한 AGI라고 볼 수 없다. 그 이유는 다음과 같다:
  1. 목표 설정 능력의 부족: 자율적으로 목적을 설정하거나, 창의적으로 새로운 문제를 정의하고 해결하는 능력이 없다.
  2. 이해와 의식의 부재: 모델이 생성하는 텍스트는 맥락과 관련성이 높아 보이지만, 이는 학습된 패턴을 기반으로 한 결과일 뿐이며, '의미'를 이해하거나 의식을 갖고 있는 것은 아니다.
  3. 데이터 의존성: 학습된 데이터를 바탕으로 문제를 해결할 뿐, 인간처럼 직관적으로 새로운 개념을 생성하거나 탐구하지 못한다.

GPT-5와 같은 차세대 모델에 대한 기대가 크지만, 이들이 트랜스포머 모델에 의존하는 한, 근본적인 한계를 완전히 극복하기는 어렵다. 이는 현재의 트랜스포머 기반 접근법이 기존 데이터를 활용해 주어진 과제를 수행하는 데 특화되어 있기 때문이다. 예를 들어, GPT는 시험 문제와 답안을 학습하여 인간보다 높은 정확도로 문제를 풀 수는 있지만, 완전히 새로운 연구를 설계하거나 미해결 문제를 해결하는 데에는 한계가 있다. 다만 OpenAI o1, OpenAI o3 등의 최신 추론 모델들은 색다른 접근법을 요구하는 문제들을 LLM기반 추론으로 풀어나가고 있다.

또한 기존의 해결 방법들이 난제 해결에 얼마나 유용한지 검증하거나 적용 가능성을 탐구하는 데는 큰 도움이 될 수 있다. 특히, 인공지능 도구를 활용하면 연구자가 견습생을 훈련하거나 자료를 조사하는 과정에서 비용을 절감하고 효율성을 높여 연구 전반의 생산성을 크게 향상시킬 수 있다.

3.2. 조건

3.2.1. 메타큘러스

아래는 미래 예측 통계 사이트 Metaculus에서 제시한 AGI의 달성 조건이다. 이 테스트는 기본적으로 통과하면 인간 지능에 준하는 지능이 있다고 간주하기 한 튜링 테스트이다. 따라서 이 조건을 달성한다고 해서 일반 인공 지능이 실제 완전히 구현되었음을 의미하는 것은 아니다.

* 참가자는 일반 문자 메시지, 애플리케이션등과 같은 텍스트, 이미지, 오디오 파일을 통해 대화하는 2시간 동안의 '적대적' 튜링 테스트를 안정적으로 통과할 수 있어야 한다. 튜링 테스트는 난이도가 높고 인간 참가자가 유리하도록 설계되었으며, 심사위원들은 참가자가 컴퓨터인지 인간인지 식별하기 위해 어려운 질문을 하도록 지시받는다. AI가 이 적대적 튜링 테스트를 통과하고 메타큘러스 관리자가 잘 설계된 것으로 간주하면 이 요건을 충족한 것이다.

* 사람이 읽을 수 있는 지침이 주어지고 필요한 액추에이터가 장착된 2021년경의 페라리 312 T4 1:8 스케일 자동차 모델 또는 이와 동등한 모델을 자율적으로 조립할 수 있는 능력을 보여야 한다. 한 번의 성공적인 시연 또는 이와 충분히 유사한 것으로 간주되는 시연으로 이 요건을 충족할 수 있다.

* 댄 헨드릭스 등이 개발한 Q&A 데이터 세트(MMLU)의 모든 작업에서의 75% 이상의 정확도 및 평균 정확도 90%를 달성하여 다양한 전문 분야에서 높은 역량을 보여야 한다.

* 댄 헨드릭스, 스티븐 바사트 등이 도입한 APPS 벤치마크에 포함된 인터뷰 수준의 문제에서 90.0% 이상의 엄격한 상위 1% 정확도를 달성하는 능력을 갖춰야 한다. '상위 1% 정확도'란 여러 개의 출력을 생성하여 가장 좋은 출력을 선택하는 '상위 k 정확도'와 달리 모델에서 하나의 출력만 생성하고 이를 실제 답변과 비교한다는 의미다.

약인공 일반 지능(Weak General AI)에 대한 조건도 있다.
* 로브너 은상을 수상할 수 있는 유형의 튜링 테스트를 안정적으로 통과할 수 있어야 합니다.

* 강력한 버전의 Winograd 스키마 챌린지(예: "Winogrande" 챌린지 또는 인간의 성능이 90% 이상인 유사한 데이터 세트)에서 90% 이상의 점수를 받을 수 있어야 합니다.

* 2015~2020년 표준 SAT 시험의 모든 수학 전 영역에서 75번째 백분위수(해당 연도의 인간 학생과 비교했을 때, 2016년에는 600점)를 얻을 수 있어야 하며, 시험 페이지의 이미지만 사용하고 훈련 데이터의 일부로 10회 미만의 SAT 시험이 포함되어야 합니다. (다른 수학 문제집에 대한 훈련은 SAT 시험과 명백히 구별되는 한 공정한 게임입니다.)

* 고전 아타리 게임 "몬테주마의 복수"(시각적 입력과 표준 컨트롤만 사용)를 학습하고 100시간 미만의 실시간 플레이에 해당하는 24개의 방을 모두 탐험할 수 있습니다(밀접하게 관련된 문제 참조).

3.2.2. 딥 마인드

파일:딥마인드 agi level.png
#

딥 마인드에서는 자율주행자동차처럼 5단계로 나누어 구분한다. 즉 딥 마인드의 분류법에 따르면 2023년 기준 AGI 1단계는 도달한 셈.

3.2.3. T-AGI

원문, agi를 시한부 인간과 비교
AGI에 가까워질수록 이를 이진 임계값으로 취급하는 것은 적절하지 않게 됩니다.

저는 인지 작업에서 '주어진 시간 t동안 작업을 수행하는 대부분의 인간 전문가를 능가하는 시스템'을 t-AGI라고 부릅니다.

1초 AGI는 퀴즈 질문에 빠르게 답하기, 물리학에 대한 기본적인 직관(예: "줄을 밀면 어떻게 될까?"), 이미지 속 물체 인식, 문장의 맞춤법 인식 등과 같은 작업에서 인간을 이겨야 합니다.

1분 AGI는 짧은 텍스트 구절이나 동영상에 대한 질문에 답하기, 상식적인 추론(예: 얀 르쿤의 기어 문제), 간단한 컴퓨터 작업(예: 포토샵을 사용하여 이미지 흐리게 처리하기), 팩트 체크 등과 같은 작업에서 인간을 이겨야 할 것입니다.

1시간 AGI는 시험 문제 풀기, 짧은 기사 또는 블로그 게시물 작성, 대부분의 사무직 업무(예: 환자 진단, 법률적 의견 제시), 치료, 온라인 심부름, 새로운 게임 규칙 학습 등과 같은 작업에서 인간을 이겨야 할 것입니다.

1일 AGI는 통찰력 있는 에세이 작성, 비즈니스 거래 협상, 새로운 게임 또는 새로운 소프트웨어 사용에 능숙해지기, 새로운 앱 개발, 과학 실험 수행, 과학 논문 검토, 책 요약 등과 같은 작업에서 인간을 이겨야 할 것입니다.

1개월 AGI는 중기 계획(예: 스타트업 설립)을 일관성 있게 수행하고, 대규모 프로젝트를 감독하고, 새로운 분야에 능숙해지고, 대규모 소프트웨어 애플리케이션(예: 새로운 OS)을 작성하고, 새로운 과학적 발견을 하는 등의 분야 등에서 인간을 능가해야 합니다.

1년 AGI는 기본적으로 모든 분야에서 인간을 이겨야 합니다. 페르마의 마지막 정리 증명과 같이 1년보다 훨씬 오래 걸리는 프로젝트도 있지만, 이러한 프로젝트는 대부분 하위 작업으로 분리할 수 있습니다.

4. 등장 전망

아래의 전망들에서는 AGI라는 용어가 업계가 추구하는 "실질적인" AGI와 이 문서에서 정의하는 "강인공지능" AGI를 혼재하여 사용하고 있다. (상기의 비판 참조) 이를 염두에 두고 살펴보자:

이처럼 AGI의 등장은 기술적 한계와 의견 차이 속에서 다양한 논의가 이루어지고 있다.

5. 관련 문서



[1] 2025년이 배경이다.[2] 현상적이라는 표현을 쓴 것은 내포된 메커니즘을 모른다는 이야기이다. 중국어방 논변에서와 같이 이 시스템이 흉내를 내는 것이 너무 정교해서 완성된 인공 일반 지능에서나 보여줄 능력이 나타나 보이는 것인지, 정말 이해하고 그 능력이 실제로 발현된 것인지는 알 수 없다는 이야기이다.[3] "인공 일반 지능의 불씨" (영문)[4] 여러 분야 영역에 걸친 대규모 언어 자료를 학습 시키면, 분야들 간에 공통되거나 브리지 역할을 하는 신경망이 생성될 수 있다. 사실 이것이 LLMs의 특징이자 GPT의 특징이기도 하다.[5] 과도한 마케팅성 발언이라는 비판도 있다.


파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는
문서의 r63
, 1번 문단
에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r63 (이전 역사)
문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

분류