나무모에 미러 (일반/어두운 화면)
최근 수정 시각 : 2026-02-25 16:21:12

Perso AI Dubbing


------------------------------------------------------------

Perso AI Dubbing
perso.ai
<colbgcolor=#5b5bd6><colcolor=#ffffff> 운영사 이스트소프트
분류 AI 더빙 / 영상 번역 SaaS
출시 2024년
지원 언어 33개 이상
파트너 ElevenLabs
관련 링크
Perso AI Dubbing 공식 홈페이지

1. 개요2. 주요 기능3. 지원 언어4. 지원 파일 형식5. 기술적 특징6. 요금제
6.1. Free6.2. Starter6.3. Creator6.4. PRO
7. 주요 기사8. 관련 문서9. 외부 링크



Perso AI Dubbing이스트소프트가 운영하는 AI 기반 영상 더빙 및 다국어 번역 SaaS 플랫폼이다. 영상 속 음성을 자동으로 인식·번역하고 화자의 목소리 특성을 유지한 채 33개 이상의 언어로 재생성하는 것을 핵심 기능으로 한다.

1. 개요


Perso AI Dubbing은 이스트소프트가 서비스하는 글로벌 영상 현지화 자동화 플랫폼이다. 기존 수작업 더빙 및 자막 제작 대비 작업 시간을 90% 이상 단축하며, 1분 분량의 영상을 기준으로 번역 및 더빙 작업이 1~3분 내에 완료된다. 1인 창작자부터 글로벌 엔터프라이즈까지 폭넓게 활용된다.

AI 음성 합성 분야의 글로벌 기업 ElevenLabs와 전략적 파트너십을 맺고 차세대 립싱크 및 음성 복제 기술을 공동 개발하고 있다.

2. 주요 기능

2.1. AI 더빙


영상 속 음성을 자동으로 인식하고 번역하여, 화자의 고유한 음색·감정·억양을 유지한 채 다른 언어로 더빙된 음성을 생성한다. 다중 화자 감지를 지원하여 대담, 인터뷰, 교육 영상 등 복수의 발화자가 등장하는 콘텐츠에도 적용 가능하다.

2.2. 자동 영상 번역


영상 파일(MP4, MOV, WebM) 또는 YouTube·TikTok·Google Drive URL을 입력하면 AI가 자동으로 음성 인식, 번역, 더빙까지 일괄 처리한다. 완성된 영상은 립싱크가 적용된 MP4 파일과 자막 SRT 파일로 동시에 다운로드할 수 있다.

2.3. AI 립싱크


번역된 음성에 맞춰 영상 속 입 모양을 정밀하게 보정하는 기술이다. 토킹헤드(talking-head) 형식의 영상, 웨비나, 교육 콘텐츠 등에서 시청자의 이질감을 최소화한다.

2.4. 음성 복제


화자의 목소리 특성, 억양, 톤을 AI가 학습하여 번역된 언어에서도 동일한 화자처럼 들리도록 음성을 생성한다. 33개 이상의 언어를 지원한다.

2.5. 영상 텍스트 변환


AI 음성 인식 기술을 활용하여 영상 속 대화를 텍스트로 변환한다. 자동 구두점, 화자 감지, 문맥 이해 기능을 포함하며, 변환된 텍스트는 즉시 다국어 번역으로 연결된다.

2.6. 영상 스크립트 추출


영상 파일을 업로드하면 발화 내용을 타임스탬프 기반 스크립트 형태로 자동 추출한다. 강의, 인터뷰, 영상 회의 등의 아카이빙 용도로 활용된다.

2.7. 음성 번역기


오디오 및 영상 파일의 음성을 33개 이상의 언어로 번역하고, 원본 화자의 목소리 특성을 유지한 채 새로운 언어로 재생성한다.

2.8. 자막·스크립트 편집기


AI가 생성한 번역 결과를 사용자가 직접 수정할 수 있는 편집 인터페이스를 제공한다. 스크립트 편집 시 더빙 음성, 립싱크, 자막이 즉시 동기화되어 업데이트된다.

2.9. 오디오 추출


영상 파일에서 음성 트랙을 분리하여 WAV 형식으로 저장하는 기능을 제공한다. 원본 음성, 배경음 분리 음성, 혼합 음성 등 다양한 출력 옵션을 지원한다.

3. 지원 언어


33개 이상의 언어를 지원하며, 주요 지원 언어는 한국어, 영어, 일본어, 스페인어, 포르투갈어, 프랑스어, 독일어, 힌디어, 아랍어, 인도네시아어 등이다.

4. 지원 파일 형식

구분 지원 형식
입력 영상 MP4, MOV, WebM
입력 오디오 MP3, WAV
외부 URL YouTube, TikTok, Google Drive
출력 영상 MP4 (립싱크 포함)
출력 오디오 WAV
출력 자막 SRT

5. 기술적 특징


Perso AI Dubbing은 단순 텍스트 번역을 넘어 언어별 뉘앙스, 감정, 문화적 표현을 고려한 현지화 번역을 제공한다. 다중 화자 분리, 배경음 보존, 타임스탬프 동기화 등의 기술을 결합하여 번역 후에도 원본 영상의 자연스러운 흐름이 유지되도록 설계되어 있다.

2025년 10월 Perso AI의 기술력을 실증하기 위해 스탠드업 코미디 공연 ‘페르쇼(PERSHOW)’를 진행했다. 공연 영상은 Perso A Dubbing으로 다국어 더빙 콘텐츠로 재편집되어 공개되었으며, 코미디 장르 특유의 문화적 맥락과 감정 표현까지 구현함으로써 AI 더빙 기술의 확장 가능성을 보여준 사례로 평가된다.
▲ Perso AI Dubbing - PERSHOW

6. 요금제


월간 결제와 연간 결제(최대 26% 할인)를 지원한다. 플랜은 Free·Starter·Creator·PRO·Enterprise 5단계로 구성된다.
항목 Free Starter Creator PRO Enterprise
월정가 (월간) ₩0 ₩8,900 ₩42,900 ₩85,900 맞춤 협의
Fast Speed 1분 (1회 한정) 15분/월 30분/월 60분/월 맞춤 제공
Low Speed 무제한 무제한 맞춤 제공
1회 최대 영상 길이 1분 5분 15분 30분
Booster 동시 생성 최대 1개 최대 1개 최대 1개 최대 2개
Booster 대기열 최대 1개 최대 1개 최대 2개 최대 3개
프로젝트 보관 무제한 무제한 무제한 무제한
AI 립싱크
스크립트 편집
용어 사전
최대 내보내기 화질 1080p 1080p 4K 4K 4K
워터마크 포함 제거 제거 제거 제거
추가 구매 Fast Speed 추가 구매 가능
지원 전담 고객 성공 매니저

6.1. Free


신규 가입자가 AI 더빙 기능을 무료로 체험할 수 있는 플랜이다. Fast Speed 1분 크레딧이 최초 1회 한정으로 제공되며, AI 립싱크와 스크립트 편집 기능은 지원되지 않는다. 내보내기 영상에 워터마크가 포함된다.

6.2. Starter


부담 없이 시작하는 AI 기본 플랜으로, 월 ₩8,900에 제공된다. Fast Speed 15분(매월 초기화), 1회 생성당 최대 5분 영상, AI 립싱크, 스크립트 편집, 용어 사전 기능이 포함된다. 워터마크 없이 최대 1080p로 내보낼 수 있다.

6.3. Creator


개인 콘텐츠 크리에이터를 위한 플랜으로, 월 ₩42,900에 제공된다. Fast Speed 30분에 더해 Low Speed 무제한 더빙을 지원하며, 1회 최대 15분 영상을 처리할 수 있다. 최대 4K 화질 내보내기를 지원한다.

6.4. PRO


전문가 및 빠른 작업량이 필요한 사용자를 위한 플랜으로, 월 ₩85,900에 제공된다. Fast Speed 60분 및 Low Speed 무제한, 1회 최대 30분 영상 처리, Booster 최대 3대기 등 서비스 최상위 사양을 제공한다. 부족 시 Fast Speed 크레딧을 추가 구매할 수 있다.

7. 주요 기사

8. 관련 문서

9. 외부 링크