기계적으로 합성한 사람의 목소리는 실제 사람의 그것과 확실하게 구별된다. 그런 때가 있었다. 내용을 알아듣는 데 문제는 없지만, 누가 들어도 사람의 목소리는 아니었다. 텍스트를 음성으로 바꿔주는 TTS(Text To Speech)를 사용하는 분야는 다양한데, 이런 로봇처럼 어색한 목소리와 함께 생활하는 시간이 제법 길었다. 하지만 인공 지능이 본격적으로 음성 합성에 활용되면서 확연히 구별 되던 그 경계가 점점 사라지고 있다.
미국 스타트업인 머프.에이아이(MURF.AI)는 2020년에 10월에 설립된 새내기 기업이다. 인공지능 기반의 음성 합성 기술을 활용해 다양한 언어의 목소리를 서비스로 제공하는데, 언어에 따라 조금씩 차이는 있지만 사람 목소리처럼 편하고 자연스럽다. 2022년 9월 기준으로 21개 언어로 된 120개 이상의 목소리를 지원한다.
사람이 말하는 것처럼 자연스러운 목소리를 생성할 수 있다는 것은, 사람의 목소리가 꼭 필요한 콘텐츠를 생산할 때, 목소리를 제공해줄 사람이 필요 없다. 즉, 성우의 목소리가 필요한 음성 또는 영상 콘텐츠를 제작할 때, 인공지능으로 생성한 목소리를 그대로 사용하면 된다. 대본이 되어줄 문서만 있다면 얼마든지 필요할 때 인공지능이 만들어 낸 목소리를, 마치 사람 목소리로 녹음한 것처럼 자연스럽게 변환할 수 있다.
머프.에이아이가 제공하는 인공지능 목소리는 단순하게 문서를 음성으로 변환해 주는 수준을 넘어선다. 사람의 목소리 원본을 제공하면, 이를 감정까지 모방하는 다양한 캐릭터의 음성으로 변환해서 사용할 수 있는 음성 복제, 동영상 파일에 빠르고 간편하게 음성으로 된 해설을 넣을 수 있는 보이스 오버 비디오(Voice Over Video), 직접 녹음한 음성을 인공지능 목소리로 변환할 수 있는 보이지 체인저(Voice Changer) 등이 있다.
영상이나 오디오로 된 자료를 만들어야 할 때 더 이상 목소리 때문에 고민할 필요가 없다는 뜻이다. 본인의 목소리가 별로 마음이 들지 않거나 공개하고 싶지 않을 때, 기업에서 업무용 동영상이나 오디오 자료를 만들 때, 학생들을 위한 영상 및 오디오 교재 제작, 다양한 분야에서 활동하는 크리에이터까지 광범위하게 활용할 수 있다.
미국 영어, 영국 영어, 독일어, 프랑스어, 이탈리아어, 스페인어, 러시아어, 포르투갈어, 아랍어, 중국어, 힌디어, 타밀어, 일본어, 한국어, 네덜란드어, 덴마크어, 핀란드어, 노르웨이어, 루마니아어, 터키어, 인도네시아어를 지원하는 오픈 스튜디오를 통해 인공 지능이 생성한 음성을 직접 변환해서 들어볼 수 있다. 간단한 과정을 거쳐 회원으로 가입하면, 무료로 10분 분량의 목소리를 생성한다.
좀 더 많은 분량과 다양한 기능을 사용하고 싶다면 베이직(BASIC), 프로(PRO), 엔터프라이즈(ENTERPRISE)로 구성된 유로 서비스를 선택할 수 있다. 베이직(월 13달러/연간 156 달러)은 무제한 다운로드와 일 년에 24시간 분량의 음성 생성, 상업적 이용이 가능하다. 프로(월 26달러/연간 312 달러)는 연간 최대 96시간 음성 생성과 연간 48시간의 전사(Transcription) 등의 기능을 지원한다.
한 달에 167달러를 내거나 일 년에 1,999달러를 지불하는 엔터프라이즈 요금제는 거의 모든 기능을 무제한으로 활용할 수 있다. 최대 5명까지 사용자를 지원하면서, 음성 생성과 전사가 무제한으로 지원된다. 또한 사용자 음성(Custom Voice), SSO(Single-sign on), 협업 및 접근 제어, 무제한 스토리지 등의 기능을 제공한다.
미국 유타주 솔트 레이크 시티에 위치한 머프.에이아이는 2021년 7월에 150만 달러의 시드 머니를 투자받았고, 지난 9월 21일에는 엘레베이션 캐피탈(Elevation Capital)의 참여로 매트릭스 파트너스(Matrix Partners)가 주도하는 1,000만 달러의 시리즈 A 투자를 유치했다. 이미 TTS 시장을 주도하고 있는 구글(Google), 아마존(Amazon), 폴리(Polly), 마이크로소프트(Microsoft)에 맞서 머프.에이아이가 앞으로 어떤 행보를 이어갈지 주목할만하다.
⧉ Syndicated to WWW.CIOKOREA.COM
'🅣•TREND•TECHNOLOGY > ARTIFICIAL INTELLIGENCE' 카테고리의 다른 글
'언어 지원, 이미지 생성, 기후 변화 대응'...구글, 'AI가 기술을 확장하는 세 가지 방법' (0) | 2022.11.03 |
---|---|
AI가 만든 '스톡 이미지' 시대 열린다...셔터스톡, 오픈AI 이미지 생성기 API로 연동 (0) | 2022.11.02 |
"당신의 '상상'은 비디오가 된다"...메타, 제너레이티브 AI '메이크 어 비디오' 공개 (0) | 2022.10.05 |
사람 말귀 더 잘 알아듣는 AI...오픈AI, 다국어 음성 인식 '위스퍼' 아키텍처 공개 (0) | 2022.09.23 |
아바타 제작도 클라우드 AI로 간편하게...엔비디아, '옴니버스 ACE' 발표 (0) | 2022.08.11 |
100만 명에게 AI 이미지 생성 제공...오픈AI, DALL·E 2 베타 출시 (0) | 2022.07.23 |
그래프코어, 슈퍼컴 수준의 IPU 성능 달성...MLPerf 벤치마크 결과 공개 (0) | 2021.07.08 |
AI로 정확하고 빠르게 제품 결함 콕 집어낸다...구글, '시각 검사 AI 솔루션' 발표 (0) | 2021.06.23 |