본문 바로가기

‘상상하는 소리를 현실로 만든다’…일레븐랩, 음향 효과 생성 AI 도구 출시

반응형

찾는 것이 어렵지만 만드는 것은 더 어렵다. 무엇인가를 알리고 소개해야 하는 자료를 만들어야 할 때, 안성맞춤인 사진, 영상, 소리를 찾는 것과 만드는 것은 높은 산과 깊은 강을 건너야 하는 일이다. 하지만 하루가 다르게 진화하는 생성형 AI가 있다면 얘기가 달라진다. 그것의 등장을 우려하면서도 한편에서는 두 손을 들고 반기는 이유다.

이번에는 음향 효과 ‘소리’다. 음성 AI 연구 스타트업인 일레븐랩스(ElevenLabs)가 만들고 싶고 듣고 싶은 소리를 프롬프트에 입력하면 바로 생성해 주는 음향 효과(Sound Effects) AI 도구를 선보였다. 제품이나 서비스 소개, 프로젝트 포트폴리오, 마케팅 동영상 클립 등에 필요한 소리를 AI를 통해 만들 수 있는 것이다.

일레븐렙스가 생성형 음성 AI을 통해 음향 효과로 사용할 수 있는 다양한 소리를 생성할 수 있는 기능을 도구를 발표했다. (자료 : ElevenLabs)


예를 들면 ‘성공적인 공연이 끝난 후 환호하는 관객’, ‘울타리 뒤에서 짖는 강아지’, ‘사무실에 키보드를 두드리는 소리’, ‘옛 소련 도시에서 울리는 사이렌’ 소리 등을 문자로 입력해서 생성할 수 있다. 챗GPT처럼 프롬프트에 만들고 싶은 소리 유형을 설명하면, 4가지 종류의 비슷하면서도 서로 다른 소리를 만들어 준다.

일레븐랩스는 ‘상상할 수 있는 모든 사운드를 생성할 수 있다’고 하지만 아직은 초보적인 수준이다. 최고 수준의 전문가가 전문적인 장비를 가지고 만들어낸 영화나 음악 속의 음향 효과와 비교할 수는 없다. 하지만 지금 당장 업무용 또는 개인용으로 활용할 음향 효과를 쉽고 빠르게 얻고 싶을 때 관심을 가져볼 만하다.

대부분의 생성형 AI가 그렇듯이 원하는 소리에 가까운 음향 효과를 얻으려면 프롬프트를 잘 활용해야 한다. AI가 제대로 작업할 수 있게 구체적이고 명확하게 텍스트를 입력해야 한다. 현재는 천둥번개, 초인종 등의 표준 음향 효과 생성과 기타 루프, 재즈 색소폰 솔로, 음악 테크노 루프 같은 최대 22초 분량의 악기 음악 트랙 생성이 가능하다.

이러한 음향 효과 생성은 무료 사용자라도 한 달에 총 10분 미만 분량의 오디오 파일 생성을 통해 체험해 볼 수 있다. 다만 무료 사용자는 이렇게 생성한 오디오 파일을 사용할 때마다 제목에 ‘elevenlabs.io’를 포함한 출처를 밝혀야 한다. 유료 사용자의 경우는 이러한 제한이 없다.

아울러 일레븐랩스는 ‘생성형 음성 AI(Generative Voice AI)’ 서비스를 통한 자연스러운 텍스트 음성 변환 서비스를 제공한다. 전 세계 29개 언어로 제공되는 AI 음성 생성기를 통해 다양한 성별, 음색, 억양 등을 적용한 실제 사람 목소리에 근접한 음성을 만들 수 있다.

 

Syndicated to WWW.CIOKOREA.COM

반응형