본문 바로가기

반응형

Audio

120초 대화 3초 만에 AI로 생성…딥마인드, 오디오 생성 기술 ‘사운드스트림’과 ‘오디오LM’ “최신 음성 생성 기술은 대화 스크립트와 화자 전환 표시(speaker turn markers)만 주어지면 2분 분량의 대화를 화자 일관성을 가진 높은 오디오 품질로 생성할 수 있다. 이 모델은 단일 텐서 프로세싱 유닛(TPU) v5e 칩에서 3초 이내에 한 번의 추론 패스로 이 작업을 수행한다. 즉, 실시간보다 40배 이상 빠르게 오디오를 생성한다.”구글 딥마인드(DeepMind)가 그동안 진행해 온 오디오 생성 연구의 기반이 된 기술 개요를 ‘오디오 세대의 지평을 넓히다’라는 제목으로 블로그를 통해 소개했다. 단순한 소리 생성과 합성에서 시작한 오디오 생성 연구는 실제 사람의 목소리를 완벽에 가깝게 생성하는 것은 물론이고 어조, 음색, 감정 표현까지 실제 사람과 구분하기 힘들 만큼 구현하는 단계에 이.. 2024. 11. 19. 더보기
스포츠 마니아를 위한 맞춤형 이어폰과 MP3P 음악과 운동을 모두 좋아하는 사람이라면, 음악을 들으면서 각종 스포츠나 레포츠를 즐기는 일이 많다. 그럴 때 격렬한 움직임이나 빗물과 같은 외부 환경으로부터 편안하고 안전하게 사용할 수 있는 헤드폰이나 이어폰은 필수다. 그런 용도에 맞는 이어폰은 내구성이 강해야 하고, 방수 기능을 기본적으로 갖추고 있어야 한다. 최근 들어 음악을 들으면서 스포츠와 레저를 즐기는 고객들이 늘어나면서, 헤드폰과 이어폰 시장에서도 이러한 변화에 맞게 진화한 제품들이 속속 모습을 드러내고 있다. 이어폰은 오디오나 관련 액서사리 전문업체의 영역이지만, 이러한 제품에 대한 수요가 늘어나면서 스포츠 용품 업체와 협업을 시도하는 경우도 점차 늘어나고 있다. 제품이 기획에서부터 생산, 마케팅, 판매과정을 서로 다른 영역의 업체가 손을 .. 2010. 4. 28. 더보기