Transcribe 썸네일형 리스트형 ‘공감’ 대화 가능한 AI 오디오 모델…오픈 AI, API 기반 오디오 모델 공개 사람의 음성을 인식하거나 사람의 음성을 생성하는 AI 오디오 모델이 한 단계 진화했다. 자연스러운 구어를 사용하고, 상황에 맞는 악센트와 단어를 선택하며, 다양한 상황에 대처하며 효과적으로 소통할 수 있도록 발전한 것이다. 이를 고객 서비스를 제공하는 콜센터나 회의록 필사 등에 사용하면 이전과는 다른 AI 오디오 모델의 지원을 받을 수 있다.오픈AI(OpenAI)가 API(API—making)를 지원하는 AI 오디오 모델 두 가지를 전 세계 개발자들을 대상으로 공개했다. 이번에 공개된 AI 모델은 사람 목소리를 인식해서 문자로 바꿔주는 ‘음성-문자’ 모델 두 가지와 문자나 문장을 음성으로 변환하는 ‘문자-음성’ 모델 한 가지다.최신 음성-문자 변환 오디오 모델의 언어별 ‘단어 인식 오류율(Word Err.. 2025. 3. 29. 더보기 외국어 녹음-번역-문자 변환…구글, 번역앱에서 8개국 트랜스크라이브 지원 안드로이드 스마트폰에서 사용하는 구글 번역 기능이 한 단계 업그레이드된다. 안드로이드 구글 번역(Google Translate Android) 앱에서 음성으로 외국어를 녹음하고, 이를 원하는 언어의 문자로 변환할 수 있는 트랜스크라이브(Transcribe) 기능을 지원하기 때문이다. 예를 들어 영어로 진행되는 회의나 강의 내용 전체를 녹음하면서, 이를 스페인어 같은 다른 언어로 번역한 문장을 보는 것이 가능해진다. 현재 사용되는 스마트폰용 구글 번역 앱에서도 ‘음성’이나 ‘대화’ 모드를 이용하면, ‘음성’을 인식을 활용한 번역 서비스를 이용할 수 있다. 하지만 이 경우는 짧은 문장과 대화에만 사용할 수 있다. 트랜스크라이브는 사람의 목소리를 녹음하면서, 녹음되는 내용을 번역한 후 문자로 보여준다. 누군가.. 2020. 3. 19. 더보기 이전 1 다음