본문 바로가기

AI가 유튜브 요약과 분석까지…구글, ‘노트북LM’에 동영상 & 오디오 지원

반응형

인공 지능은 사람을 모방했지만 진화의 속도는 결이 다르다. 사람의 그것은 거의 체감하기 힘들지만 인공 지능은 자고 나면 달라진다. 계절이 한번 바뀌는 시간이면 수많은 인공 지능이 생겨나고 변신하고 성장한다. 인공 지능 기반 메모 작성 도구로 탄생한 구글의 ‘노트북LM(NotebookLM)’은 그중에서도 단연 돋보이는 AI 도우미다.

노트북 LM이 오디오와 비디오를 분석하고 이해하며 이를 기반으로 사용자의 질문에 답변하는 수준으로 진화했다. 지난번 업그레이드에서 구글 문서, PDF 파일을 지원하면서 활용 범위를 넓히더니, 이번에는 유튜브(YouTube) 비디오와 오디오 파일까지 분석하고 요약하는 능력을 추가했다.

노트북LM에서 이제 오디오 파일과 유튜브 영상을 지원한다. 스크립트가 포함된 공개 유튜브 영상 링크나 오디오 파일을 업로드하면 요약하고 정리한 문서를 요청하고, 질문을 통해 필요한 내용을 확인할 수 있다. (자료 : Google)


업무나 학습용으로 비디오와 오디오를 사용하는 경우가 많은 사용자들에게 더없이 좋은 소식이 아닐 수 없다. 짧으면 몇 분에서 긴 것은 몇 시간 분량의 비디오와 오디오 내용을 파악하려면 그 보다 몇 배의 시간이 필요하다. 처음부터 끝까지 내용을 훑어야 하고, 이를 메모나 녹취로 만든 후 업무나 학습에 참고하기 위해 문서로 만드는 것이 만만치 않은 까닭이다.

이제 노트북LM을 활용하면 이런 작업을 좀 더 편리하게 해결할 수 있다. 노트북LM을 열고 ‘새 노트북’을 선택한 후, 유튜브 영상 링크를 올리면 끝이다. 링크를 제공 받은 노트북LM은 동영상에 있는 텍스트 스크립트(Script)를 기반으로 내용을 분석한 후 핵심적인 내용을 요약과 ‘추천 질문’을 도출해 준다.

또한, 내용을 분석해 질문과 답변 형식으로 정리한 ‘FAQ’, 학습에 활용할 수 있도록 핵심 용어, 퀴즈, 에세이 주제 등으로 정리한 ‘학습 가이드’, ‘목차’, ‘타임 라인’ 등을 메모 형태로 생성한다. 또한, 두 사람이 서로 토론하는 형식으로 내용을 구성하는 ‘심층 대화’도 사용할 수 있다.

다만, 최근에 업로드된 유튜브 영상은 사용할 수 없다고 되어 있는데, ‘최근’이 의미하는 기간이 얼마인지에 대해서는 정확한 안내가 없다. 아울러 노트북LM에서 사용할 수 있는 유튜브 영상은 텍스트 스크립트가 포함되어 있어야 하며, 공개된 영상만 사용할 수 있다. 심층 대화는 현재는 영어만 지원한다.

오디오 파일 지원은 회의나 수업 내용을 정리할 때 유용하다. 녹음 파일을 업로드하면 이를 텍스트 문서로 정리하고, 이를 기반으로 필요한 내용을 검색하고 중요한 내용만 정리해서 요약할 수 있다. 따라서, 처음부터 끝까지 전체 내용을 들을 필요가 없고, 녹취한 내용을 기반으로 질문을 하거나 중요한 내용을 요약해서 보관할 수 있다.

AI가 음성이나 통화 내용을 녹취 문서로 만들고 이를 요약하는 기능은 새로울 것이 없을 만큼 다양한 서비스가 나와있다. 노트북LM에서 제공하는 오디오 파일 지원 역시 그런 점에서는 다를 것이 없다. 하지만 노트북LM은 사용자가 제공한 소스만을 사용하고 공동 작업자와 함께 공유하는 내용이 아니라면 비공개로 유지된다는 것이 장점이다.

노트북LM은 구글의 생성형 AI 모델인 제미나이 프로(Gemini Pro)를 기반으로 한다. 제미나이 프로는 문자, 음성, 오디오, 동영상을 인식하고 처리할 수 있는 멀티모달(MultiModal) AI로, 제미나이 프로가 진화하면 노트북LM 역시 계속해서 변화하고 발전할 것으로 기대된다.

 

Syndicated to WWW.CIOKOREA.COM

반응형