본문 바로가기

'생성 AI는 합성 데이터의 일등공신'...'아마존 원' AI가 만든 손바닥 사진으로 학습

반응형

생성 AI(generative AI)가 각양각색의 분야에서 다재다능한 재주로 주목을 받고 있다. 텍스트, 문자, 사진, 동영상 등의 데이터를 기반으로 새로운 데이터를 생성하거나 주어진 데이터를 수정 또는 변형할 수 있는 능력 때문이다. 하지만 대규모 언어 모델을 기반으로 한 생성 AI는 이미 유명해지기 이전부터 어렵거나 불가능했던 영역에서 유용하게 활용되어 왔다. 이를 테면 합성 데이터 생성 같은 영역이다.

아마존의 비접촉 결제 솔루션인 '아마존 원(Amazon One)' 역시 합성데이터가 없었다면 세상에 선보이지 못했을지도 모르는 대표적인 사례다. 아마존 원에는 생체 인식, 광학 기술, 생성 AI, 기계 학습 등 다양한 최첨단 기술이 스며들어 있다. 사람마다 다른 손바닥을 결제 수단으로 활용해, 신용 카드나 스마트폰 같은 수단이나 도구가 없어도 상품을 구매할 수 있다.

아마존 원은 생성 AI가 합성한 다양한 조건과 모양을 가진 수 백만개의 손바닥 사진을 통한 학습으로 99.9999%까지 정확도를 높였다. (자료 : Amazon)


AWS의 애플리케이션 부사장인 제라드 메디오니(Gerard Medioni)는 "아마존 원은 빠르고 편리한 비접촉식 기술로 매장 결제, 포인트 카드 제시, 나이 확인, 행사장 입장 등 일상적인 활동에서 손바닥을 사용할 수 있다. 하지만 아마존 원 환경의 마법과 편리함 뒤에는 해결해야 했던 복잡한 문제가 숨어 있다. 아마존 원의 핵심은 단 한 가지, 시스템이 실수해서는 안 된다는 것이다"라고 개발 과정을 언급하며 이를 블로그를 통해 소개했다.

단 한 번의 실수나 오류도 용납하지 않는 완벽한 솔루션을 개발하기 위해서는 기계학습을 통한 훈련과 학습을 통해 완벽한 정확도를 달성해야 했다. 이 과정에서 가장 중요한 것은 '좋은 데이터가 많아야 한다'는 점이다. 학습에 사용할 사람 손바닥 사진이 많으면 많을수록 정확도를 높일 수 있다. 하지만 사람 손바닥 사진은 쉽게 구할 수 있는 데이터가 아니다. 이를 위해 실제 사람 손바닥을 일일이 촬영한다는 것도 불가능하다.

아마존은 생성 AI를 활용한 합성 데이터 생성으로 이러한 문제를 해결했다. 생성 AI를 활용해 수백만 개의 손바닥 이미지를 생성하는 '팜 팩토리(palm factory)'를 통해 AI 모델이 학습할 수 있도록 한 것이다. 지금처럼 생성 AI에 대한 관심과 열기가 뜨겁기 수년 전부터, 이미 아마존 원은 대규모 언어 모델이나 멀티 모달(multi-modal) 등의 개념을 적용하고 있었던 셈이다.

아마존 원은 수많은 손바닥 사진과 그 아래에 포함된 혈관 이미지를 학습하며 정확도를 높여갔다. 조명 조건, 손의 모양, 반창고가 붙어 있는 손 등 다양한 상황과 조건이 적용한 손바닥 사진의 합성 데이터가 사용됐다. 기계 학습에서 사용되는 이미지 데이터는 그 사진이 어떤 내용을 담고 있는지를 알려주는 주석을 달아야 한다.

이를 테면 손바닥 손금, 흉터, 결혼반지, 반창고처럼 손바닥 사진에 담겨 있는 구별 요소와 특징을 텍스트 라벨로 달아 주어야 한다. 만약, 이 과정을 사람이 직접 해야 한다면 엄청난 시간이 소요된다. 아마존은 손바닥 합성 데이터를 생성하는 과정에서 자동으로 라벨까지 생성하다록 해 시간을 절약하고 작업 속도를 높일 수 있었다. 실리콘으로 매우 정교하게 만들어진 가짜 손을 감지하는 학습 과정을 통해서도 정확도를 높였다.

제라드 메디오니 부사장은 "아마존 원이 99.9999%의 정확도로 3백만 번 이상 사용되었다. 손바닥 표면과 피하 이미지의 조합을 통해 홍채 두 개보다 100배 더 정확한 시스템을 구축한 것이다. 하지만 개인 정보 보호를 위해 손바닥 정보를 개인 식별에 활용하지 않으며, 고유한 신원을 결제 수단과 일치시키는 데만 사용한다"고 전했다.

아울러 "현재 아마존 원은 500개 이상의 홀푸드 마켓 매장과 여행 소매업체, 스포츠 및 엔터테인먼트 장소, 편의점, 식료품점 등 수십 개의 타사 매장에 도입되고 있다. 각 매장에는 소형 아마존 원 장치가 설치되어 손바닥의 고유한 선, 홈, 융기, 그리고 피부 바로 밑의 정맥을 인식할 수 있다. 이를 기반으로 손바닥 서명 또는 고유한 숫자 벡터 표현을 생성하고 이를 신용카드 또는 아마존 계정에 연결한다"고 밝혔다.

 

Syndicated to WWW.CIOKOREA.COM

반응형