'llm' 태그의 글 목록

본문 바로가기

llm

AI에게 학습만큼 망각이 필요한 이유 …IBM, ‘대규모 언어 모델 언러닝’ 중요 인공 지능에게 지금 가장 필요한 능력은 ‘망각’ 일지 모른다. 인공 지능이 사람의 지능과 동등해지거나 이를 능가하려면, 새로운 것을 배우는(learning) 것만큼 학습한 것을 잊는(unlearning) 것이 중요하기 때문이다. 잘못된 정보와 편협한 지식으로 학습한 인공 지능은 차라리 없는 것만 못할 만큼 파괴적이고 폭력적인 다양한 문제를 일으킬 수 있다.IBM 리서치의 사이언스 라이터(Science Writer)인 킴 마티노(Kim Martineau)가 ‘LLM에게 잊어버리라고 가르치는 이유’라는 블로그 콘텐츠를 통해 ‘대규모 언어 모델의 언러닝(large language model unlearning)’의 필요성과 중요성을 설명했다. 다음은 이를 요약한 내용이다.머신 언러닝(Machine Unlear.. 2024. 10. 16. 더보기

‘나쁜 말’ 걸러주는 오픈 소스 AI 모델…IBM, 작고 빠른 새로운 HAP 필터 공개 사실처럼 위장한 명백한 거짓과 정제되지 않은 언어는 생성형 AI 시대 가장 큰 골칫거리다. AI가 내놓은 모든 결과는 입력된 데이터를 기반으로 한 학습을 통해 생성된다. 윗물이 맑아야 아랫물이 맑듯이 학습에 사용한 데이터에 거짓이나 오류가 있다면 결과 역시 그것을 그대로 반영한다.IBM이 새로운 HAP(Hateful, Abusive, Profane) 필터인 ‘그래니트-가디언-hap-38m’를 오픈 소스로 공개했다. 이번에 공개한 HAP 필터는 3,800만 개의 매개변수를 사용한 경량 모델로 데이터 필터링 속도를 높이는 데 초점을 맞췄다.새로운 HAP 필터인 그래니트-가디언-hap-38m은 그래니트-가디언-hap-125m보다 CPU에서는 8배 GPU에서는 약 2배 더 빨랐다고 IBM은 밝혔다. (자료 : .. 2024. 9. 12. 더보기

사람처럼 빠르게 이해하고 빠르게 답변…오픈AI, 플래그십 LLM ‘GPT-4o’ 발표 사람처럼 ‘빠르게’ 이해하고 사람처럼 ‘빠르게’ 답변하는 거대언어모델(LLM) 모델이 세상에 등장했다. 그동안 사람처럼 생각하고 사람처럼 답변하는 거대언어모델의 진화 방향에, 사람처럼 자연스러운 상호작용을 하기 위해서 필수적인 ‘빠른 속도와 자연스러움’이 본격적으로 추가되며 진화의 속도가 빨라진 것이다.오픈AI(OpenAI)가 기존의 GPT-3.5, GPT-4, GPT-4 터보의 뒤를 이은 거대언어모델인 GPT-4o(모든 것을 의미하는 ’omni’의 o)를 전격 공개하며, 새로운 플래그십(flagship) 거대언어모델을 세상에 발표했다. 기존의 거대언어모델과 비교할 때 입력과 출력 속도를 획기적으로 개선한 ‘실시간 추론’이 특징이다.오픈AI가 텍스트, 오디오, 이미지의 모든 조합을 입력으로 받아들이고 텍.. 2024. 5. 14. 더보기

LLM 시장 2030년까지 33.2% 성장…마켓앤마켓, 대규모 언어 모델 시장 전망 대규모 언어 모델(LLM) 시장 규모가 2024년 64억 달러에서 2030년 361억 달러로 급증하며, 33.2%(CAGR)의 성장률을 기록할 전망이다. 자동화된 컨텐츠 제작과 큐레이션에 대한 수요가 증가하면서, 방대한 데이터 세트에 대한 수요가 대규모 언어 모델을 시장의 성장을 이끌 것으로 예상된다. 마켓앤마켓(MarketsandMarkets)이 ‘2030년까지 대규모 언어 모델 시장 전망(Large Language Model Market - Global Forecast to 2030)’을 발표했다. 보고서는 LLM 시장을 제공 형태(소프트웨어, 서비스), 아키텍처, 모달리티(Modality), 모델 사이즈, 애플리케이션, 최종 사용자 등으로 구분해 조사와 분석을 진행했다. 대규모 언어 모델 시장이 2.. 2024. 4. 18. 더보기

코딩에 특화된 대규모 언어 모델...메타, 코드 라마(Code LIama) 공개 아직 상상이 끝나지 않았는데 이미 현실이 되어 버렸다. 최근들어 메타가 대규모 언어 모델을 비롯해 AI 역사에 남기고 있는 족적을 보면 그런 생각이 든다. 이번에는 코딩 전용 대규모 언어 모델인 '코드 라마(Code Llama)'가 그 중심에 놓였다. 프로그래밍을 배우는 초보자에게는 선생님 역할을 해주고, 개발자들에게는 경력 많은 도우미 또는 파트너가 될 수 있는 인공 지능이다. 코드 라마는 메타가 2023년 7월 18일 출시한 차세대 대규모 오픈소스 언어 모델인 '라마 2(Llama 2)'를 코드 작성과 검토에 최적화한 코딩 전용 AI 모델이다. 라마 2가 박학다식한 만물박사라면 코드 라마는 코딩 능력에 초점을 맞춘 코딩 전문가인 셈이다. 이번에도 역시 연구는 물론 상업적 용도로 누구나 무료로 사용할 .. 2023. 8. 25. 더보기

'개방과 책임으로 AI 언어 모델 혁신'...메타, MS와 차세대 LLM 라마(LIama) 2 공개 "우리는 개방형 접근 방식이 오늘날의 AI 모델, 특히 기술이 빠르게 발전하는 생성 AI의 모델 개발에 적합하다고 생각한다. 기업, 신생 기업, 기업가 및 연구원에게 스스로 구축하기 어려운 규모로 개발된 도구에 대한 액세스 권한을 제공하고, 다른 방법으로는 액세스 할 수 없는 컴퓨팅 성능을 지원하면 흥미로운 방식으로 실험하고 혁신할 수 있는 기회의 세계가 열릴 것이다." 메타(Meta)와 마이크로소프트(Microsoft)가 오픈 소스 차세대 대규모 언어 모델(LLM;Large Language Models)인 '라마(LIama) 2'를 공개했다. 오픈 소스인 만큼 연구 및 상업적 용도로 무료이기 때문에, 누구나 라마 2를 활용한 생성 AI 기술이나 기능을 개발하고 확장할 수 있다. 마이크로소프트는 애저(A.. 2023. 7. 22. 더보기

티스토리툴바