요즘 생성된 인공지능(AI) 동향과 서비스 ‘챗 GPT’에 대해 알아보기
요즘 생성된 AI동향을 보면 앞으로의 발전방향과 활용도 등에서 조금이나마 예측이 가능하리라 생각하여 오늘은 주요 생성 AI 서비스에 관한 내용을 살펴보고자 합니다.
세계적으로 생성 인공지능(AI) 서비스 '챗 GPT’에 관한 관심이 뜨거운 가운데 네이버가 ‘서치 GPT’ 출시 계획을 밝혔다는 기사가 나왔네요. AI 시대 주도권을 잡기 위한 국내외 빅테크들의 경쟁도 달아오르는 분위기입니다.
주요 생성 인고지능(AI)의 특성을 요약해 봤어요.
① 챗 GPT는 보고서 작성, 프로그램 코딩 등의 기능과 다양한 작업 가능
② 스테이블 디퓨전은 입력한 텍스트에 알맞은 이미지 생성 기능
③ 뮤직 LM은 텍스트 설명으로 모든 장르의 음악 생성 기능
④ 하이퍼크로버는 쇼핑 홍보 문구생성, 글요약, 감정분류 등 기능
⑤ 달리 2는 입력한 텍스트에 알맞은 미이지 생성 기능
추가하여 각각의 인공지능에 대한 개발내용을 찾아보았습니다..
◈ 챗 GPT는 OpenAI가 개발한 프로토타입 대화형 인공지능 챗봇으로 2022년 11월 프로토타입으로 시작되었으며, 다양한 지식 분야에서 상세한 응답과 정교한 답변으로 인해 집중받았으며 정보의 정확도는 중요한 결점으로 지적되고 있다고 합니다.
다른 챗봇들과 달리, ChatGPT는 주고받은 대화와 대화의 문맥을 기억할 수 있으며, 모종의 보고서나 실제로 작동하는 파이썬 코드를 비롯한 인간과 같은 상세하고 논리적인 글을 만들어 낼 수 있고 일부 저술가는 ChatGPT가 놀라울 만큼 인간적이고 상세한 글을 생성할 수 있으며, 이 문제가 학계에서 심각한 문제가 될 수 있다 평가합니다.
◈ 스테이블 디퓨전은 Stability AI에서 오픈소스 라이선스로 배포한 text-to-image 인공지능 모델이며 2022년 8월 22일 출시되었습니다.
Stable Diffusion은 독일 뮌헨 대학교 연구실의 "잠재 확산 모델을 이용한 고해상도 이미지 합성 연구"를 기반으로 하여, Stability AI와 Runway ML 등의 지원을 받아 개발된 딥러닝 인공지능 모델이며 방글라데시계 영국인 에마드 모스타크가 사비로 만든 회사로, Stable Diffusion에 방대한 LAION-5B 데이터베이스를 학습시킬 수 있도록 컴퓨팅 자원을 제공하였으며 개발 비용이 클 것임에도 불구하고 통 크게 오픈 소스로 공개해서 일반인들도 사용을 할 수 있도록 했고 사실상 그림 인공지능의 시대를 연 인공지능 모델이며 이 모델을 채택한 인공지능들이 우후죽순으로 늘어나고 있습니다.
◈ 뮤직LM은 구글 AI 연구팀이 뮤직 LM 개발 과정을 소개한 논문을 지난달 27일에 공개했습니다. 뮤직 LM은 문자를 입력하면 어울리는 음악을 만들어내며 장르와 악기를 가리지 않고 이용자의 요구에 따라 30초 분량의 음원을 생성합니다. 예를 들어 "기억에 남을 만한 솔로 색소폰 소리와 솔로 가수 음성을 담은 재즈음악“, "베이스가 낮은 베를린의 90년대 테크노 음악" 등으로 지시를 내리면 AI가 이에 맞는 노래가 형성된다고 합니다.
기존에 출시된 AI 음악 생성 모델들은 비교적 단순한 멜로디를 만드는 데 그치는 수준이었지만 뮤직 LM은 갑자기 장르가 바뀌거나 스토리 라인이 있는 음악도 만들 수 있고 그림과 캡션을 조합해 지시할 수도 있습니다.
◈ 하이퍼크로버는 네이버가 개발한 인공지능(AI)으로 2021년 5월 공개됐으며 이는 일론 머스크의 '오픈(Open) AI'가 2020년 공개한 초거대 AI 'GPT-3'보다 그 규모가 크고 한글에 기반한 AI 모델이라는 점에서 의미가 있는데, 해당 기술은 네이버 서비스에 적용돼 사용자들에게 제공되고 있습니다. ≪네이버 지식백과 하이퍼크로버 인용≫
우리말을 가장 잘 이해하고 구사하는 최초의 초대형 한국어 인공지능입니다. 영어가 학습 데이터의 대부분을 차지하는 GPT-3와 달리, 하이퍼크로버 학습 데이터는 한국어 비중이 97%에 달합니다. 하이퍼클로바는 우리말을 가장 잘 이해하고 구사할 수 있는 최초의 초대형 한국어 AI 라며 “데이터셋을 별도로 구축하지 않아도 연결된 대화가 가능하고 이용자가 굳이 모든 문장을 완벽하게 구사해서 내 의도를 전달하지 않아도 편하게 대화할 수 있는 수준”이라고 합니다
◈ 오픈AI의 이미지 생성 편집 AI 달리 2(Dall·E 2)는 오픈 AI의 인공지능 서비스를 마이크로소프트(MS) 애저에서 바로 사용할 수 있게 했습니다. 달리 2는 텍스트나 이미지를 입력하면 이에 적합한 이미지를 자동으로 생성하는 AI 모델이며 자연어 추가만으로 사실적인 이미지, 그림, 이모티콘 등 화풍을 바꾸거나 테이블 위에 손수건을 올리는 등 세밀한 표현이 가능합니다.
주요 생성 인공지능 동향
네이버는 3일 4분기 실적 발표 콘퍼런스콜에서 “최근 많은 주목을 받고 있는 생성 AI 같은 새로운 검색 트렌드에 대한 대응책을 준비하고 있다”며 “상반기에 네이버만의 업그레이드된 검색 경험 서치 GPT를 선보이는 것이 목표”라고발표 했습니다. 또한 2021년 개발한 초거대 AI ‘하이퍼크로버’를 자사 서비스에 활용 중이며 하이퍼크로버를 손쉽게 쓸 수 있는 노코드(no code) 툴 ‘클로바스튜디오’‘크로버스튜디오’를 만들어 스타트업 등에도 제공하고 있다고 합니다.
SK텔레콤은 대화형 AI 서비스 ‘에이닷’의 활용 범위를 서비스 추천 등으로 확대하고 있으며 KT는 상반기 자체 개발한 초거대 AI ‘믿음’을 상용화할 계획이라고 합니다. 카카오는 텍스트를 입력해 이미지를 만들 수 있는 앱 ‘비디스커버’를 출시했습니다.
MS는 챗 GPT를 개발한 오픈 AI에 2019년부터 꾸준히 투자해 왔으며 지난달 장기 파트너십을 체결하면서 MS의 소비자 및 기업용 제품에 오픈 AI의 기술을 적용한다는 계획도 공개했습니다. MS는 자사 클라우드 서비스인 ‘애저’에서 오픈 AI의 대규모 언어 모델인 GPT-3.5와 이미지 생성 모델 달리 2(Dall-E2) 등을 도입했고 조만간 검색 서비스인 ‘빙’에 챗 GPT 기능도 추가할 전망이라고 합니다.
구글도 챗 GPT의 대항마를 선보인다고 합니다. 대규모 언어 모델 ‘람다’를 활용한 챗봇 ‘‘수습 시인(Apprentice Bard)’을 테스트하는 ‘아틀라스 프로젝트’를 추진 중이며 수습 시인은 챗 GPT와 비슷하지만 최근에 일어난 일에 대해서도 답변이 가능합니다.
이상 몇 가지 생성 인공지능(AI) 서비스에 대해 살펴보았습니다. 요즘 인공지능 챗 GPT가 아주 핫하다고 해서 기본적인 사항에 대해 스킨해 보았는데요, 한번 가볍게 읽어주시면 될 것 같습니다. 구독 감사합니다.
댓글