대기업이지만, ChatGPT를 못 만든다?

대기업이지만, ChatGPT를 못 만든다?

안녕하세요, IT린이 제나팡입니다. 작년 12월부터 지금까지 줄곧 오픈AI가 만든 인공지능 챗봇 ChatGPT에 대한 언급이 끊이지 않고 있습니다. 최근 대기업 공개채용 시즌이 시작하면서, ChatGPT로 자기소개서를 작성하는 꿀팁에 대한 유투브 영상도 나오더라구요.

이처럼 ChatGPT가 사람처럼 대화를 나눌 수 있었던 이유는 대규모 자연어 처리 언어모델(LLM) GPT-3.5을 기반으로 했기 때문입니다. 게다가 차세대 최신 언어 모델인 GPT-4까지 발표되면서, 앞으로 더욱 더 답변의 정확도는 높아지고, 인식 범위가 이미지까지 확장이 되어 심지어 의학적 조언까지 제공할 수 있다고 해요.

(GPT-4모델의 Exam Results (GPT-3.5성능과 비교) / 출처: OpenAI)

오픈AI는 GPT-4 모델의 성능을 GPT-3.5와 비교한 결과를 발표하기도 했습니다. 초록색이 GPT-4, 파란색이 GPT-3.5의 결과 수치에요. 특히, 언어 모델 성능의 지표로 사용되는MMLU 점수를 비교해보면, GPT-4 정확도는 약 86%로, 약 70%를 기록한 GPT-3.5 대비 16%포인트 더 높은 수치를 보이고 있습니다. 물론 아직도 부정확한 답변을 내놓을 가능성은 있지만, 빠른 시간 안에 업그레이드 버전을 놓았다는 점에 주목이 되었습니다.

글로벌 빅테크 간 경쟁이 치열해지는 초거대AI

이제는 단순 초거대 AI 모델에서 나아가, 협업툴 플랫폼과 같이 결합되어 생산성을 제고하려는 시도가 많이 보이고 있어요. 비즈니스 분야에서의 혁신이 가속화되는 듯 해요.

2019년부터 마이크로소프트와 오픈AI는 전략적 파트너십을 맺고 다양한 업무 부문에서 협업을 해오고 있습니다. 특히 지난 2월, 마이크로소프트는 협업툴 팀즈에 ChatGPT를 결합한 ‘팀즈 프리미엄'을 출시하기도 했죠. 자동으로 회의록을 작성해 주거나, 업무 체크리스트를 알려주는 기능을 해준다고 해요.

출처: Freepik

글로벌 빅테크에 맞서는 국내 빅테크 업체들

이와 같은 시도에 맞서서, 국내 빅테크 기업들도 국내 사용자에 최적화된 AI를 생성하고 있습니다. 아무리 ChatGPT의 성능이 좋아도, 한국어 버전은 아쉬운 점이 많다는 후기에서 알 수 있듯, 아직 ‘한국어' 버전의 초거대 AI는 블루오션처럼 남아있습니다.
(다만, GPT-4가 한국어를 포함한 다국어 버전을 강화하여,  다국어 서비스가 3.5버전의 영어능력을 넘어섰다는데.. 앞으로의 험난한 과정이 예상되네요.)

  • 네이버 : 하이퍼클로바X - 한국어 데이터 학습량 증가
  • 카카오 : KoGPT 3.5 업그레이드 & 카카오톡 기반의 AI 챗봇 서비스 ‘다다음(ddmm)’
  • LG : 엑사원 EXAONE -3000억개의 파라미터 보유
  • 한글과컴퓨터 : 한컴오피스에 AI 기능 접목한 AIaaS 솔루션

우선, 네이버의 동향부터 알아볼게요. 위에서 언급했듯이, ChatGPT의 한국어 버전이 아쉽다는 점을 공략하여 하이퍼클로바x는 ChatGPT보다 한국어 데이터를 6500배나 더 많이 학습시켰다고 해요. 오는 7월에 공개될 예정입니다.

출처: 네이버

특히 네이버는 국내의 대표적인 검색 엔진이죠? 그동안의 검색엔진 운영 노하우와 방대한 양의 데이터를 기반으로, 한국인 최적 맞춤 검색용 생성 AI 서비스를 제공할 계획이라고 합니다. 또한, 지난 21일, SK C&C와 네이버클라우드는 사업 협력 협약을 체결하며, 네이버의 초거대 AI ‘하이퍼클로바X’와 결합해 금융 분야별 맞춤형 초거대 AI 모델을 발굴하기로 했습니다.

다음으로, 카카오도 알아볼게요. 카카오는 카카오브레인을 중심으로 AI 연구와 개발을 진행하고 있는데요. 카카오브레인 대표는 올 상반기 내에 KoGPT를 3.5버전으로 고도화하며, 올 하반기 내에 'Ko챗GPT'를 선보이겠다는 계획을 발표하기도 했습니다. 또한 카카오브레인은 지난해 12월, AI 아티스트 ‘칼로 1.0’ 오픈소스로 공개했는데, 입력 제시어로 빠르게 고품질 이미지를 만들어줍니다.

Image generation, Image painting, Image variation으로 총 3 종류의 서비스를 제공하고 있더라구요. (https://kakaobrain.com/techplayground/karlo/demo 궁금하시다면, 한 번 데모버전을 사용해보시는 건 어떠세요 :))

출처: 칼로 데모버전 사이트

Image Generation 서비스에 ‘puppy playing on the ground’를 입력했더니, 아래와 같은 이미지가 생성되었습니다.

출처: 칼로 데모버전 사이트

LG는 AI 연구원을 중심으로, 3000억 개의 파라미터를 보유한 초거대 AI ‘엑사원 EXAONE’을 개발했습니다. LG그룹 초기 개발에만 1억 달러, 한화로 약 1283억원에 달하는 거액을 과감히 투자하는 결정을 내리기도 했습니다. 또한, 한글과컴퓨터는 30년 이상의 업무 플랫폼 운영 능력과 챗봇 AI 기술을 결합한 AIaaS (AI as s Service) 솔루션을 본격적으로 개발하고 있습니다.

초거대AI 진입장벽의 현실


그럼에도 제가 오늘 말씀드리고 싶은 건, 국내 빅테크 기업의 상황이 앞으로도 힘들어질 전망이라는 것입니다. 워낙 글로벌 빅테크 AI의 성능 향상 속도가 빠르기 때문이죠. 일례로, 오픈AI는 GPT-3.5를 공개한 지 4개월도 지나지 않아 GPT-4를 발표했습니다. GPT-3에서 GPT-3.5로 진화하기까지 2년이 넘는 시간이 소요된 것에 비해, 훨씬 더 속도를 낸 것을 알 수 있죠?

또한, 초거대 AI의 개발과 운영에 막대한 비용이 들어갑니다. 이러한 이유로 스타트업에게 너무나도 진입장벽이 높은 시장이기도 한데요. 실제로 국내 IT 스타트업들은 초거대 AI를 직접 개발하기 보다는, ChatGPT를 특정 버티컬 서비스에 접목한 2차 서비스를 가공하여 제품을 내놓는 경우가 많죠.

출처: Freepik

알고보니 이러한 진입장벽은 글로벌 시장으로 진출하려는 국내 빅테크 기업에게도 해당되는 지론이었네요. 글로벌 빅테크 사업체가 가지고 있는 막대한 자본력 때문이죠. 네이버는 파라미터 2040억개를 하이퍼클로바에 학습시키며 1000억 원이 넘는 비용을 투자했지만, 비용 투자에 비해 체감되는 효용성이 적습니다. (리뷰요약과 상품설명에 하이퍼클로바가 적용됐다는데, 사용자가 알아채기엔 아직 한계가 있는 것 같아요.)

또한, 역량이 부족하지만 시장에 진입한 사례도 있습니다. 바로, 지난 19일에 잠깐 공개되었다가 홀연히 사라졌던, 카카오브레인이 다다음(ddmm)!

출처: 카카오

이는 카카오톡에 적용되는 AI 챗봇 서비스인데, 카카오는 오픈베타 사용자를 모집했으나 하루만에 재정비를 결정하기도 했죠. 완성도가 낮은 상황에서 트렌드에 맞춰 성급하게 공개한 것 같습니다.

초거대AI를 개발하기에 역부족한 국내 사업 환경, but 버티컬 산업에 맞는 AI 개발 통해 경쟁력 확보 가능

이처럼 초거대 AI가 IT 업계의 트렌드이자 생존전략으로 자리잡고 있기에, 국내외 업체를 막론하고 뛰어들고 있는 상황입니다. 메타도 갑자기 메타버스를 포기하고 AI에 집중하자며 전략을 바꾸고 있다고 해요. 또한, 국내 대표 빅테크인 카카오와 네이버를 중심으로 ‘한국어 특화’ 초거대 AI 개발에 몰두하고 있지만, 기술력과 상용성이 부족한 건 아쉽지만 사실인 것 같아요.

다만, 종합적으로 봤을 때, 단순히 국내 기업의 기술력만이 문제는 아닙니다. 국내 사업 환경은 클라우드 인프라, 데이터 센터와 같은 물리적인 요소 뿐만 아니라 데이터 공유와 관련된 인식으로 인해, ‘빅테크와 대적할 만한' 초거대 AI를 개발하기에는 여러 제약이 많습니다.

세계 시장에서 경쟁력을 갖기 위해 niche market을 타기팅한 모델을 개발하는 것이 우선적으로 필요해 보이네요. 사업 환경면에서도, 비용 투자면에서도 가시밭길이 예상되는 LLM(거대 언어모델, 초거대AI의 기반이 되는 언어모델)을 직접 개발하기 보다, 기존 초거대 AI의 API를 활용해 버티컬 서비스를 구축하는 것이 훨씬 더 효율적일 것 같습니다.






잇린이(IT+린이) 제나팡입니다. 문돌이의 IT 이슈 따라잡기, 함께 할까요?

* 슈퍼브 블로그의 외부 기고 콘텐츠는 외부 전문가가 작성한 글로 운영 가이드라인에 따라 작성됩니다. 슈퍼브 블로그에서는 독자분들이 AI에 대한 소식을 더 쉽고 간편하게 이해하실 수 있도록 유용한 팁과 정보를 제공하고 있습니다.