ChatGPT로 보는 초거대 AI

ChatGPT로 보는 초거대 AI

ChatGPT 요즘 엄청 핫하죠. 왜 이게 핫한지, 그리고 네이버, 카카오는 어떻게 고군분투하고 있는지 살펴볼게요.

ChatGPT로 보는 초거대 AI

- 구글이 없어질 수 있다? -> ChatGPT=대화형 검색엔진
- 네이버, 카카오의 고군분투 -> 한국어 패치된 초거대 AI의 경쟁력
- 빅테크 기업만 도전할 수 있는 이유-> 독과점 no, 확보할 수 있는 데이터 갯수의 한계일 뿐

그럼, 구글이 왜 위기라는 걸까? : 이게 무슨 말일까?

- 구글(=기존 검색 엔진) : 내가 '키워드'로 힌트를 줘가면서 '내'가 검색결과를 비교하며 답을 찾는다.
- ChatGPT: 초거대 AI가 '내 문장'속에서 힌트를 찾아가면서 '나 대신' 검색결과를 비교하여 답을 찾아준다.

= 더 편한 게 ChatGPT
=불편한 구글/네이버 같은 검색 엔진은 역사 속으로 사라질 수 있다는 말!

그럼, 이게 어떻게 가능할까?

이전 랜덤 상식에서 잠깐 다뤘었는데, ChatGPT로 대표되는 초거대 AI는 자연어의 맥락을 이해할 수 있기 때문이다. 코알못인 나는 'give me the simplest code'를 입력하고 'Hello World'가 나오게끔 하는 간단한 코드 정도의 답변만 받을 수 있었는데, 최근에는 ChatGPT가 구글 입사 코딩 테스트를 통과했다는 기사도 있었다.

(출처: PCmag)

한편 지난 7일 마이크로소프트는 ChatGPT 기능이 첨가된 Bing 신버전을 공개했는데, 쉽게 말하면 Bing의 새로운 검색엔진 인터페이스가 소개된 것이다.  엣지 브라우저에도 적용되어  AI가 재무제표 자료를 요약해 줄 수도 있다고 한다.

(출처: Microsoft Bing)

그렇다면 네이버와 카카오는 어떤 고군분투를 하고 있을까?
- 네이버, 카카오는 고군분투 중

올해 네이버는 4년 만에 영업이익이 감소하며 채용을 미루기도 했지만 상반기 안에 서치 GPT를 선보일 예정이다.실적은 안 좋아도, AI 연구에는 투자하겠다는 말. (나 같은 문돌이는 앞으로 어떻게 사나)

(출처: 네이버)

네이버는 2021년부터 자체 개발한 초거대 AI '하이퍼클로바'를 검색엔진 결과에 활용해 왔다. 특히 한국어 검색 관련에서는 전 세계 1등인데 , 아무리 ChatGPT라도 사실 한국어 검색 결과는 조금 아쉽긴 하기 때문에 네이버 클로바가 한국 사용자에게 최적화되어 있다.
*실제로 하이퍼클로바의 한국어 데이터 학습량 = OpenAI의 GPT-3 모델의 한국어 데이터 학습량 X 6천500배

그렇다면 카카오는 어떨까. 솔직히 말하면, ChatGPT의 대항마로서 카카오는 덜 언급되는 편이다. 2021년에 카카오브레인이 공개한 한국어 특화 AI 언어 모델 'KoGPT'는 아직 검색엔진에 접목되지는 않았다.

그럼에도 언급되는 카카오의 초거대 AI는 이미지 생성에 초점을 두었다. 지난해 12월, AI 아티스트 ‘칼로 1.0’ 오픈소스로 공개했는데, 입력 제시어로 빠르게 고품질 이미지를 만들어준다. 카카오브레인은 ‘카카오디벨로퍼스’에서 카카오브레인의 한층 더 발전된 AI 이미지 모델 ‘Karlo(이하 칼로)’를 API로 공개하기도 했다.

(출처: 카카오브레인)

‘카카오디벨로퍼스’는 웹 서비스, 모바일 앱, 기타 응용 프로그램 개발에 필요한 플랫폼 및 카카오의 다양한 서비스와 연계할 수 있는 부가 기능을 제공하는 개발자 전용 웹사이트다.


초거대 AI에 빅테크만 거론되는 이유
이처럼 오픈 AI의 ChatGPT, 네이버의 클로바,카카오의 칼로가 마치 사람 사람처럼 대답을 할 수 있는 이유는 순발력이 아니라 엄청난 양의 언어 데이터베이스에서 찾을 수 있다. 즉, 대화형 검색엔진 역할을 하며 사용자가 원하는 답만 보여준다.

(출처: Freepik)

기존 AI 모델은 100억 여개의 매개 변수를 학습했다면, 초거대 AI는 몇 개의 데이터를 학습했을까?

- DALL-E : 마이크로소프트 사에서 제공받은 약 7억 개의 이미지를 학습
- GPT-3 : 1750억 개의 매개변수를 학습
- 칼로 : 1.8억 장 규모로 확장된 텍스트-이미지 데이터셋을 학습
- HyperClova : 뉴스 50년 치, 블로그 9년 치의 데이터를 학습

엄청난 양의 데이터셋과 매개변수로 인간의 언어를 이해하는 범용적 AI (Broad AI)를 개발하는 것이다. 초거대 AI라는 표현보다 LLM (large language model), NLP (natural language processing)라는 말을 사용하기도 한다.

그럼 이걸 누가 만들까? 아래 이유들로 인해 빅테크이거나 대기업의 IT계열사인 경우가 거의 대부분이다.

1) 엄청난 연구개발비
2) 엄청난 데이터를 확보한 기업만 만들 수 있다.

스타트업이 특정분야 AI (Narrow AI) 개발에 몰두하는 이유 : 피지컬 차이가 너무 크다.
물론 아직 ChatGPT가 한계를 가지고 있다는 지적도 있죠. 2021년까지의 데이터만 학습한 것이기에, 현재 기준으로는 정확하지 않은 답변을 할 수도 있습니다. 특히 한국어로 물어보면, 답변을 내놓기까지 꽤 오랜 시간이 걸리기도 하구요.

다만 ChatGPT가 공개된 지 별로 되지 않았는데도 GPT-4도 곧이어 공개되는 만큼, 우리의 생각보다 초거대 AI의 발전속도는 빠른 것 같습니다.저도 열심히 초거대 AI 동향을 지켜보며 곧 또 재밌는 소식으로 찾아뵐게요 :)






잇린이(IT+린이) 제나팡입니다. 문돌이의 IT 이슈 따라잡기, 함께 할까요?


* 슈퍼브 블로그의 외부 기고 콘텐츠는 외부 전문가가 작성한 글로 운영 가이드라인에 따라 작성됩니다. 슈퍼브 블로그에서는 독자분들이 AI에 대한 소식을 더 쉽고 간편하게 이해하실 수 있도록 유용한 팁과 정보를 제공하고 있습니다.