인공지능, LLM과 GPT는 어떻게 다를까?

인공지능, LLM과 GPT는 어떻게 다를까?

오늘은 인공지능(AI), 거대언어모델(LLM), 그리고 GPT의 개념과 차이점을 자세히 알아보려 합니다. 인공지능은 이미 우리의 일상 속에 깊이 자리 잡고 있으며, 다양한 분야에서 혁신을 일으키고 있습니다. 특히 최근 주목받고 있는 LLM과 GPT에 대해 이해하는 것은 AI 기술의 발전을 이해하는 데 중요한 첫걸음이 될 것입니다. 이 글에서 AI의 기본 개념부터 시작해서 LLM과 GPT의 역할과 기능까지 차근차근 살펴보겠습니다.

인공 지능 이란?

인공지능(Artificial Intelligence, AI)은 컴퓨터 시스템이 인간의 지능을 모방하여 학습, 추론, 문제 해결 등의 작업을 수행하는 기술입니다. 이는 인간의 학습 능력, 추론 능력, 지각 능력을 인공적으로 구현하려는 컴퓨터 과학의 세부 분야 중 하나이며, 정보공학 분야에 있어 하나의 인프라 기술이기도 합니다. AI는 머신러닝 기술을 통해 학습하며, 머신러닝은 컴퓨터가 데이터를 분석하고, 분석을 통해 학습하고, 학습한 내용을 기반으로 판단하고 예측할 수 있도록 알고리즘과 기술을 개발하는 분야입니다.

AI는 다양한 분야에 활용되며, 대표적으로 다음과 같은 유형들이 있습니다.

1. 대화형 인공지능 (Conversational AI)

대화형 인공지능은 사람과 자연어로 대화를 나눌 수 있는 인공지능 기술입니다. 질문을 하면 사람의 말을 이해하고, 적절한 상호작용을 제공합니다. 대화형 인공지능에는 자연어 처리(NLP: Natural Language Processing), 기계 학습(ML: Machine Learning), 인공신경망(ANN: Artificial Neural Network) 기술뿐만 아니라 감정 분석, 맥락 이해, 음성 인식 및 합성 등 다양한 기술이 포함됩니다. 

대화형 인공지능은 음성 인식 비서, 고객 서비스 챗봇, 게임 등에서 질문에 답하고, 정보를 제공하고, 상품을 추천하고, 특정 작업을 실행하는 등의 형태로 서비스됩니다. 특히 GPT-3와 같은 트랜스포머 모델 기반의 아키텍처가 등장하여 훨씬 더 많은 텍스트 데이터를 학습하고, 맥락을 이해할 수 있게 되면서 사용자와 보다 자연스러운 상호작용이 가능해졌습니다.

2. 초거대 인공지능 (Hyper-scale AI)

초거대 인공지능은 천문학적인 개수의 파라미터를 가지는 인공신경망 모델을 기반으로 복잡한 문제를 해결하는 인공지능 모델입니다. 초거대 인공지능은 천문학적인 개수의 파라미터를 가지는 인공신경망 모델을 학습시켜 구현합니다. 초거대 규모의 인공신경망 모델을 학습시키기 위해서는 방대한 양의 학습 데이터와 컴퓨팅 자원이 필요합니다. 이는 이들 자원이 많을수록 인공지능의 성능이 증가한다는 연구 결과를 기반으로 합니다. 

초거대 인공지능은 2020년대 초반에 GPT, BERT와 같은 트랜스포머 모델 기반의 대규모 언어 모델이 발전하며 주목받기 시작했습니다. 대표적인 초거대 인공지능으로 Open AI사의 언어 모델인 GPT 기반의 대화형 인공지능 서비스 ‘챗 GPT’가 있습니다. 챗 GPT는 사용자와의 대화에서 문맥을 이해하여 자연스러운 응답을 생성하는 특징이 있습니다. 한편 GPT는 기반 모델로 챗 GPT뿐 아니라 빙(Bing) 검색 엔진, 코드 개발 지원 도구인 코파일럿(Copilot) 등으로 미세 조정되어 다양하게 사용됩니다.

3. 생성형 인공지능 (Generative AI)

생성형 인공지능은 텍스트, 오디오, 이미지 등의 기존 콘텐츠를 활용하여 유사한 콘텐츠를 새로 만들어내는 인공지능(AI) 기술입니다. 생성형 인공지능은 단순히 콘텐츠의 패턴을 학습하여 추론 결과로 새로운 콘텐츠를 만들어내는 것을 넘어, 콘텐츠의 생성자와 만들어진 콘텐츠를 평가하는 판별자가 끊임없이 서로 대립하고 경쟁하며 새로운 콘텐츠를 생성해내는 기술입니다. 

특히, 이미지 분야에서는 특정 작가의 화풍을 모사한 그림으로 사진을 재생성하거나 가짜 인간 얼굴을 무제한으로 생성하여 쇼핑, 영화 등의 산업에서 활용합니다. 음성 분야에서는 특정 장르의 음악을 작곡하거나 특정 노래를 원하는 가수의 음색으로 재생성하는 등으로 활용합니다. 상업적 혹은 사회적인 쟁점으로 가장 대중적으로 알려진 생성형 인공지능으로는 ‘인물 합성 기술(deepfake)’이 있습니다. 

한편 생성형 인공지능은 정치인의 선동 영상 혹은 가짜 뉴스, 특정 인물로 조작된 음란물, 보이스 피싱 등에도 악용될 수 있습니다. 이로 인한 사회문제는 인공지능 활용의 윤리적 문제에 관한 경각심과 사회적 합의에 관한 쟁점을 일으켰습니다.

4. 범용 인공지능 (Artificial General Intelligence, AGI)

범용 인공지능은 특정 문제뿐 아니라 주어진 모든 상황에서 생각과 학습을 하고 창작할 수 있는 능력이 있는 인공 지능입니다. 현재 인공 지능 연구는 음성 인식, 바둑 등 특정한 문제에 대해서는 좋은 성과를 보이고 있으나, 아직 사람과 같은 지능을 갖추지는 못하고 있습니다. 

예를 들어, 사람과 대화하며 동시에 바둑도 둘 수 있는 인공 지능 에이전트는 아직 개발되지 않았습니다. 범용 인공지능은 컴퓨터로 사람과 같은 또는 그 이상의 지능을 구현하는 것을 의미하며, 알파고 처럼 특정 문제만을 해결하는 인공 지능을 좁은 인공 지능(ANI: Artificial Narrow Intelligence)이라 합니다.

거대 언어 모델이란? 

거대언어모델(Large Language Model, LLM)은 대규모 텍스트 데이터를 학습하여 자연어를 이해하고 생성할 수 있는 모델을 의미합니다. LLM은 주로 딥러닝 기술을 사용하여 구축되며, 수십억 개의 파라미터를 포함할 수 있습니다. 이 모델들은 문장 완성, 번역, 요약 등 다양한 자연어 처리 작업에 활용됩니다. 대표적인 LLM으로는 OpenAI의 GPT 시리즈가 있습니다.

최근에는 Small Large Language Model (sLLM)이라는 개념도 주목받고 있습니다. sLLM은 거대언어모델보다 작은 규모의 언어 모델로, 매개변수의 수가 수십억에서 수백억 개로 상대적으로 작습니다. sLLM은 균형 잡힌 성능과 자원 사용 사이의 타협점을 제공하며, 온디바이스 AI의 수요 증가로 더욱 주목받고 있습니다.

GPT 란?

GPT(Generative Pretrained Transformer)는 Open AI사에서 트랜스포머(transformer) 모델 기반으로 개발한 자연어 생성 모델입니다. GPT는 대량의 텍스트 데이터를 사전에 학습하고 트랜스포머 모델로 새로운 텍스트를 생성해내는 인공지능 언어 모델입니다. 마치 자연어를 이해하고 처리하는 듯한 능력을 가지고 있어서 텍스트를 만들어내고, 번역, 요약, 질문하고 답변하는 분야에서 주로 사용됩니다. 

GPT는 인터넷에서 크롤링하여 텍스트 데이터를 수집하며, 수집한 텍스트 데이터를 자기지도 학습(self-supervised learning) 방식으로 학습합니다. 자기지도 학습 방식에서는 명시적으로 라벨(label)이 제공되지 않은 텍스트 데이터의 일부를 마스킹(masking)하고, 마스킹된 부분을 예측하도록 대규모의 학습 데이터를 스스로 학습합니다.

요약

인공지능(AI)은 인간의 지능을 모방하여 학습, 추론, 문제 해결 등의 작업을 수행하는 기술입니다. 이 기술의 세부 분야 중 하나인 거대언어모델(LLM)은 대규모 텍스트 데이터를 학습하여 자연어를 이해하고 생성할 수 있는 모델입니다. LLM은 문장 완성, 번역, 요약 등 다양한 자연어 처리 작업에 활용됩니다. GPT(Generative Pretrained Transformer)는 OpenAI에서 개발한 대표적인 LLM으로, 트랜스포머 모델을 기반으로 하여 대량의 텍스트 데이터를 학습하고 자연스러운 텍스트 생성을 가능하게 합니다.

간단히 말해, 인공지능(AI)은 광범위한 기술 분야를 포함하며, 거대언어모델(LLM)은 그 중 자연어 처리에 특화된 분야입니다. GPT는 LLM의 구체적인 구현 예로, 트랜스포머 구조를 활용하여 텍스트를 생성하고 다양한 자연어 처리 작업을 수행합니다. 이들 기술은 서로 포함 관계에 있으며, AI 기술의 발전과 혁신에 중요한 역할을 하고 있습니다.

이 글이 인공지능에 입문하는 분들에게 많은 도움이 되었기를 바랍니다. 







미래를 향한 디지털 여정을 기록하는 작가입니다.


* 슈퍼브 블로그의 외부 기고 콘텐츠는 외부 전문가가 작성한 글로 운영 가이드라인에 따라 작성됩니다. 슈퍼브 블로그에서는 독자분들이 AI에 대한 소식을 더 쉽고 간편하게 이해하실 수 있도록 유용한 팁과 정보를 제공하고 있습니다.