생성형AI와 LLM의 숨은 주역들: GPU와 클라우드 컴퓨팅

생성형AI와 LLM의 숨은 주역들: GPU와 클라우드 컴퓨팅
(출처: SATOSHI SPAIN S.L.)

생성형 AI와 초거대언어모델(LLM)의 놀라운 성능 개선은 딥러닝 모델 훈련기법의 진보와 매개변수와 학습데이터 증가를 통한 기초모델(Foundation Model)의 개선 등 다양한 기술의 발전 덕분에 이루어졌다. 그러나 딥러닝 알고리즘이 하는 일은 이를 받쳐주는 두 개의 핵심 기술 없이는 한계점이 명확하다. 

Data-centric AI (출처 : DeepLearning.AI)

인공지능 분야의 선구자 중 한 명인 Andrew Ng이 강조했듯이 딥러닝 모델의 성능 개선을 위해서는 양질의 데이터를 많이 확보하는 것이 가장 중요하다. 또한 모델 자체의 연산속도 역시도 딥러닝 하이퍼파라미터(Hyperparameter) 개선만으로는 한계가 있다. 따라서 인공지능 알고리즘 개선만으로는 지금처럼 뛰어난 성능을 내기 어렵다.

그렇다면 인공지능 모델의 눈부신 발전의 숨은 주역들은 누구일까? 바로 모델 훈련을 위한 방대한 데이터를 저장하고 스트리밍 해주는 클라우드 컴퓨팅과 병렬 연산처리를 통해 천문학적인 숫자의 계산 작업을 동시에 처리해주는 GPU(Graphics Processing Unit) 기술이다. 이 두 가지 기술이 없었다면 현재와 같은 인공지능의 성능 개선은 결코 이루어질 수 없었을 것이다. 이번 시간에는 인공지능 발전 역사에 결정적인 역할을 했던 두 개의 숨은 주역들에 대해 소개하겠다.

1. 인공지능 모델의 연산을 책임지는 GPU

또한 심층신경망(Deep Neural Network)를 활용하는 생성형AI 모델의 방대한 양의 계산량을 더욱 빠르고 정확하게 처리하기 위해서는 성능좋은 GPU의 활용이 필수적이다. 인공지능 모델을 자동차에 비유하자면, GPU는 그 석유를 이용해 자동차가 잘 나아가도록 도와주는 피스톤 운동 왕복기관이라고도 할 수 있다.

GPU는 딥러닝 모델과 같은 복잡한 계산을 처리하기 위해 설계된 특수한 하드웨어다. 이들은 일반적으로 CPU(중앙 처리 장치)보다 병렬 처리에 더 특화되어 있어서, 대규모 데이터 세트를 처리하고 복잡한 수치 연산을 동시에 처리하는 데 매우 효율적이다. 이러한 특성 덕분에 GPU는 딥러닝 및 기타 머신 러닝 모델에서 학습 및 추론 작업에 활발하게 사용된다.

GPU와 CPU의 Architecture 비교 (출처 : Medium)

GPU가 딥러닝 모델을 작동시키는 원리는 다음과 같다.

병렬 처리: 딥러닝 모델은 일반적으로 매우 많은 수의 연산을 요구합니다. 이런 연산들은 여러 단계를 거쳐 복잡한 행렬 및 벡터 계산으로 이루어지는데, GPU는 이러한 계산을 병렬로 처리하여 효율적으로 수행할 수 있습니다. GPU는 많은 수의 작은 연산을 동시에 수행하는 데 뛰어난 성능을 보여줍니다.

CUDA 및 기타 프레임워크: NVIDIA사에서 개발한 CUDA(Compute Unified Device Architecture)는 GPU에서 병렬 컴퓨팅을 수행하기 위한 플랫폼 및 프로그래밍 모델이다. 이러한 프레임워크를 사용하면 개발자는 GPU의 병렬 처리 능력을 최대한 활용할 수 있다.

과거에는 게이밍 PC 제작 등 그래픽 처리를 위해 설계된 GPU를 딥러닝에 활용하기 시작했으며, 이러한 기술의 발전으로 GPU는 딥러닝 모델의 학습 및 추론 작업에 필수적인 역할을 하게 되었다. 이처럼 GPU의 병렬 처리 능력은 딥러닝 모델의 학습 및 실행 속도를 향상시키는 데 결정적인 역할을 합니다. 이는 대규모 데이터와 복잡한 모델을 다루는 데 있어서 중요한 요소 중 하나입니다.

2. 데이터의 파이프라인 구축을 책임지는 클라우드 컴퓨팅

데이터는 21세기의 석유로, 최첨단 기술인 인공지능을 움직이는 원동력이라고 알려져 있다. 그러나 단순히 방대한 양의 데이터를 보유하고 있는 것만으로는 인공지능 모델이 원활하게 작동한다고 보장할 수 없다. 최적의 성능을 유지하기 위해서는 실시간으로 생성되고 변화하는 최신 데이터를 통합하고 학습하는 과정이 필요하기 때문이다.

인공지능 모델이 실시간으로 데이터를 학습하고 활용하기 위해서는 방대한 양의 데이터를 저장하고 필요한 자원을 효과적으로 할당할 수 있는 클라우드 컴퓨팅 기술이 필수적이다. 따라서 데이터가 21세기의 석유와 같다면 클라우드는 그 석유를 저장하고 유동적으로 활용하는 최첨단 파이프라인과도 비교될 수 있다. 

출처 : fibonalabs

이처럼 클라우드 컴퓨팅 기술과 인공지능은 매우 긴밀하게 연관되어 있다. 인공지능 기술이 발전함에 따라 이러한 연관성은 더욱 강화될 것으로 예상됩니다. 인공지능 모델이 점차 거대하고 정교해짐에 따라 실시간으로 더 많은 양의 데이터를 공급하는 것이 중요해지는 추세이다.

특히 수십억 개의 매개변수를 기반으로 천문학적인 양의 비정형 데이터를 학습하는 생성형 AI의 경우, 클라우드 컴퓨팅 기술의 중요성은 더욱 커진다. 이러한 현실을 반영하여 벤처 투자 회사인 안드레센 호로위츠는 생성형 AI 애플리케이션을 활용하는 인공지능 스타트업이 올리는 수익의 10~20%가 클라우드 서비스 제공 업체로 돌아간다고 추정하고 있다. (출처: AI타임스)







문과 출신으로 AI 스타트업에서 데이터 사이언티스트로 일하고 있습니다. 


* 슈퍼브 블로그의 외부 기고 콘텐츠는 외부 전문가가 작성한 글로 운영 가이드라인에 따라 작성됩니다. 슈퍼브 블로그에서는 독자분들이 AI에 대한 소식을 더 쉽고 간편하게 이해하실 수 있도록 유용한 팁과 정보를 제공하고 있습니다.