2025년, 인공지능 추론 시대의 개막과 반도체 시장의 변혁

과거에 대규모 데이터 센터에서 막대한 컴퓨팅 자원을 활용한 AI 모델 훈련이 중심이었다면, 이제는 훈련된 모델을 실제 기기에서 효율적으로 실행하는 '추론(Inference)' 경쟁이 본격화되고 있습니다. AI 추론 경쟁 시대에 엔비디아, AMD, 퀄컴 등 반도체 기업들이 어떻게 대응하고 있는지 살펴봅니다.

2025년, 인공지능 추론 시대의 개막과 반도체 시장의 변혁

인공지능(AI) 기술은 이제 우리 생활 곳곳에 스며들어 다양한 서비스와 제품의 혁신을 이끌고 있습니다. 과거에는 대규모 데이터 센터에서 막대한 컴퓨팅 자원을 활용한 AI 모델 훈련이 중심이었다면, 이제는 훈련된 모델을 실제 기기에서 효율적으로 실행하는 '추론(Inference)' 경쟁이 본격화되고 있습니다. 이러한 전환은 반도체 업계에 새로운 도전과 기회를 동시에 안겨주고 있으며, 특히 데이터 센터용 반도체 시장을 주도해왔던 기업들은 새로운 전략을 모색해야 하는 상황에 직면했습니다. 이번 글에서는 AI 추론 경쟁 시대에 반도체 기업들이 어떻게 대응하고 있는지 살펴보려고 합니다. 


1. AI 추론의 부상과 하드웨어 기술 환경의 변화

AI 기술의 발전은 이제 단순히 거대한 모델을 훈련시키는 단계를 넘어, 훈련된 모델을 다양한 환경에서 효율적으로 활용하는 단계로 접어들었습니다. 이러한 변화의 중심에는 '추론'이라는 개념이 자리 잡고 있습니다. 추론은 훈련된 AI 모델을 활용하여 새로운 데이터에 대한 예측이나 판단을 수행하는 과정으로, 실제 사용 환경에서 AI의 성능과 효용성을 결정짓는 핵심 요소입니다. 과거에는 대규모 데이터 센터에서 막대한 전력과 컴퓨팅 파워를 활용하여 거대한 언어 모델을 훈련시키는 것이 주류였다면, 이제는 스마트폰, 노트북, IoT 기기 등 개별 디바이스에서 AI를 구동할 수 있는 능력이 중요해지고 있습니다. 이는 엣지 컴퓨팅(데이터가 생성되는 장치나 근처에서 데이터를 처리하는 기술)의 중요성이 증가하고 있음을 의미하며, 2025년까지 기업에서 생성되는 데이터의 75%가 엣지에서 처리될 것으로 예상됩니다.

이러한 추론 중심의 시대 변화는 하드웨어 영역에 근본적인 기술 환경 변화를 요구합니다. 과거 데이터 센터 중심의 훈련 환경에서는 고성능 서버와 이를 위한 고가의 데이터 센터용 반도체가 주를 이루었습니다. 하지만 추론 시대에는 개별 디바이스에서 AI 연산을 효율적으로 처리할 수 있는 새로운 형태의 하드웨어가 필요합니다. 이는 결국 디바이스에 충분한 연산력을 제공할 소비자용 AI 반도체 시장의 급격한 성장을 의미하며, 기존 데이터 센터 칩 중심의 사업 모델을 고수해왔던 반도체 기업들에게는 새로운 도전 과제를 제시합니다. 실제로 2025년까지 AI 지원 PC와 모바일 기기의 판매량이 두 배로 증가할 것으로 예상되며, 이는 NPU(신경망 처리 장치, AI 연산에 특화된 프로세서) 탑재 프로세서의 수요 증가로 이어질 것입니다.

2. 반도체 기업들의 AI 추론 시장 대응 전략

주요 반도체 기업들은 각자의 강점을 활용한 새로운 전략을 선보이며 AI 추론 시장 선점에 나서고 있습니다.

엔비디아의 양손잡이 전략

엔비디아는 AI 추론 경쟁 시대의 반도체 시장 변화를 가장 극명하게 보여주는 사례입니다. 과거 소비자용 그래픽 카드 시장을 주력으로 했던 엔비디아는 AI 열풍 이후 데이터 센터 칩 시장에서 압도적인 성장을 기록했습니다. 특히 2023년에는 AI 데이터 센터 칩 시장의 98%를 차지하며 독보적인 위치를 확립했습니다. 하지만 추론 중심의 시장 변화와 함께 빅테크 기업들이 자체 AI 칩 개발에 나서면서 데이터 센터 칩 매출 성장의 지속 가능성에 대한 우려가 제기되고 있습니다. 이에 대응하여 엔비디아는 '양손잡이 전략'을 펼치고 있습니다. 이는 기존 데이터 센터 칩 시장에서의 지위를 유지하는 동시에 새로운 성장 동력으로서 소비자용 AI 칩 시장을 적극적으로 개척하는 전략입니다. 엔비디아는 이 전략의 일환으로 최신 Blackwell 아키텍처를 기반으로 한 GB200 NVL72 GPU 시스템을 개발했는데, 이는 이전 세대인 H100 시스템에 비해 AI 추론 속도가 30배 빠르고 에너지 효율성이 25배 높아진 혁신적인 제품입니다.

엔비디아의 양손잡이 전략은 소비자용 시장에서도 뚜렷하게 나타납니다. 회사는 최신 소비자용 그래픽 카드인 RTX 5000 시리즈를 공개하며 AI 연산 능력을 전면에 내세웠습니다. RTX 5000 시리즈는 Blackwell 아키텍처를 기반으로 하며, 100개의 3세대 RT 코어, 400개의 4세대 Tensor 코어, 12,800개의 CUDA 코어, 32GB의 그래픽 메모리를 갖추고 있어 렌더링, AI, 그래픽, 컴퓨팅 워크로드 성능이 뛰어납니다. 이러한 혁신적인 기술은 게임뿐만 아니라 AI 워크로드, 콘텐츠 제작, 과학적 시뮬레이션 등 다양한 분야에서 뛰어난 성능을 발휘할 것으로 예상됩니다. 엔비디아의 이러한 전략은 데이터 센터 칩 시장의 잠재적인 매출 감소를 상쇄하고 새로운 수익원을 확보하기 위한 전략적인 판단으로 볼 수 있으며, 빠르게 변화하는 AI 기술 시장에서 엔비디아가 지속적으로 선도적 위치를 유지할 수 있게 해줄 것입니다.

RTX 5000, 이미지 출처: NVIDIA 공식 웹사이트

AMD의 통합 AI 칩 전략

AMD는 CES 2025에서 Radeon RX 9000 시리즈 그래픽 카드와 함께 노트북용 모바일 AI 칩인 '스트릭스 헤일로(Strix Halo)' 시리즈를 공개하며 AI 추론 시장 경쟁에 본격적으로 뛰어들었습니다. 스트릭스 헤일로 시리즈는 CPU, GPU, 메모리를 하나의 칩에 통합한 시스템 온 칩(SoC) 형태로 설계되었습니다. 이는 소형 디바이스에서 강력한 AI 성능을 제공하는 것을 목표로 합니다. 특히 최상위 모델인 Ryzen AI Max+ PRO 395는 16개의 Zen 5 CPU 코어, 40개의 RDNA 3.5 GPU 코어, 그리고 50 TOPS(초당 50조 번의 연산)의 성능을 제공하는 NPU(신경망 처리 장치)를 탑재하고 있습니다. 이러한 통합 설계는 전력 효율성을 높이고 시스템 복잡성을 줄이는 동시에, 70억 파라미터 규모의 대규모 언어 모델(LLM)을 Nvidia GeForce RTX 4090 GPU보다 2.2배 빠르게 실행할 수 있다고 AMD는 주장합니다.

AMD의 이러한 접근은 AI 워크로드를 효율적으로 처리할 수 있는 통합 솔루션에 대한 시장의 수요를 정확히 반영한 것으로 분석됩니다. 특히 온디바이스 AI의 중요성이 커지는 상황에서, AMD의 전략은 시의적절해 보입니다. 온디바이스 AI는 클라우드 연결 없이 디바이스 자체에서 AI 연산을 처리하는 기술로, 데이터 전송 지연 감소, 개인정보 보호 강화, 네트워크 연결 불안정 문제 해결 등의 장점이 있습니다. AMD는 이 기술을 통해 스마트폰, 노트북, IoT 기기 등 다양한 디바이스에서 AI 기능을 구현하고자 합니다. 또한 AMD는 2025년까지 AI 칩 매출을 50억 달러로 늘리겠다는 목표를 제시했는데, 이는 AI 시장에서의 성장 잠재력을 보여주는 지표입니다. 다만, Nvidia와 같은 강력한 경쟁자들과의 경쟁에서 실질적인 시장 점유율을 확보할 수 있을지는 지켜봐야 할 것입니다.

Ryzen AI Max+ PRO 395, 이미지 출처: AMD 공식 웹사이트

퀄컴의 온디바이스 AI 전략

엔비디아와 AMD가 각각 양손잡이 전략과 통합 AI 칩 전략으로 AI 추론 시장에 대응하는 가운데, 퀄컴은 자사의 강점을 살려 '온디바이스 AI'를 핵심 전략으로 내세우고 있습니다. 퀄컴은 오랜 기간 스마트폰 AP(Application Processor) 시장을 주도해온 경험을 바탕으로, 클라우드 서버가 아닌 사용자의 기기에서 직접 AI 연산을 처리하는 온디바이스 AI 기술에 주력하고 있습니다. 이는 데이터 센터에 의존하지 않고 스마트폰이나 IoT 기기 자체에서 AI 작업을 수행함으로써 여러 이점을 제공합니다. 퀄컴은 이 기술의 중요성을 인식하고 2025년까지 QAIPI(Qualcomm AI Innovation Program)를 통해 아시아 태평양 지역의 개발자와 스타트업을 지원하며 온디바이스 AI 생태계를 확장하고 있습니다. 특히 퀄컴의 최신 Snapdragon 8 Gen 3 칩은 고성능 NPU(Neural Processing Unit)를 탑재하여 이전 세대 대비 AI 성능이 98% 향상되었으며, 초당 45조 번의 연산(45 TOPS)을 처리할 수 있어 효율적인 온디바이스 AI 처리를 가능케 합니다.

온디바이스 AI의 주요 장점으로는 데이터 전송 지연 감소, 강화된 개인정보 보호, 네트워크 연결 없이도 안정적인 AI 기능 제공 등이 있습니다. 이는 특히 5G 네트워크가 완전히 보편화되지 않은 지역이나 IoT 기기처럼 항상 네트워크에 연결되기 어려운 환경에서 중요합니다. 또한 온디바이스 AI는 클라우드 서버 사용료를 절감하고, 개인화된 AI 경험을 제공하는 데 유리합니다. 퀄컴은 이러한 장점을 살려 스냅드래곤 칩을 통해 온디바이스 AI 시장에서 강력한 입지를 구축하고 있으며, 향후 스마트홈, 자율주행차, 웨어러블 기기 등 다양한 분야로 확장을 꾀하고 있습니다. 2025년에는 멀티모달 AI, 소형 언어 모델(SLM), AI 보안 등이 온디바이스 AI의 주요 트렌드로 부상할 것으로 예상되며, 퀄컴은 이러한 변화에 선제적으로 대응하며 시장을 선도할 것으로 전망됩니다. 특히 퀄컴은 최근 발표한 AI Hub 플랫폼을 통해 개발자들이 쉽게 온디바이스 AI 애플리케이션을 개발할 수 있도록 지원하고 있어, 온디바이스 AI 생태계 확장에 박차를 가하고 있습니다.

Snapdragon 8 Gen 3, 이미지 출처: 퀄컴 공식 웹사이트

3. 멀티모달 AI와 소형 언어 모델의 부상

2025년에는 멀티모달 AI와 소형 언어 모델(SLM)이 온디바이스 AI 시장의 주요 트렌드로 부상할 것으로 예상됩니다. 멀티모달 AI는 텍스트, 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 동시에 처리할 수 있는 AI 모델을 의미합니다. 이는 더욱 직관적이고 다재다능한 AI 애플리케이션과 가상 비서의 개발을 가능하게 합니다. 예를 들어, 삼성전자는 CES 2025에서 'Samsung Vision AI'를 공개했는데, 이는 TV에 탑재되어 사용자의 음성 명령과 화면 내용을 동시에 이해하고 처리할 수 있는 기술입니다. 이를 통해 사용자는 TV 시청 중 궁금한 점을 바로 물어보고 답변을 받을 수 있으며, 실시간 자막 번역 등의 기능도 활용할 수 있습니다.

한편, 소형 언어 모델(SLM)은 대규모 언어 모델(LLM)의 성능을 유지하면서도 크기와 연산량을 대폭 줄인 모델입니다. 이는 스마트폰이나 IoT 기기와 같은 제한된 리소스를 가진 디바이스에서도 고성능 AI 기능을 제공할 수 있게 해줍니다. 예를 들어, LG전자는 2025년형 LG 그램 노트북에 'Gram AI' 기술을 탑재했는데, 이는 소형 언어 모델을 활용하여 인터넷 연결 없이도 문서 요약, 이메일 작성 보조, 일정 관리 등의 AI 기능을 제공합니다. 이러한 기술은 퀄컴과 같은 기업의 온디바이스 AI 전략과 시너지를 내며, 더욱 개인화되고 효율적인 AI 경험을 사용자에게 제공할 것으로 기대됩니다.

AI 추론 시대, 새로운 기회와 도전

2025년, AI 기술의 중심이 훈련에서 추론으로 이동함에 따라 반도체 업계는 새로운 경쟁 국면에 접어들었습니다. 엔비디아, AMD, 퀄컴 등 주요 기업들은 각자의 강점을 활용한 전략으로 시장 변화에 대응하고 있으며, 특히 온디바이스 AI는 향후 AI 생태계의 중요한 축으로 자리매김할 것으로 예상됩니다. IDC의 전망에 따르면, 2025년 글로벌 반도체 시장은 15% 성장할 것으로 예측되며, 특히 AI와 고성능 컴퓨팅 수요가 이를 주도할 것으로 보입니다.

그러나 이러한 성장 전망 속에서도 기업들은 여러 도전 과제에 직면해 있습니다. 지정학적 리스크, 글로벌 경제 정책의 변화, 최종 시장 수요의 변동성, 새로운 생산 능력 추가로 인한 공급과 수요의 변화 등이 2025년에 주목해야 할 중요한 요소들입니다. 특히 미중 무역 갈등의 여파로 반도체 공급망의 재편이 가속화되고 있어, 기업들은 이에 대한 전략적 대응이 필요할 것입니다.

결론적으로, AI 추론 시대의 도래는 반도체 업계에 새로운 기회와 도전을 동시에 제공하고 있습니다. 기업들은 기술 혁신을 통해 경쟁력을 강화하는 한편, 변화하는 시장 환경에 유연하게 대응할 수 있는 전략을 수립해야 할 것입니다. 이를 통해 AI 기술이 우리의 일상을 더욱 편리하고 풍요롭게 만드는 데 기여할 수 있을 것으로 기대됩니다.






미래를 향한 디지털 여정을 기록하는 작가입니다.


* 슈퍼브 블로그의 외부 기고 콘텐츠는 외부 전문가가 작성한 글로 운영 가이드라인에 따라 작성됩니다. 슈퍼브 블로그에서는 독자분들이 AI에 대한 소식을 더 쉽고 간편하게 이해하실 수 있도록 유용한 팁과 정보를 제공하고 있습니다.