[비전 AI②] ‘문서 데이터’ 깨우는 AI 등장 ··· 정밀도 경쟁 본격화
![[비전 AI②] ‘문서 데이터’ 깨우는 AI 등장 ··· 정밀도 경쟁 본격화](/content/images/size/w2000/2025/10/-------------------------------------------------------------------------------------------------------------------------------------2.png)
OCR·LLM 결합해 비정형 데이터 ‘지식 자산화’ 박차
국내 전문기업 기술 경쟁 본격화 ··· 금융·공공 시장 정조준
[데이터넷] 단순히 텍스트를 이해하는 것을 넘어, 이미지와 영상을 분석하고 현실 세계의 복잡한 맥락을 파악하는 비전 AI는 산업 현장의 풍경을 근본적으로 바꾸고 있다. 비즈니스 AI의 현재와 미래, 국내외 주요 기업들의 기술 경쟁 현장을 조망한다. <편집자>
이처럼 제조, 의료, 금융 등 각 산업 분야에서 비전 AI가 활용되고 있으며, 고유한 데이터 특성과 도전 과제를 안고 있다. 특히 반도체 공정 설계나 의료 영상 분석과 같이 고도의 전문 지식과 정밀한 데이터 처리가 필요한 분야에선 GPT와 같은 범용 AI 모델을 그대로 적용하기 어렵다.
이러한 한계를 극복하기 위해 특정 산업에 최적화된 비전 AI 솔루션을 공급하는 기업들이 최근 주목받고 있다.
(중략)
멀티모달리티 기반 비전 AI
슈퍼브에이아이는 ‘데이터 중심 AI’를 표방하며, ML옵스(MLOps) 플랫폼 ‘슈퍼브 플랫폼’을 통해 AI 개발의 전 과정을 효율화한다. 이 플랫폼은 데이터 라벨링 자동화, 데이터 큐레이션 및 분석, 모델 학습 및 관리 등 AI 개발 전 과정의 효율을 극대화한다.
특히 슈퍼브 플랫폼은 ‘제로샷 추론 방식’을 통해 미리 학습되지 않은 새로운 환경이나 사물도 즉시 인식할 수 있어, AI 도입 시 복잡한 데이터 수집이나 모델 재학습 부담을 완화시켰다.
차문수 슈퍼브에이아이 CTO는 “데이터 라벨링은 AI 개발 과정에서 가장 많은 시간과 비용이 소요되는 작업”이라며 “슈퍼브 플랫폼은 AI 기반 자동 라벨링, 자동 검수 기능으로 이 과정을 획기적으로 단축시키고, 부족한 데이터는 합성해 모델 성능을 향상시키는 기능까지 제공한다. 이는 희소 데이터 확보 문제를 해결하고 개발 비용을 대폭 낮추는 열쇠”라고 설명했다.
슈퍼브에이아이는 이러한 데이터 역량을 바탕으로 비전 AI 솔루션을 공급하고 있다. 카메라, CCTV 영상뿐만 아니라 라이다, 레이더, 적외선(IR) 카메라 등 다양한 시각 정보를 처리하고 분석하는 데 특화된 멀티모달리티 기술을 선도하고 있다.
과거 수백 개에 달했던 비전 AI 태스크가 통합·간소화되면서, 다양한 이종 데이터를 하나의 플랫폼에서 처리하는 멀티모달리티가 핵심으로 부상하고 있다.
차 CTO는 “최근 산업 특화 비전 파운데이션 모델인 ‘제로(ZERO)’를 공개했다. 제로는 대규모 이미지 데이터로 사전 학습된 범용 AI 모델로, 추가 학습 없이도 다양한 시각적 작업에 적용 가능하다”며 “사전 준비 없이 바로 사용할 수 있는 제로 학습, 복잡한 설정이 필요 없는 제로 복잡성 등 누구나 쉽게 AI를 활용할 수 있다”고 강조했다.

또한 슈퍼브에이아이는 이러한 변화에 맞춰 2D 비전 기술을 넘어 3D, 로보틱스, 그리고 더 나아가 물리적 세계와 상호작용하는 피지컬 AI 분야로 기술을 확장하고 있다.
차 CTO는 “현재 물류 현장의 무인운반차(AGV)와 같은 2D 기반 시스템이 향후 3D 비전 기술과 결합해 더욱 정교하고 효율적으로 발전할 것이다”며 “이미지, 텍스트, 비디오, 3D 데이터를 아우르는 기술을 통해 자율주행, 스마트팩토리 등 산업 현장의 진정한 디지털 전환을 이끌겠다”고 밝혔다.
슈퍼브에이아이는 KT 위즈파크 AI 혼잡도 분석, 소방연구기관 AI 화재 감지 시스템 개발 등 다양한 산업 분야에서 성공 사례를 확보하는 등 기술력을 입증하고 있다.
차 CTO는 “과거 작업자가 쌓은 노하우는 데이터로 저장할 방법이 없어 사라지는 경우가 많았지만, 이제 비전 AI를 통해 모든 과정을 디지털화하고 보존할 수 있게 됐다”며 “이는 단순한 생산성 향상과 비용 절감을 넘어, 기업의 핵심 자산을 축적하고 의사결정의 질을 높이는 중요한 역할을 할 것”이라고 강조했다.
(중략)
피지컬 AI 시대 개막
비전 AI 기술은 이제 스크린 속 분석을 넘어 현실 세계와 직접 상호작용하는 단계로 나아가고 있다. 많은 전문가는 비전 AI의 궁극적인 발전 방향으로 ‘피지컬(Physical) AI’를 주목한다.
피지컬 AI는 로봇, 드론, 자율주행차 등이 시각 정보를 기반으로 물리적 환경을 이해하고, 자율적으로 판단하며 실제 행동을 수행하는 기술을 의미한다. 이는 멀티모달리티 기술을 통해 시각, 청각, 촉각 등 다양한 센서 데이터를 통합하고, 엣지 디바이스에서 실시간으로 구동되는 고도의 기술력을 필요로 한다.
물류 현장의 무인운반차와 같은 2D 기반 시스템은 향후 3D 비전 기술과 결합해 더욱 정교하고 효율적으로 발전할 것이다. 이처럼 이미지, 텍스트, 비디오, 3D 데이터를 아우르는 기술은 산업 현장의 진정한 디지털 전환을 이끌 것으로 기대된다.
비전 AI는 단순한 효율화 도구를 넘어, 기업의 운영 방식을 근본적으로 바꾸고 지속 가능한 경쟁력을 확보하는 핵심 동력으로 자리매김하고 있다. 피지컬 AI 시대를 앞두고 '지능형 눈'을 확보하기 위한 기업들의 경쟁은 더욱 치열해질 전망이다.