[비전 AI ②] 비전 AI 발전 새로운 주역, 합성 데이터
슈퍼브에이아이는 기업의 AI 도입 부담을 제거하기 위해 비전 파운데이션 모델(VFM) '제로'를 출시했습니다. 제로는 추가 학습 없이 바로 적용 가능한 '제로샷' 능력을 보유하며, 텍스트와 이미지 프롬프트로 객체 인식과 이상 탐지를 수행합니다. 기존 모델 대비 10분의 1 GPU로 효율적 개발을 실현했고, 산업 특화 데이터로 학습해 현장 적용성을 높였습니다. 합성 데이터 활용과 멀티 모델 전략을 통해 복잡한 AI 구축 과정을 생략하고 즉시 비즈니스 혁신을 가능하게 했습니다.
![[비전 AI ②] 비전 AI 발전 새로운 주역, 합성 데이터](/content/images/size/w2000/2025/07/250630_-----------------AI----------------------AI------------------------------------------------------------------------------------------------_0.png)
멀티 모델, 멀티 모달 전략도 중요…대규모 AI 모델 ‘관란’ 등장
최근 인공지능(AI) 에이전트의 부상과 함께 다양한 분야에 AI가 적용되기 시작했다. AI가 작업을 수행하기 위해서는 데이터가 필요하며 실시간 정보 수집이 중요하다. 실시간 정보에는 시각, 청각, 촉각 등 사람이 갖고 있는 감각 정보가 포함되며, AI는 이러한 정보가 필요하다. 이중 시각을 담당하는 ‘비전 AI’는 자율주행, 관제, 산업공정 분야에서 핵심 기술로 활용되고 있으며 ‘비전 트랜스포머(Vision Transformer)’, ‘비전 언어모델(VLM)’ 등의 기술과 결합해 고도화되고 있다.
그동안 비전 AI 기술에 집중해 왔던 국내외 기업들도 이러한 기술 흐름에 대응하면서 변화하고 있다. 국내 시장은 특히 산업 특화 솔루션을 중심으로 발전 중이다. 비전 AI 시장의 현재 상황부터 산업 적용 현황, 미래 방향 등을 조명해 본다.

‘합성 데이터’로 학습 데이터 부족 문제 해결
다른 AI 모델들과 마찬가지로 비전 AI도 데이터가 중요하다. 모델의 성능은 학습에 활용할 수 있는 양질의 데이터를 확보하느냐에 달려 있다. 그러나 데이터를 수집하고 가공하는 과정은 많은 시간과 비용을 필요로 하며, 특정 상황이나 희귀 데이터 확보는 더욱 어려운 과제다. 이러한 한계를 극복하기 위해 ‘합성 데이터’가 비전 AI 고도화의 새로운 주역으로 떠오르고 있다.
비전 AI 모델의 성능은 학습 데이터의 다양성과 품질, 그리고 정교한 AI 모델 설계에 크게 의존한다. 하지만 실제 데이터를 수집하는 데는 여러 가지 어려움이 있다. 특히 산불과 같이 재현하기 어려운 재난 상황의 데이터나 특정 환경의 미세 결함 데이터는 수집이 힘들다.
이러한 문제점을 해결하기 위해 등장한 것이 바로 합성 데이터다. 합성 데이터는 실제 환경에서 수집된 것이 아니라, 가상 환경에서 생성되거나 기존 데이터를 기반으로 인공적으로 만들어진 데이터를 의미한다.
슈퍼브에이아이 차문수 CTO는 “합성 데이터는 데이터가 전무한 상황에서 만들 수 있는 것이 아니라 일부라도 데이터가 존재할 때 만들 수 있다”며 “만약 AI가 특정 분야에서 문제를 해결하지 못해 데이터를 추가해야 할 경우 합성 데이터가 해결책이 된다. 합성 데이터를 실제 데이터와 혼합해서 사용하면 모델의 성능을 향상할 수 있다”고 말했다.
이어 그는 “도둑을 탐지하는 모델을 만들 경우 도둑과 관련된 영상 데이터가 있어야 하는 데 이러한 데이터를 수집하기는 어렵다. 그렇다고 그 상황을 재현해 촬영하는 등의 방식을 활용하는 것은 비용 부담이 크다”며 “합성 데이터를 활용하면 효율적으로 이러한 문제를 해결할 수 있다. 충분한 데이터가 없을 때 합성데이터가 해결책이 될 수 있다”고 덧붙였다.
합성 데이터는 비전 AI 기술을 고도화하는 데 필요하다. 그러나 이러한 합성 데이터 활용에는 신중한 접근이 필요하다. 먼저 무분별한 합성 데이터 활용은 오히려 모델 성능을 저하시킬 우려가 있다. 씨이랩 송유진 CTO는 “합성 데이터와 실제 데이터의 비율을 맞추는 것이 중요하다. 과도한 합성 데이터 활용은 오히려 성능 저하를 가져온다. 하지만 이와 관련해 정해진 답이 있는 것이 아니다. 매 프로젝트와 분야에 따라 적절한 포인트를 찾는 것이 중요하다”고 설명했다.
또한 합성 데이터는 실제 데이터에 담긴 편향성과 오류를 확대할 수 있다는 우려도 있다. 실제 데이터를 기반으로 합성 데이터를 생성하기 때문에 기존 문제점이 수정되는 것이 아니라 오히려 강화된다는 지적이다. 슈퍼브에이아이 차문수 CTO는 “이 문제를 해결하기 위한 해결책은 ‘큐레이션’이라고 본다. 무작정 합성 데이터를 많이 만들어 적용하는 것이 아니라 데이터가 부족한 부분을 파악하고 이에 집중해 합성 데이터를 적용해야 한다”고 강조했다.
이러한 흐름은 자율주행 솔루션에도 이어지고 있다. 스트라드비젼은 고객사들과 과제를 진행할 때 다양한 카메라를 통해 데이터를 얻기도 하지만, 합성 데이터 업체들과 협력하거나 직접 만드는 방식으로 데이터를 확보하고 있다. 특히 트래픽 사인과 같이 수월하게 만들 수 있는 데이터와 없는 지형이나 다양한 객체를 만들 때는 합성 데이터의 퀄리티가 중요하며 높은 기술력이 필요하다.
멀티 모델과 멀티 모달로 진화
초기 비전 AI는 특정 작업을 해결하기 위해 개별적인 모델을 따로 개발하고 운영하는 방식이 일반적이었다. 하지만 최근 국내에서 다양한 영역의 태스크를 하나의 솔루션에 통합하고, 여러 모델을 유기적으로 결합해 더 높은 수준의 지능을 구현하는 ‘멀티 모델’ 전략이 중요해지고 있다.
시각 정보를 인식하는 카메라의 종류는 다양하다. RGB 카메라, 열화상 카메라, 자외선 카메라 등이 있으며 이들은 각자 습득하는 정보의 형태가 다르다. 예를 들어 RGB 카메라는 가시광선 영역의 빨간색, 초록색, 파란색 빛을 감지해 색상을 표현하지만, 열화상 카메라는 물체에서 방출되는 적외선(열)을 감지해 온도 분포를 시각화한다.
비전 AI는 각 산업, 목적별로 수집할 데이터를 선정하고 그에 맞는 카메라를 활용한다. 이에 수집한 데이터를 활용해 목적을 수행할 수 있는 모델을 만드는 것이 중요하다. 즉 ‘멀티 모델’을 개발하기 위해서는 수많은 형태의 데이터를 모두 처리할 수 있어야 하며 목적에 따라 다른 모델이 적용될 필요가 있다.
슈퍼브에이아이 차문수 CTO는 “슈퍼브에이아이는 자사 비전 AI 기술력을 통합해 하나의 모델이 다양한 영역의 태스크를 아우를 수 있도록 하는 멀티 모델을 개발하고자 한다. 이를 위해 비전 파운데이션 모델(VFM)을 공개할 계획이다”며 “기존 버티컬 솔루션의 한계를 극복하는 것이 목표”라고 밝혔다.
멀티 모델이 실현되기 위해서는 다양한 종류의 센서 정보를 해석하는 ‘멀티 모달’ 기술이 필수적이다. 멀티 모달은 AI가 여러 종류의 데이터 형태를 동시에 처리하고 이해하는 것을 의미한다. 스트라드비젼 권태산 COO는 “자율주행에 어떤 센서를 활용할 것인가가 중요하다. 특히 카메라를 이용한 인식 기능을 극대화하면서도 레이더와 라이다까지 고려할 필요가 있다”며 “멀티 모달 기술을 활용하면 네트워크의 입력단에서부터 단일 센서가 아닌 복수 센서를 활용해 다양한 정보를 처리하고 더 높은 수준의 정확도와 안정성을 제공할 수 있다”고 설명했다.
한편 2001년 사업을 시작해 AIoT 기반 영상 보안 및 산업 지능화 솔루션을 공급해 온 하이크비전은 멀티 모델·모달 분야에서 선도적인 기업이다. 오랜 기간 쌓아온 데이터와 노하우, 솔루션을 바탕으로 대규모 AI 모델 ‘관란(Guanlan)’을 개발했으며 이를 기반으로 비전 AI 시장에서 입지를 강화하고 있다. 하이크비전 론(Ron) 총괄은 “대규모 모델을 개발한 후 경량 모델도 더욱 고도화됐다. 대규모 모델을 기반으로 세분화된 경량 모델을 만들 경우, 이전보다 더 적은 데이터로도 높은 정확도를 보인다”며 “필요한 부분을 잘 선별하고 나머지를 덜어내는 작업이 중요하다. 하이크비전은 이러한 경량화 작업에 큰 노력을 기울였으며 내부적으로 성과를 거뒀다”고 말했다.
슈퍼브에이아이 “VFM ‘제로’로 AI 도입 부담 없앤다”
- AI 구축 과정 생략, 추가 학습 없이 비즈니스 적용…‘제로샷’ 능력이 강점
“기업들은 AI를 도입하는 과정에서 AI 전문 인력 부족, 양질의 데이터 부족, 기술 인프라 부족 등의 어려움을 겪고 있다. 슈퍼브에이아이는 이러한 문제를 해결하기 위해 머신러닝 운영(MLOps), 버티컬 솔루션을 공급해 왔다. 이번 비전 파운데이션 모델(VFM) ‘제로’ 출시는 이러한 노력의 일환으로, 기업이 AI를 도입하는데 드는 부담을 제로로 만들고자 한다.”
슈퍼브에이아이 김현수 대표는 최근 열린 기자간담회에서 신규 VFM 모델 제로를 소개하며 이같이 말했다.

슈퍼브에이아이는 기업의 AI 도입을 지원하기 위해 제로를 개발했다. 기존에는 AI를 구축하기 위해서 매번 데이터를 수집하고 라벨링해 모델을 학습하는 과정을 거쳐야 했지만, 제로를 통해 앞선 과정을 생략할 수 있게 됐다. 추가적인 데이터 학습 없이 비즈니스에 바로 적용될 수 있다는 설명이다.
김현수 대표는 “제로 모델의 가장 큰 장점은 ‘제로샷(Zero-shot)’ 능력에 있다. 제로샷을 통해 산업 현장에서 바로 객체 인식, 이상 탐지 등을 수행할 수 있다”며 “텍스트뿐만 아니라 이미지 형태로도 프롬프트를 입력해 AI에 업무를 부여할 수 있다. 예를 들어 산업 현장에서 부품의 이미지를 제로에 입력하면 목표를 인식할 수 있다. 단순 인식을 넘어 수량 체크까지 지원한다”고 말했다.
이어 “제로는 여러 유형의 업무에 적용될 수 있는 ‘멀티 모델’이다. 비전 AI로 다양한 산업 현장을 지원하기 위해서는 각 부분에 버티컬 솔루션을 공급할 필요가 있었다. 이번 출시된 제로는 이러한 버티컬 모델들을 통합한 것으로, 이를 통해 누구나 즉시 AI를 도입해 혁신 사례를 만들 수 있다”고 부연했다.
슈퍼브에이아이는 효율적으로 리소스를 활용해 제로를 개발했다. 기존 공개 모델 대비 10분의 1의 GPU만을 활용했으며, 다량의 학습 데이터를 모두 학습시키는 방식이 아니라 중요 데이터를 선별해 모델을 학습했다. 적은 리소스로도 효율적인 파운데이션 모델을 만들 수 있음을 증명한 것이다.
슈퍼브에이아이 차문수 CTO는 “대부분의 VFM 모델이 일반적인 데이터를 통해 학습되는 것과 달리, 제로는 웹 데이터, 퍼블릭 데이터, 산업형 데이터 등을 따로 구축해 학습했다. 이를 통해 산업 분야에 강점을 가진 모델을 개발했다”라며 “고객이 실제 현장에서 더욱 정확한 솔루션이 적용되길 원한다면 제로를 기반으로 버티컬 모델을 개발해 공급할 수도 있다. 하지만 복잡한 환경이 아닌 경우는 제로로 충분히 지원할 수 있어 비용을 최소화할 수 있다”고 강조했다.