데이터 생성 기능을 통해 부족한 데이터를 확보하여, 모델 성능을 한 층 더 높여보세요! [생성형 AI 기능 안내]

데이터 생성 기능을 통해 부족한 데이터를 확보하여, 모델 성능을 한 층 더 높여보세요! [생성형 AI 기능 안내]

AI가 실제 산업 환경에서 성공적으로 도입되기 위해서는, 높은 성능을 유지할 수 있는 좋은 품질의 데이터를 꾸준히 확보해야 합니다. 하지만, 성능 향상을 위한 고품질 데이터를 실제 산업 현장에서 확보하는 것은 말처럼 쉽지 않습니다. 부족하거나 희귀한 데이터를 확보하기 위해서는 실제 현장에서 해당 케이스가 발생해야 하는데, 이미 높은 검수 기준과 까다로운 절차를 지닌 산업 분야(의료, 제조, 건설, 유통 등)에서는 해당 케이스가 잘 발생하지 않기 때문입니다.

이 어려움을 해결하기 위한 슈퍼브 플랫폼의 데이터 생성 기능을 소개합니다!

이제부터 슈퍼브 플랫폼에서 데이터 생성 기능을 활용해 취득이 어려웠던  데이터를 확보하고 AI 모델의 성능을 높일 수 있습니다. 

슈퍼브 플랫폼의 “학습 데이터 생성 기능”을 활용하면

  1. 충분한 양의 학습 데이터를 확보하여 모델의 성능을 향상시키고,
  2. 데이터 수집 및 가공에 드는 시간과 비용을 줄이고,
  3. 희귀하고 취득이 어려운 데이터를 충분히 수집할 수 있습니다.

제조 라인에서 양품과 불량품을 검수하는 AI 모델을 구축하거나, 작업 환경에서 위험한 상황들을 감지해 미리 알려주는 AI 모델을 구축할 경우를 예를 들어보겠습니다.  AI 모델이 설계 의도 대로  잘 작동하기 위해서는 모델이 양품과 불량품의 차이를 판단할 수 있고, 위험한 상황의 특징들을 인지할 수 있는 학습하는 과정이 필수적입니다. 이를 위해, AI 모델 학습 시 모델이 판단해야 하는 다양한 상황과 특성을 갖춘 학습 데이터를 충분히 확보하는 것이 가장 중요합니다. 

비전 검수 AI와 안전 관리 AI를 위해 필요한 특수 데이터 예시

하지만, 통상적인 제조 라인에서 불량품은 양품 대비 그 발생 비율이 10,000 대 1 미만으로 턱없이 낮고, 작업 환경에서 안전하지 않은 상황은 자주 일어나지 않습니다. 또한, 현장의 변화 및 산업 고도화에 따라 AI 모델이 인식해야 하는 제품 결함이나 특정 상황은 시간이 갈수록 종류가 다양해지고 어려워지고 있습니다. 현장이 발전하고 다양해질수록 현장에 도입한 AI 모델도 꾸준하게 업데이트가 필요하고 이를 위해서는 새로 추가되는 결함 유형이나 환경에 대한 데이터를 취득해 모델을 추가학습해야 합니다.

그러나 이러한 새로운 유형의 데이터는 현장에서 취득하기 더욱 어렵습니다. 또한, 처음 도입했을 때 좋은 성능을 보이던 AI 모델도 시간이 갈수록 성능이 떨어지거나 현장에서 발생하는 새로운 상황들에 대응을 하지 못하는 경우가 많을 수 밖에 없습니다.  

슈퍼브에이아이는 이러한 학습 데이터 부족을 해결하기 위해서 데이터 합성 기술을 활용해 부족한 데이터를 충당하고 모델의 성능과 대응폭을 높이는 학습 데이터 생성 기능을 출시했습니다. 

슈퍼브 플랫폼 내 모델 제품에 다양한 데이터로 미리 학습해둔 ReCo 생성형 AI 모델이 추가되었고, 이 모델을 100장 미만의 소량의 데이터로 추가 학습하면 즉시 고품질의 학습 데이터를 생성할 수 있습니다.

학습 데이터 생성 방법 

생성을 원하는 데이터와 수량을 선택하면 생성형 AI 모델이 자동으로 학습 데이터를 생성해 모델 학습에 활용할 수 있습니다.. 현재는 이미지 전체를 생성하는 방식이지만, 빠른 시일 내 1) 이미지 내 구조물은 고정한 상태로 주변 환경만 합성하거나, 2) 배경을 고정한 상태로 구조물의 세부 형태만 합성하는 방식, 또는 3) 명령어를 입력하여 생성하고 싶은 데이터의 특성을 더 구체적으로 설정할 수 있는 생성 방식 등을 플랫폼 내에서 제공할 예정입니다.


위에서 서술한 다양한 이미지 생성 방식은 이미 기술 연구가 완료되어, 이미 슈퍼브 모델 서비스에서 활발히 활용되고 있습니다.
다양한 생성 방식에 대해 더 자세히 알고 싶으신 경우, 아래 입력란에 연락처를 남겨주시기 바랍니다. 

생성한 학습 데이터가 실제 모델 학습 성능 개선에 도움이 되는지 검증을 위해 개발/연구 과정에서 다양한 산업 데이터로 실험을 진행하고 있습니다. 아래 그래프와 같이, 생성 데이터를 추가로 학습시킨 경우 대부분의 모델에서 실제 데이터만 학습했을 때보다 모델 성능이 꾸준히 개선되는 것을 확인했습니다.

생성 데이터를 추가 학습한 AI 모델(빨간색)과 실제 데이터만 학습한 AI 모델(파란색)의 성능 비교 그래프

또한, 슈퍼브 플랫폼의 큐레이트 제품을 활용해서 취득 양이 적거나 기존 모델 성능이 잘 나오지 않는 취약 데이터 위주로 학습 데이터를 생성해 모델 학습에 활용했을 때에도, 예상대로  취약 클래스에 대한 모델 성능이 대폭 개선되는 것을 확인할 수 있습니다.

제품 내 생성 데이터로 학습한 모델의 성능 비교 - 클래스 별 성능 개선 확인

슈퍼브에이아이의 학습 데이터 생성 기술을 활용해서 고성능 산업 AI 도입에 가장 큰 걸림돌인 데이터 확보 문제를 해결하고 더 많은 산업에서 빠르고 효율적이게 AI 모델을 도입할 수 있게 되었습니다.

슈퍼브 플랫폼의 학습 데이터 생성 기능 활용 또는 슈퍼브 모델 서비스에서 데이터 생성 기술 활용을 지금 체험해 보시는 건 어떨까요?