[애그테크] 8일 만에 9만 개의 인스턴스 라벨링을 완료한 '아이오크롭스'

[애그테크] 8일 만에 9만 개의 인스턴스 라벨링을 완료한 '아이오크롭스'
"AI 상용화는 데이터 학습 시간과 가공 시간을 최대한 줄일 수 있는 방향으로 가야 합니다. 저희는 슈퍼브 플랫폼의 커스텀 오토라벨 기능을 통해 데이터 학습 시간을 빠르게 단축할 수 있었습니다"

신용진 Machine Learning Engineer
아이오크롭스

개요



‌소개


슈퍼브 플랫폼을 통해
AI 모델 상용화 성공


애그테크(Agtech) 기업인 '아이오크롭스'는 농업 데이터 분석 클라우드 데이터 플랫폼 '아이오팜'과 함께 독립적으로 개발 중인 '모니터링 로봇'을 통해서 원격으로 스마트팜을 운영하고 있습니다.


스마트팜은 인력의 투여 없이 원격을 통해 기계들이 농장을 관리합니다. 그렇기 때문에 작물들(파프리카 줄기, 뿌리 등)이 데미지를 받게 되면 기존 제조업과는 다르게 원상복구가 잘 안되기 때문에, 생장/생식 정보를 최대한 빠르게 파악해서 효율적으로 기계들을 관리해야 하죠.

스마트팜 운영의 어려운 점을 최대한 데이터로 풀어내어 살아 있는 공장을 잘 운영하고자 말이죠. 스마트팜을 운영 하면서 얻는 시행착오나 포인트를 최대한 빠르게 기술로 풀어내고자 하는 것이 아이오크롭스의 목표 입니다.



문제점


스마트팜 자동화 운영을 위한
'생육 정보 수집 자동화'의 어려움


스마트팜은 일반적인 농장이 아닌 살아 있는 농장으로 영양 생장과 생식 생장이 중요합니다. 살아 있는 기계들이 농장의 토마토, 파프리카 등의 상품을 고품질로 만들어 내야 하니까요.

영양 생장과 생식 생장 요소들은 작물의 잎 줄기, 열매 꽃 등의 상태를 직접 사람이 파악해야 합니다. 사람이 직접 작물의 성장도를 버니어 캘리퍼스(Vernier Calipers: 길이나 높이, 너비 등 기계류의 혹은 사람의 신체 부위 지수를 정밀하게 측정하는 자) 와 같은 도구를 통해 하루 종일 재야하죠. 심지어 일부 농가에서는 인력과 시간 부족으로 인해 일부 개체만 샘플링하거나 직감과 경험을 바탕으로 파악하고 있다고 합니다.

스마트팜이 고품질 작물을 효율적으로 생산하기 위해서는 정확하고 객관적인 생육 정보가 확보되어야 합니다. 아이오크롭스는 이 영역을 최대한 객관화된 데이터로 풀어내는 데 집중하고 있습니다.


사실 아이오크롭스는 농장의 다양한 변수와 데이터 이미지들을 얻는 것부터 어려움을 겪었습니다. 데이터 수집이 지연되니 전체적인 파이프라인이 돌아가는 속도도 계속해서 느려졌죠. 스마트팜 특성상 사람이 직접 수집하는 데이터로 자동화를 진행하기에는 한계가 있었습니다.

"아래 세 장의 이미지는 농장의 데이터를 모으는 게 정말 힘들다는 걸 말씀드리고자 준비했어요. 첫 번째 이미지는 맨 처음 사람이 직접 카메라 들고 가던 모습이고, 두 번째는 로봇의 프로토 타입으로 사람의 힘을 빌리지 않고 데이터를 모으겠다고 투입했었고 마지막 사진은 상용화 직전의 로봇입니다. 한 번에 데이터 수집을 원활하게 할 수 있는 상황이 아니었기에 순차적으로 단계를 밟아가며 데이터를 수집했어요."

신용진 Machine Learning Engineer
아이오크롭스

사람이 직접 수집하는 단계, 프로토 타입, 상용화 직전의 데이터 수집용 로봇


해결책


슈퍼브 플랫폼과
아이오팜을 통한 데이터 라벨링 자동화


아이오크롭스는 문제 해결을 위해 온실 내에서 자율 주행 모니터링과 생육 측정 기술을 결합한 모니터링 로봇을 개발했습니다. 이 로봇을 통해 데이터 수집 자동화를 위한 환경을 구축한 후 슈퍼브 플랫폼의 컴퓨터 비전 기술을 활용하여 생육 지표를 추출하는 작업을 수행했죠. 이렇게 수집된 데이터는 아이오팜슈퍼브 플랫폼을 통해서 학습, 가공되었습니다.

결과


커스텀 오토 라벨링을 활용하여 ‌‌
데이터 학습 시간 대폭 감소

- 8일 만에 9만 개의 인스턴스 라벨링 진행 완료‌‌
- 2~3일 내 이터레이션 (Iteration cycle) 1 사이클 완료


로봇이 농장을 돌아다니면서 취득한 데이터를 슈퍼브 플랫폼으로 전송, 라벨링을 하고, 오토 라벨링된 데이터를 가지고 다시 모델을 재학습을 하는 파라미터를 보내는 식의 연합학습 (Federated Learning) 방식을 통해 데이터 학습 로드를 대폭 감소했습니다.

알고리즘 개발/고도화를 위해 빠른 속도로 라벨링이 필요했고 이미지 당 라벨링 시간을 상당히 단축했기에 8일 만에 9만 개의 인스턴스 라벨링을 진행하고, 2~3일 내 이터레이션 (iteration cycle) 1 사이클을 완료하며 성공적으로 AI 상용화를 완료할 수 있었습니다.

💡
아이오크롭스가 2-3일 내 이터레이션 1 사이클을 완료할 수 있었던 이유커스텀 오토 라벨(Custom-Auto-Label)슈퍼브 플랫폼에서는 따로 코드를 짜지 않아도 커스텀 오토 라벨(Custom-Auto-Label) 기능을 통해 데이터 가공에 걸리는 시간을 크게 단축할 수 있습니다.모델 버전&업데이트 관리커스텀 오토 라벨 & 액티브 러닝(Active Learning)을 통해 모델의 버전과 업데이트를 관리함으로써 메뉴얼 라벨링 대비 2.5배 정도의 트레이닝 피드백을 얻을 수 있습니다.이는 라벨링 및 검수 자동화를 통해 비용 및 시간이 단축되어 더 많은 데이터를 라벨링 할 수 있고, 자동으로 모델이 불확실하게 예측하는 데이터를 식별하고 해당 데이터에 대한 추가적인 라벨링 요소들을 확인할 수 있기 때문입니다.협업 기능'슈퍼브 라벨'내에서 이슈를 만들 시 작업자-검수자 간에 커뮤니케이션이 쉬워 추가적인 커뮤니케이션 리소스가 발생하지 않습니다. 이러한 사소한 커뮤니케이션 관리 같은 데이터 가공 작업 의외의 부분을 신경 쓰지 않을 수 있어 ML팀원들은 더 많은 시간을 데이터에 더 집중할 수 있습니다.

데이터 수집, 라벨링, 학습, 배포, 재학습 이 모든 과정을 자체 엔지니어 인력만으로 소화하지 않고 아이오팜과 함께 슈퍼브 플랫폼의 '자동화'기능과 '협업'기능을 통해 이전 보다 데이터 학습 결과를 빨리 볼 수 있어 다음 상황을 판단하고 진행하기가 수월했다고 전합니다.

"지금 지식으로 과거로 돌아간다면 일정 부분 데이터 수집이 끝났을 때 슈퍼브 플랫폼을 통한 커스텀 오토 라벨 학습으로 초기 버전의 최소 기능 제품MVP(Minimum Viable Product: 고객의 피드백을 받아 최소한의 기능을 구현한 제품)을 만드는데 집중했을 것 같습니다. 이렇게 하면 2~3일 이면 충분했을테니까요.

슈퍼브 플랫폼을 통해 짧은 기간 내에 라벨링을 마무리할 수 있었기에 심리적으로는 매니징, 학습 결과를, 물리적으로는 협업 측면에서의 비용을 절감할 수 있습니다."

신용진 Machine Learning Engineer
아이오크롭스

AI 상용화 지금 시작하세요

데모 요청하기

아이오크롭스가
슈퍼브 플랫폼을 선택한 이유

신용진 연구원님은 슈퍼브 플랫폼을 선택한 이유로 타 기업의 데이터 문제에 공감하는 슈퍼브에이아이의 진정성과 제공되는 자료들 기억에 남았다고 전합니다.

"한참 데이터 수집을 위한 모델을 만들며 AI 상용화에 대한 어려움을 느끼고 있던 시기에 '한국의 기업들은 Data-Centric AI에 얼마나 준비되어 있을까?'라는 제목의 백서를 보게 되었고, 우리 뿐만 아니라 다른 기업들도 데이터 수집과 가공에서 많이들 힘들어 하는구나 라고 공감하고 위안을 받을 수 있었어요.

그때의 서베이 자료를 확인한 기억이 강하게 남아있어 추후 데이터 학습 플랫폼을 선택할 때 슈퍼브에이아이를 바로 떠올렸던 것 같아요. 플랫폼이 제공하는 기능들 또한 매력적이었으니까요.

신용진 Machine Learning Engineer
아이오크롭스