SUPERB AI

SUPERB AI

액티브러닝 101: 고품질 데이터를 향한 완성도 높은 가이드(1부)
저널

액티브러닝 101: 고품질 데이터를 향한 완성도 높은 가이드(1부)

액티브러닝(Active learning)은 더 나은 모델을 만들고 모델을 최상의 상태로 유지하는 매우 중요한 무기입니다. 그러나 액티브러닝은 종종 활용도가 떨어지기도 하고 아예 사용되지 않기도 하는데요.이 시리즈의 1부에서는 액티브러닝이 무엇이며 컴퓨터 비전(CV) 애플리케이션을 위한 학습용 데이터 라벨링과 어떤 연관이 있는지 설명합니다. 시작하겠습니다. 소개 머신러닝은 비즈니스 프로세스를 자동화하고 가속화하는 데
17 min read
Superb AI와 Comet ML이 만나다 - 데이터 플랫폼과 모델 실험 플랫폼의 결합

Superb AI와 Comet ML이 만나다 - 데이터 플랫폼과 모델 실험 플랫폼의 결합

‍ 들어가며 ‍ 머신러닝 프로젝트에 있어서, 데이터셋 버전 하나에 하나의 모델만 학습시켜서는 실용화 모델을 만들 수 없다는 것은 불가피한 진리입니다. 머신러닝 라이프사이클은 그 특성상 매우 반복적이고 상호 의존적입니다. 어떤 프로젝트든 데이터셋 구축과 모델을 개발하는 과정에 있어, 수많은 반복 순환 작업이 요구됩니다. 거기에 더해 머신러닝 워크플로우에서는 한 부분에만 변화를 줘도 나머지 모든 부분에도
14 min read
Suite 오토라벨링으로 이미지 분류용 AI 모델 학습시키기
제품 및 서비스

Suite 오토라벨링으로 이미지 분류용 AI 모델 학습시키기

들어가며 컴퓨터 비전 분야에서 정확도란 매우 중대한 요소입니다. 이미지를 정확하게 탐지하지 못하는 모델은 현실에 적용해봤자 쓸모가 없거나, 더 심각한 경우 위험한 상황을 일으킬 수도 있습니다. 이렇듯 컴퓨터 비전 모델이 제대로 물체를 식별해내지 못하면 재해에 가까운 결과를 불러올 수 있습니다. 한편으로는 학습이 제대로 된 모델은 워크플로우를 수월하게 하고, 의학적인 미스터리를 풀어주고,
18 min read
Superb AI의 Tech Blog는?
테크

Superb AI의 Tech Blog는?

'시작이 반이다'를 실천해보는 Tech blog에 대하여 Superb AI 개발팀은 지금, 그 어느 때보다 빠른 성장을 하고 있습니다.🚀 AI 기술의 민주화라는 미션 아래 모두가 공감하며 열심히 달리고 있는데요. Superb AI는 AI/ML을 전공 여부와 관계없이, 모두 오픈된 마음으로 지식을 공유하고 배우기 위해 노력하는 개발팀 문화가 잘 정착되어 있어요.
5 min read
리얼월드 머신러닝 애플리케이션을 위한 데이터 라벨링 접근법
저널

리얼월드 머신러닝 애플리케이션을 위한 데이터 라벨링 접근법

들어가며 ‍ 컴퓨터 비전과 머신 러닝 작업의 워크플로우에 있어서 데이터 라벨링은 필수적인 과정입니다. 이러한 데이터 라벨링이란 머신 러닝 모델 제작을 위해 이미지나 비디오, 오디오 파일 등을 식별하고 라벨링하는 작업을 말합니다. 이렇게 가공한 데이터는 실생활에 적용할 수 있는 예측 데이터로 활용할 수 있습니다. 자율 주행차를 예로 들면, 올바르게 라벨링 된 자율주행용 데이터셋은
23 min read
한국의 기업들은 Data-Centric AI에 얼마나 준비되어 있을까요?
AI 인사이트

한국의 기업들은 Data-Centric AI에 얼마나 준비되어 있을까요?

‍ *백서 다운로드 링크는 블로그 하단에 있습니다. ‍Data-Centric View VS Model-Centric View 2021년을 돌이켜 보면, 머신 러닝 개발 씬에서 ‘데이터'에 대한 논의가 많이 이뤄진 한 해였다고 할 수 있을 것 같습니다. Deeplearning.AI의 Andrew Ng이 2021년 3월에 이 주제를 커뮤니티에 던지면서, ‘Data-Centric AI’ ‘데이터 중심의 머신 러닝 개발'
7 min read
Meet Superb AI's Community Team
슈퍼브 팀

Meet Superb AI's Community Team

‍ 들어가며 Superb AI 는 MLOps 및 인공지능 개발에 있어 데이터 관리의 중요성을 알리기 위해 블로그, 백서, 뉴스레터 팟캐스트 등 다양한 형태의 콘텐츠를 꾸준히 제작해오고 있었습니다. Superb AI의 콘텐츠를 직접 만들어가는 Olivia, Dasha 그리고 James가 한자리에 모여 콘텐츠 제작 비하인드 스토리를 제공합니다. Superb AI의 구독자를 위해 고도로 선별된 콘텐츠를 만들고 있는
19 min read
ML 통합 가시성과 데이터 옵스를 활용해 고품질의 정형 데이터와 비정형 데이터 확보하기
저널

ML 통합 가시성과 데이터 옵스를 활용해 고품질의 정형 데이터와 비정형 데이터 확보하기

이 글은 슈퍼브에이아이와 어라이즈에이아이가 협력하여 작성한 공동 포스트입니다. 1 - 들어가며 머신러닝(ML)이 다른 소프트웨어 엔지니어링 분야와 점점 더 유사해지면서 매끄러운 워크플로우와 신뢰할 수 있는 결과물을 보장하기 위한 프로세스와 툴이 필요해졌습니다. 특히 데이터 품질에 대한 관심은 지속적으로 높아져 왔습니다. 데이터 품질을 제대로 관리하지 않을 경우, 기술과 아키텍처, 그리고 조직적인
16 min read
Superb AI와 WhyLabs가 만나다 : 데이터 라벨링과 데이터 모니터링을 한 번에
제품 및 서비스

Superb AI와 WhyLabs가 만나다 : 데이터 라벨링과 데이터 모니터링을 한 번에

배경 : 이 포스팅은 WhyLabs와 Superb AI이 함께 파트너십을 맺고 작성한 블로그 게시물입니다. 저희는 DataOps 파이프라인 구축의 어려움을 소개하는 동시에 Superb AI의 데이터 라벨링 기능과 WhyLabs의 데이터 모니터링 기능을 통해 이를 어떻게 해결해 나갈 수 있는지 보여드릴 예정입니다. ‍ 참고 : 이 포스팅에서 언급하는 데이터는 컴퓨터 비전에 한정되어 작성되었으므로 이미지 혹은 비디오를 의미합니다.
7 min read
김현수 대표, MIT Technology Review 젊은 혁신가로 선정
보도자료

김현수 대표, MIT Technology Review 젊은 혁신가로 선정

김현수 대표, MIT Technology Review IU 35 젊은 혁신가로 선정 MIT Technology Review는 매년 세계 각국에서 35세 미만의 테크놀로지 인재 35명을 선정합니다. 기술이 인류를 이롭게 한다는 철학에 따라 전 세계의 젊은 혁신가를 선정하고 있는 건데요. 이 취지에 걸맞게 우리가 알고 있는 많은 혁신가들이 이 상을 수상해왔습니다. 대표적으로는 Google의 래리 페이지,
2 min read
컴퓨터 비전 프로젝트를 위한 데이터옵스 팀 꾸리기
저널

컴퓨터 비전 프로젝트를 위한 데이터옵스 팀 꾸리기

들어가며 컴퓨터 비전 프로젝트는 대개 (1) 프로덕션으로 전환하지 못하거나 (2) 컴퓨터 비전 사이언티스트와 엔지니어가 사소한 작업에 시간을 너무 많이 소비하거나 (3) 거버넌스 리스크의 증가 때문에 실패하게 됩니다. 이와 같은 문제를 해결하기 위해서는 데이터옵스(DataOps) 도구 및 프로세스의 활용을 통해, 프로덕션급으로 라벨링된 훈련 데이터를 얻는 등의 기초 활동에 투자하는 것이 필수입니다.
18 min read
지금 Superb AI의 여정에 합류하세요!
슈퍼브 팀

지금 Superb AI의 여정에 합류하세요!

‍시작하며 ‍ 어린 시절, 어느새 커버린 키를 실감하던 때가 있었나요? 새로 산 옷이 금세 작아질 때, 큰 줄만 알았던 우리 집이 새삼 작아 보일 때 커버린 키를 체감했었죠. Superb AI도 3년 만에 시리즈 A에 올라서더니, 벌써 다섯 번째 오피스로 확장하며 가파른 성장세를 실감하고 있습니다. Superb AI는 새 오피스의 문을 활짝 열고,
26 min read
데이터 프렙 옵스가 머신러닝 라이프 사이클의 잃어버린 퍼즐 조각이 맞을까?
저널

데이터 프렙 옵스가 머신러닝 라이프 사이클의 잃어버린 퍼즐 조각이 맞을까?

일반적인 머신러닝 라이프 사이클은 세 가지로 구성됩니다. (1) 데이터 준비(데이터의 수집, 보관, 증강, 라벨링, 검증, 기능 선택), (2) 모델 개발(하이퍼파라미터 튜닝, 모델의 선택, 훈련, 테스트, 검증), 그리고 (3) 모델 운용(모델의 인퍼런스, 모니터링, 유지보수)입니다. 하지만 머신러닝 전문가들이 흔히 간과하지만 사실은 머신러닝 라이프 사이클에서 가장 중요한 영역이 있습니다.
19 min read
슈퍼브에이아이 커스텀 오토 라벨의 완벽 활용 가이드
저널

슈퍼브에이아이 커스텀 오토 라벨의 완벽 활용 가이드

속도와 정확성을 위한 고품질의 정답 데이터와 올바른 훈련 이터레이션 슈퍼브에이아이의 커스텀 오토 라벨은 데이터셋의 구축과 이터레이션에 드는 시간을 획기적으로 감소시켜줄 수 있는 강력한 툴입니다. 이 똑똑한 자동화 툴이 있으면 큰 사이즈의 데이터셋 준비를 수동으로 하는 것은 옛일이 될 것입니다. 특정 유즈 케이스에 적합하게 조정한 커스텀 오토 라벨을 구축하는 것은 어렵지
19 min read
롱테일 컴퓨터 비전을 위한 커스텀 오토 라벨을 소개합니다
저널

롱테일 컴퓨터 비전을 위한 커스텀 오토 라벨을 소개합니다

들어가면서 새롭게 개선된 슈퍼브에이아이의 커스텀 오토 라벨(Custom Auto-Label)을 여러분께 소개하게 되어 기쁩니다. 슈퍼브에이아이의 커스텀 오토 라벨은 데이터 라벨링 워크플로우를 자동화하여 컴퓨터 비전팀이 획기적이면서도 안정적인 롱테일 컴퓨터 비전(Computer Vision, CV) 모델을 개발할 수 있도록 돕습니다. 실제로 CV 어플리케이션을 구축할 때 투자가 필요한 부분은, 현실 속 시나리오에서 간과하기 쉬운
14 min read
대규모 라벨 검수의 새로운 방법, 직관적인 인터페이스를 갖춘 ‘매뉴얼 리뷰’를 소개합니다.
업데이트 소식

대규모 라벨 검수의 새로운 방법, 직관적인 인터페이스를 갖춘 ‘매뉴얼 리뷰’를 소개합니다.

당신의 데이터 라벨링, 이제 Suite의 품질 검수 기능이 함께합니다. 들어가며 머신러닝 시스템을 구축해본 경험이 있다면, 학습용 데이터셋의 품질이 시스템 성능에 미치는 영향을 알고 있을 것입니다. 정확하게 라벨링된 데이터셋은 머신러닝 시스템 개발을 촉진하고, 성능을 향상시킬 수 있습니다. 하지만 진정한 의미의 고품질 라벨링 데이터셋은 쉽게 구하기 어렵습니다. 데이터 라벨링 프로세스에는 데이터를 수집
13 min read
글로벌 수준의 철저한 보안 운영을 입증하는 SOC 2 Type II 인증 획득!
제품 및 서비스

글로벌 수준의 철저한 보안 운영을 입증하는 SOC 2 Type II 인증 획득!

‍ 많은 분들이 아시다시피, 지금까지 저희는 업계에서 가장 고도화된 데이터 관리 플랫폼을 구축하는 데 집중해 왔습니다. Superb AI팀은 어떤 면에서든 안전하고 온전한 플랫폼으로의 자격을 갖추기 위해 데이터 처리, 보안 및 기밀성에 관한 가장 엄격한 프로토콜을 준수하는 노력을 해왔는데요. 엄격하고 철저한 시스템 감사를 거쳐 SOC 2 Type II 인증을 획득하게 되었다는 기쁜
4 min read
Superb AI Suite와 Pachyderm Hub로 Data-centric AI 애플리케이션 만들기
제품 및 서비스

Superb AI Suite와 Pachyderm Hub로 Data-centric AI 애플리케이션 만들기

시작하며 데이터는 새로운 소스 코드가 되었으며 이를 관리할 방법이 필요합니다. 데이터는 매우 중요하기 때문에 AI 분야의 선도적인 많은 실무자들은 데이터가 머신러닝 워크플로우의 중심이 되어야 한다고 주장하고 있습니다. 수년 동안 코드는 소프트웨어 개발의 중심이었습니다. 그리고 멋진 도구와 프로세스를 개발하여 더 민첩하고 효과적인 훌륭한 소프트웨어를 만들어왔습니다. 하지만 오늘날 업계에서는 머신러닝 소프트웨어의 급격한
11 min read
새롭게 UI/UX 리뉴얼을 진행한 Suite v1.10.0을 소개합니다
업데이트 소식

새롭게 UI/UX 리뉴얼을 진행한 Suite v1.10.0을 소개합니다

작년 8월 Suite 정식 버전이 출시된 이후로 벌써 1년이라는 시간이 흘렀습니다. 그동안 여러 ML, 라벨링 팀에서 Suite를 찾아주셨는데요. 그동안 저희 Superb AI팀은 고객의 니즈를 반영하는 동시에, 특수 데이터 라벨링 자동화 기능(a.k.a 커스텀 오토라벨링)을 선보이며 머신러닝 데이터 구축에 필요한 기능들을 Suite를 통해 제공해왔습니다. v1.10.0 업데이트에서는
8 min read
대부분의 컴퓨터 비전팀이 풀지 못한 DataOps의 세 가지 난제 Part2
저널 Featured

대부분의 컴퓨터 비전팀이 풀지 못한 DataOps의 세 가지 난제 Part2

*본 글은 Superb AI의 James Le가 작성한 ‘Part 2: Three DataOps Challenges That Most Computer Vision Teams Struggle With’의 번역본입니다. ‍ ‍ 시작하며 ‍ 최첨단 아키텍처를 구현하고 모델 하이퍼파라미터를 조정하고 손실 함수를 최적화하는 것은 머신러닝의 재미있는 부분입니다. 겉으로는 있어 보이는 작업처럼 보일 수 있지만 상용화를 완료한 모델의 뒤에는 고품질 학습용 데이터셋을 구축하는
20 min read
컴퓨터 비전 데이터에 대한 모든 것
저널 Featured

컴퓨터 비전 데이터에 대한 모든 것

컴퓨터 비전이란 무엇인가? 컴퓨터 비전이라는 말에 이미 ‘시각'(vision)이라는 단어가 포함되어 있어서 유추할 수 있듯이, 사람의 시각과 관련한 시스템 구조를 모방하여 컴퓨터도 물체나 상황을 식별하고 해석할 수 있도록 하는 연구 분야입니다. 컴퓨터 비전에서 다루는 데이터에는 이미지와 이미지 속 텍스트를 인지하는 영역뿐만 아니라 비디오와 3D 영상도 포함됩니다. 비디오 영상은
23 min read
아리랑 위성이 수집한 영상 데이터 80만 건, AI가 되다
성공사례

아리랑 위성이 수집한 영상 데이터 80만 건, AI가 되다

들어가며 밤하늘을 바라보면 유독 밝게 빛나며 움직이는 불빛이 있습니다. 별이라고 생각할 수 있지만 대부분 ‘저궤도 위성’으로, 다른 위성보다 지구와 가까이 위치하여 자주 볼 수 있는데요. 우리나라에서는 ‘아리랑 위성’이 대표적인 저궤도 위성입니다. 아리랑 위성은 국내 유일의 다목적실용위성으로, 1999년 1호가 최초 발사된 이후 현재는 3호·5호·3A호가 운행되고 있으며, 2022년에는
10 min read
Suite와 Valohai로 YOLOv3 파이프라인 설계하기
제품 및 서비스

Suite와 Valohai로 YOLOv3 파이프라인 설계하기

지난 포스팅에서는 Superb AI Suite와 Valohai, 두 플랫폼이 서로를 어떻게 보완하고 있는지에 대해 다뤘는데요. 이번에는 두 플랫폼에서 사전 학습된 가중치와 전이학습(Transfer Learning)을 사용하여 컴퓨터 비전 모델을 학습시키는 파이프라인을 보여드리려고 합니다. 이번 모델에서는 실시간 객체 감지용으로 구축된 YOLOv3를 사용할 예정입니다. 이 실험에서 학습용 데이터의 관리 및 라벨링은 모두 Superb
10 min read
컴퓨터 비전 데이터를 위한 DataOps의 모든 것 Part1
저널

컴퓨터 비전 데이터를 위한 DataOps의 모든 것 Part1

*본 글은 Superb AI의 James Le가 작성한 ‘Part 1: An Overview of DataOps For Computer Vision’의 번역본입니다. ‍ 일반적으로 머신러닝 애플리케이션, 특히 컴퓨터 비전 애플리케이션 모델 학습은 데이터에 크게 의존합니다. 상용화 시스템에서는 추론을 수행하기 위해 입력 데이터가 공급되는데요. 이 추론의 결과값은 다시, 이어서 진행되는 반복 학습의 입력값으로 투입되어 훈련 데이터의
25 min read