저널

A collection of 55 posts
컴퓨터 비전 전문가를 위한 지침서: 데이터 품질을 높이는 방법
저널

컴퓨터 비전 전문가를 위한 지침서: 데이터 품질을 높이는 방법

컴퓨터 비전을 위한 데이터 중심 AI를 추구하는 움직임이 강화되면서 모두의 관심사가 알고리즘 디자인에서 데이터셋 구축으로 옮겨가고 있습니다. 데이터는 많은 현대 뉴럴 네트워크 아키텍처에서 모델 성능을 가장 큰 폭으로 개선할 수 있는 열쇠입니다. 물론 네트워크에 레이어를 추가하고 스킵 연결을 사용하고 특정 하이퍼파라미터를 튜닝하는 방법도 있지만 성능 개선폭은 제한적이죠. 많은 실무자들이 최첨단
22 min read
세그멘테이션 입문하기
저널

세그멘테이션 입문하기

들어가며 머신러닝에서 데이터 라벨링은 엄청난 시간이 소요되지만 고도의 기술이 필요한 것은 또 아닌, 지루하고 번거로운 작업으로 유명합니다. 물론 의료영상같은 일부 경우에는 고도의 훈련을 받은 의료 전문가를 동원해야 하기 때문에 분야에 따라 다를 수는 있지만요. 하지만 컴퓨터 비전 구축 과정 중 가장 단순한 이 과정이 가장 중요하기도 하다는 사실은 부인할 수
17 min read
AI 도입 시 주의 사항과 고려 사항과 무엇일까요? - AI 기업 리더 숏터뷰 Part 2
저널

AI 도입 시 주의 사항과 고려 사항과 무엇일까요? - AI 기업 리더 숏터뷰 Part 2

슈퍼브에이아이, 마키나락스, 올거나이즈 3사가 공동 주최한 지난 ‘알짜 기업이 쓰는 진짜 AI’ 세미나에서 AI를 도입 · 개발하고자 하는 많은 기업들에게 풍부한 인사이트를 전달했었는데요. 특히 슈퍼브에이아이는 1) 산업 현장에서 AI 서비스가 실패하는 이유, 2) 성공하는 AI 서비스 고도화 방안 및 MLOps 방법론, 그리고 3) 모범 과정 및 실사례를 발표하여 성공적인 AI 개발의
17 min read
폴리라인 어노테이션에 대해 얼마나 알고 계신가요? 컴퓨터 비전 초심자를 위한 가이드
저널

폴리라인 어노테이션에 대해 얼마나 알고 계신가요? 컴퓨터 비전 초심자를 위한 가이드

기술, 인공 지능, 컴퓨터 비전의 세계에서 과학자와 엔지니어를 위시한 모든 사람들이 가장 뜨거운 논의를 펼치는 주제가 바로 자율주행 자동차입니다. 테슬라나 우버와 같은 회사에서 기술이 진보하는 걸 목도한 사람들은 이게 앞으로 우리의 이동 계획을 얼마나 바꾸게 될지, 나아가 앞으로 다양한 산업과 일자리에는 어떤 영향을 미치게 될지 궁금해하게 되었죠. 독립적인 운행이 가능한
13 min read
성능 지표 제대로 활용해 보기 - 모델 진단에 사용되는 지표와 활용 방안 알아보기 Part 3
저널

성능 지표 제대로 활용해 보기 - 모델 진단에 사용되는 지표와 활용 방안 알아보기 Part 3

관련 블로그글 확인하기 혼동 행렬이란? - 모델 진단에 사용되는 지표와 활용 방안 알아보기 Part 1F1 점수, PR 커브, IoU, AP란? - 모델 진단에 사용되는 지표와 활용 방안 알아보기 Part 2 모델 성능이 왜 안 나오는 지 답답하신가요?  모델 성능 분석 지표를 이렇게 활용해 보는 건 어떨까요? 모델 성능이 생각보다 낮을
5 min read
F1 점수, PR 커브, IoU, AP란? - 모델 진단에 사용되는 지표와 활용 방안 알아보기 Part 2
저널

F1 점수, PR 커브, IoU, AP란? - 모델 진단에 사용되는 지표와 활용 방안 알아보기 Part 2

모델 진단에 사용되는 지표와 활용 방안에 대해 궁금하신가요? 모델 평가 지표는 모델 개발자 및 사용자가 모델의 성능을 이해하고 비교할 수 있게 해주어, 모델 개선을 위한 방향을 제시해 줍니다. 선택한 평가 지표는 모델의 특성과 목표에 따라 달라질 수 있으므로, 문제의 본질과 목표를 고려하여 적절한 평가 지표를 선택해야 합니다. 관련 블로그글 확인하기
12 min read
혼동 행렬이란? - 모델 진단에 사용되는 지표와 활용 방안 알아보기 Part 1
저널

혼동 행렬이란? - 모델 진단에 사용되는 지표와 활용 방안 알아보기 Part 1

모델 진단에 사용되는 지표와 활용 방안에 대해 궁금하신가요? 모델 평가 지표는 모델 개발자 및 사용자가 모델의 성능을 이해하고 비교할 수 있게 해주어, 모델 개선을 위한 방향을 제시해 줍니다. 선택한 평가 지표는 모델의 특성과 목표에 따라 달라질 수 있으므로, 문제의 본질과 목표를 고려하여 적절한 평가 지표를 선택해야 합니다. 관련 블로그글 확인하기
11 min read
컴퓨터 비전 데이터셋 - 공공 데이터셋 살펴보기
저널

컴퓨터 비전 데이터셋 - 공공 데이터셋 살펴보기

공공 데이터셋(Open Dataset)이란? 데이터셋은 머신러닝 모델을 학습시키고 테스트하는 데에 사용되는 이미지 또는 영상과 같은 샘플의 집합으로, 주로 특정 주제나 도메인에 속하는 사례들을 포함합니다. 공공 데이터셋(혹은 오픈 데이터셋)은 누구나 다운로드 해 자유롭게 사용할 수 있는 데이터셋입니다. 라벨링 되어있는 경우가 대부분이며, 오브젝트 검출이나 이미지 분류와 같은 다양한 지도
10 min read
AI가 기업의 경쟁력 강화와 생산성 혁신에 어떻게 도움이 될까요? - AI 기업 리더 숏터뷰 Part 1
저널

AI가 기업의 경쟁력 강화와 생산성 혁신에 어떻게 도움이 될까요? - AI 기업 리더 숏터뷰 Part 1

슈퍼브에이아이, 마키나락스, 올거나이즈 3사가 공동 주최한 지난 ‘알짜 기업이 쓰는 진짜 AI’ 세미나에서 AI를 도입 · 개발하고자 하는 많은 기업들에게 풍부한 인사이트를 전달했었는데요. 특히 슈퍼브에이아이는 1) 산업 현장에서 AI 서비스가 실패하는 이유, 2) 성공하는 AI 서비스 고도화 방안 및 MLOps 방법론, 그리고 3) 모범 과정 및 실사례를 발표하여 성공적인 AI 개발의
11 min read
라벨링 플랫폼을 선택할 때 보안을 반드시 고려해야 하는 이유와 보안 수준 확인 방법
저널

라벨링 플랫폼을 선택할 때 보안을 반드시 고려해야 하는 이유와 보안 수준 확인 방법

현대에 들어 사이버 보안은 우리의 일상에 가장 중요한 부분 중 하나가 되었습니다. 우리는 영세한 업체에 우리의 전화번호를 주고, 소셜 미디어 앱에 이메일을 남기고, 은행 기관에 재정 상태를 공유합니다. 그러다 보니 우리가 믿고 정보를 맡긴 회사에 데이터 유출 사건이 발생하는 순간 우리의 데이터는 대중에게 노출되게 되고 우리는 소비자로서의 신뢰를 잃어버리게 되죠.
18 min read
간극 좁히기: 모델 진단을 활용하여 컴퓨터 비전에서 데이터 선별 간소화하기
저널

간극 좁히기: 모델 진단을 활용하여 컴퓨터 비전에서 데이터 선별 간소화하기

컴퓨터 비전은 빠르게 성장하는 분야로, 기계가 인간과 유사한 방식으로 시각 정보를 처리하고 해석할 수 있게 함으로써 산업을 혁신할 수 있는 잠재력을 지니고 있습니다. 성공적인 컴퓨터 비전 애플리케이션을 개발하는 데 있어 중요한 측면은 데이터 선별, 즉 모델을 학습하고 평가하는 데 사용되는 데이터셋을 수집하고, 어노테이션을 추가하고, 정리하는 프로세스입니다. 그러나 데이터 선별에는 정확하고
26 min read
컴퓨터 비전을 위한 고급 모델 진단 기법
저널

컴퓨터 비전을 위한 고급 모델 진단 기법

컴퓨터 비전 모델 설계의 복잡성이 증가함에 따라 성능을 평가하고 한계점이나 고유 편향을 파악하는 것이 중요해지고 있습니다. 모델 진단은 이러한 모델의 복잡성을 이해하고 신뢰성, 효율성 및 해석 가능성을 보장하는 데 중요한 역할을 합니다. 개발자는 개선이 필요한 영역을 파악함으로써 모델을 개선하고 더 향상된 성능을 구현할 수 있습니다. 최근 컴퓨터 비전 기술의 발전으로
20 min read
모델 진단으로 데이터 문제를 조기에 발견하는 방법
저널

모델 진단으로 데이터 문제를 조기에 발견하는 방법

효율적이고 효과적인 머신러닝 모델을 개발하는 데는 수많은 어려움이 있습니다. 이러한 어려움을 해결하기 위해 가장 중요한 것은 데이터 관련 문제를 조기에 발견하고 수정하는 것입니다. 모델 진단(Model Diagnotics)은 데이터 문제가 모델 성능을 저해하기 전에 정확히 찾아내고 수정하는 도구로 대단히 중요합니다. 이번 포스팅에서는 슈퍼브에이아이의 큐레이트 툴이 모델 진단과 데이터 문제 조기
18 min read
컴퓨터 비전 모델의 희귀 케이스를 위한 데이터 증강 기법
저널

컴퓨터 비전 모델의 희귀 케이스를 위한 데이터 증강 기법

머신러닝은 항상 데이터에 굶주려 있습니다. 특히 컴퓨터 비전 작업에서는 데이터가 많을수록 더 나은 모델을 만들 수 있는 경우가 많습니다. 하지만 모든 데이터셋이 동일하게 생성되는 것은 아닙니다. 특히 빈도가 낮거나 드문 어떤 사례들은 데이터가 부족할 수 있습니다. 이러한 경우 데이터 증강 기술이 모델의 성능에 큰 영향을 미칠 수 있습니다. 이런 문제의
27 min read
컴퓨터 비전 분류: 노이즈가 많고 잘못 라벨링된 데이터 클리닝
저널

컴퓨터 비전 분류: 노이즈가 많고 잘못 라벨링된 데이터 클리닝

머신러닝 및 컴퓨터 비전 기술에 대한 전문 지식이나 경험에 관계없이 한 가지 보편적인 사실은 모델의 성공 여부는 데이터 품질에 크게 좌우된다는 것입니다. 쓰레기 심은데 쓰레기 난다(Garbage in, Garbage out; GIGO)는 말이 있을 정도로요. 하지만 실제 데이터는 노이즈와 잘못된 라벨로 가득 차 지저분한 경우가 많습니다. 이 포스팅은 머신러닝 실무자와
19 min read
정확성을 위한 큐레이팅: 균형 잡힌 컴퓨터 비전 데이터셋 구축하기
저널

정확성을 위한 큐레이팅: 균형 잡힌 컴퓨터 비전 데이터셋 구축하기

컴퓨터 비전(CV) 기술의 발전은 전례 없는 수준의 자동화와 스마트 기능을 등에 업고 다양한 산업을 변화시키고 있습니다. 그러나 정확하고 편향성 없는 CV 모델을 구축하는 것은 늘 복잡한 과정입니다. 이러한 난관을 극복하는 비결은 균형 잡힌 고품질 데이터셋을 생성하는 데 있습니다. 이러한 맥락에서 슈퍼브 큐레이트(Superb Curate)는 데이터 큐레이션 프로세스를 간소화하는
20 min read
가장 효과적으로 컴퓨터 비전 이미지 데이터를 어노테이션하는 방법
저널

가장 효과적으로 컴퓨터 비전 이미지 데이터를 어노테이션하는 방법

컴퓨터 비전(CV) 데이터셋은 현대의 연구진과 개발자들에게 있어 가장 유용한 자원 중 하나입니다. 머신러닝 엔지니어들은 데이터셋의 다양한 이미지와 라벨을 통해 모델이 객체 탐지, 안면 인식, 또는 배포 환경에 필요한 다른 시각적인 기능들과 같은 고급 기능을 갖추도록 학습시킬 수 있습니다. 하지만 이런 데이터셋들의 고질적인 문제점은 정확히 어떤 이미지를 어떻게 어노테이션해야 가장
17 min read
슈퍼브에이아이 플랫폼으로 품질 관리 완전 정복 및 이상적인 정답 데이터셋 구축하기
저널

슈퍼브에이아이 플랫폼으로 품질 관리 완전 정복 및 이상적인 정답 데이터셋 구축하기

들어가며 파트 2에서는 라벨링의 종류와 적절한 적용 방법 및 사례, 그리고 슈퍼브에이아이 스위트를 팀에 맞게 최적화하는 방법에 대해 다뤘습니다. 파트 3에서는 이슈를 모니터링 및 해결하는 품질 관리 (Quality Assurance, QA) 전략과 모범적인 검수 방법(auditing), 정답 (Ground Truth, GT) 데이터셋을 생성하는 방법, 그리고 데이터를 분리하는 최적의 방법에 대해 다룹니다. 워크플로우
24 min read
데이터 라벨링 자동화의 주요 과제와 이를 극복하는 방법
저널

데이터 라벨링 자동화의 주요 과제와 이를 극복하는 방법

머신러닝과 컴퓨터 비전의 비약적인 발전과 막대한 가능성에 힘입어 AI 기술의 성능과 역량은 역대 최고 수준에 도달했습니다. 하지만 이러한 효율성은 데이터 처리 프로세스 개선 및 우선순위 설정 없이는 달성할 수 없을 것입니다.‌‌ 모든 AI 시스템이나 애플리케이션이 의도한 대로 작동하려면 특정 유즈 케이스에 적합한 품질과 관련성을 갖춘 데이터가 필수적입니다. 따라서 이러한 기술을
13 min read
Transformer 모델이란? : AI 혁신을 주도하는 트랜스포머 알고리즘
저널

Transformer 모델이란? : AI 혁신을 주도하는 트랜스포머 알고리즘

트랜스포머(Transformer)는 구글이 자연어처리를 위해 2017년 발표한 모델로 현재 AI 분야의 혁신을 이끌고 있는 언어모델이다. 우리가 웹이나 API를 통해 AI를 처음 활용하게 된 계기가 된 ChatGPT 역시 트랜스포머에 기반한 모델이며, 구글이나 페이스북 등이 이에 대한 대항마로 내놓는 언어모델들 역시 트랜스포머 기반이다. 트랜스포머는 자연어처리 뿐만 아니라 컴퓨터 비전이나 음성 인식
13 min read
AI 프로젝트를 성공으로 이끄는 데이터옵스(DataOps) 활용 방법
저널

AI 프로젝트를 성공으로 이끄는 데이터옵스(DataOps) 활용 방법

AI 개발 프로젝트는 사소하게 신경 써야 할 부분이 많이 있으며 복잡합니다. 가장 중요한 데이터 관리 시 복잡한 데이터 파이프라인들로 인해 품질이 저하 되기 일쑤고 또한, 데이터 프로젝트 전반에 걸친 협업 요소들의 결여는 작업 효율성을 계속해서 낮춰지고는 하죠. 데이터 프로젝트 진행 시 동 및 관리되지 않는 프로세스는 공급망 전체에 손상된 분석
19 min read
임베딩을 활용한 피처 엔지니어링: ML 엔지니어를 위한 실무 가이드
저널

임베딩을 활용한 피처 엔지니어링: ML 엔지니어를 위한 실무 가이드

‘임베딩을 활용한 피처 엔지니어링: ML 엔지니어를 위한 실무 가이드’는 빠르게 진화하는 머신러닝 세계에서 임베딩을 사용한 피처 엔지니어링의 필수 작업에 대한 실용적이고 포괄적인 접근 방식을 다룹니다. ML 엔지니어는 모델의 성능 개선을 위해 끊임없이 노력하지만, 로우 데이터에서 유용하면서 인사이트가 있는 특성을 추출하는 과정은 한결같이 어려운 과제로 여겨지고 있습니다. 이 포스트를 통해
13 min read
ML 프로젝트별 최적의 데이터 어노테이션 타입을 선택하는 방법
저널

ML 프로젝트별 최적의 데이터 어노테이션 타입을 선택하는 방법

머신러닝이나 컴퓨터 비전 모델을 만드는 것은 어느 팀에게나 힘들고 귀찮은 일입니다. 특히 처음이라면 고난의 연속일 수 밖에 없죠. 하지만 시작이 반이라고, 어디서부터 시작해야 하고 어떤 라벨링 타입을 채용할지 결정하면 반은 온 것이나 다름 없습니다. 프로젝트를 어떻게 진행할지는 이 프로젝트에 얼마나 많은 디테일, 예산, 데이터, 시간이 필요한지에 따라 완전히 달라집니다. 그리고
17 min read
애그테크(AgTech) 컴퓨터 비전을 위한 데이터 소싱 가이드
저널

애그테크(AgTech) 컴퓨터 비전을 위한 데이터 소싱 가이드

전통적인 산업 농업 방법은 식량 생산뿐만 아니라 기타 원자재를 관리하고 제조업체에 공급함으로써 생계를 유지하며 글로벌 공급망과 경제에 크게 기여하고 있습니다. 이러한 광범위한 영향력을 고려하면, 이러한 기존 방식은 세계 각지에서 변화하는 시장 수요에 발맞추기 위해 혁신적으로 변화하고 있습니다. 농업 업계가 이러한 수요를 충족하기 위해 계획하고 있는 방법에는 머신러닝(ML) 및 컴퓨터
15 min read
컴퓨터 비전 데이터 큐레이션을 위한 임베딩의 미래
저널

컴퓨터 비전 데이터 큐레이션을 위한 임베딩의 미래

머신러닝에서 임베딩의 개념은 주성분 분석(PCA) 및 다차원 스케일링(MDS)과 같은 기술의 개발과 함께 2000년대 초반으로 거슬러 올라갑니다. 이러한 방법은 고차원 데이터 포인트의 저차원 표현을 찾는 데 중점을 두어 복잡한 데이터셋을 보다 쉽게 분석하고 시각화할 수 있도록 했습니다. 컴퓨터 비전에서 이미지 임베딩 개념은 2010년대 초 딥러닝 기술의 부상과 함께
19 min read