저널 컴퓨터 비전 데이터 큐레이션을 위한 임베딩의 미래 머신러닝에서 임베딩의 개념은 주성분 분석(PCA) 및 다차원 스케일링(MDS)과 같은 기술의 개발과 함께 2000년대 초반으로 거슬러 올라갑니다. 이러한 방법은 고차원 데이터 포인트의 저차원 표현을 찾는 데 중점을 두어 복잡한 데이터셋을 보다 쉽게 분석하고 시각화할 수 있도록 했습니다. 컴퓨터 비전에서 이미지 임베딩 개념은 2010년대 초 딥러닝 기술의 부상과 함께
보도자료 슈퍼브에이아이, ‘AI EXPO KOREA 2023’ 참여 성료… 자동 데이터 선별 AI ‘슈퍼브 큐레이트’ 호평 [슈퍼브에이아이-2023/05/16] 슈퍼브에이아이는 국내 최대 규모의 AI 전문 컨퍼런스 'AI EXPO KOREA 2023 국제인공지능대전'참가를 성공적으로 마쳤다고 밝혔다. 지난 10~12일간 코엑스에서 개최된 본 컨퍼런스는 국내외 AI 기업과의 네트워킹을 확장하고 참가기업과 참관객 간 인공지능 기반의 산업 혁신 및 발전 방향에 대한 다양한 의견과 아이디어 교류가 이루어졌다. 이번
AI 인사이트 인공지능(AI)의 정답은 데이터에 있다 인류가 2000년대 초반부터 2023년 현재까지 생산한 데이터의 양은 90 제타바이트(ZB)에 달한다고 한다. 이는 고대인류가 파피루스와 같은 원시적인 형태의 종이에 기록을 남기기 시작한 이후, 약 5000년이라는 시간동안 쌓아온 데이터양의 약 3000천배가 넘는 수치다. 천문학적이라는 말로는 데이터의 무서운 증가세를 표현하지 못할 지경이다. 이 글을 쓰고있는 지금 이 순간에도 수많은 사람들은
AI 인사이트 AI는 의료 진단에 어떻게 사용될까?: 의료진의 제 3의 눈과 귀 AI 의료 진단 보조 시스템 의료 업계에서도 AI 기술은 뜨거운 감자입니다. 의료 AI는 인공지능 기술을 의료 분야에 적용하여 환자 진단, 예방, 치료, 의료 정보 관리 등 다양한 분야에서 의료 전문가와 환자를 지원할 수 있습니다. 지금도 의사의 진단을 보조하기 위해 또는 환자의 자가 진단을 위해 객체 검출, 세그멘테이션, 시계열 데이터 분석,
AI 인사이트 인공지능과 디스토피아 AGI(인공일반지능) 인공지능이 만들어낼 디스토피아를 상상하면서 우리는 영화 '터미네이터'를 떠올리곤 한다. 기계가 스스로 판단하여 사람들을 지구의 악성 바이러스로 규정하고 처분하기까지 하는 폭력적이고 끔찍한 장면 말이다. 그러나 자연어처리(NLP) 분야의 프로젝트에서 직접 일하면서 느낀 현실은 공상과학 영화와는 매우 다른 것이었다. 작년 말 챗GPT의 등장으로 사람들은 기계의 위협이 더이상 먼 미래의
AI 인사이트 단어를 숫자로 바꿔 학습하는 방법 - 임베딩에 대한 이해 ChatGPT와 같은 AI 언어모델이 어떻게 사람의 말을 하는 지 궁금한 적이 있는가? 최근 핫한 ChatGPT가 사실 숫자로 입력된 정보를 요리조리 뜯어보고 사람의 말을 내뱉는 것이라면? 머신러닝 라이브러리를 사용해 보신 경험이 있는 분이라면 알겠지만 테이블로 정리된 데이터를 바로 머신러닝 라이브러리에 집어 넣을 수는 없다. 텍스트는 반드시 모두 숫자로 바꿔 입력해야 하는
저널 컴퓨터 비전용 데이터 구성을 위한 임베딩 생성하는 법 알아보기 컴퓨터 비전 분야에서 엔지니어와 데이터 사이언티스트는 방대한 양의 이미지 데이터를 이해하고 정리해야 하는 어려운 과제에 직면해 있습니다. 고성능 컴퓨터 비전 모델에 대한 수요가 계속 증가함에 따라 대량의 비정형 또는 로우 데이터를 효율적으로 처리하는 것이 점점 더 중요해지고 있습니다. 로우 데이터를 기계가 이해하고 활용할 수 있는 정형화된 형태로 변환하는 작업은 데이터
보도자료 슈퍼브에이아이, 국제인공지능대전 ‘AI EXPO KOREA 2023’ 참가 [슈퍼브에이아이-2023/05/12] 인공지능(AI) 기반의 머신러닝 데이터 학습 플랫폼을 제공하는 슈퍼브에이아이가 ‘AI EXPO KOREA 2023’(국제인공지능대전)에 참가한다. 슈퍼브에이아이는 이번 ‘AI EXPO KOREA 2023’ 참가를 통해 최근 정식 출시한 제품인 ‘슈퍼브 큐레이트(Superb Curate)’데모 시연과 함께 AI 도입·개발·고도화 등에 대한 무료 컨설팅을 진행할 예정이다. 슈퍼브에이아이 관계자는
제품 및 서비스 MNIST 데이터셋 테스트로 알아보는 슈퍼브 큐레이트 큐레이트를 소개합니다 데이터는 머신러닝의 근간입니다. 머신러닝 모델을 효과적으로 훈련시키기 위해서는 잘 정리된 폭넓고 정확한 데이터가 필요합니다. 그러나 데이터를 수집하고 큐레이션하는 데는 많은 시간과 비용이 소요되며, 종종 시간과 비용, 인적 자원에 대한 상당한 투자가 필요합니다. 큐레이트(Curate)는 머신러닝 팀이 데이터 큐레이션 프로세스를 간소화하여 프로세스를 더 빠르고 효율적이며 경제적으로 만들 수
저널 컴퓨터 비전 데이터 큐레이션을 위한 이미지 임베딩이란 무엇인가요? 머신러닝(ML) 및 컴퓨터 비전(CV) 개발자는 주변 사물의 미세한 차이를 인식하는 사람의 능력을 모델로 구현하기 위해 노력합니다. 여기서 궁금해지는 것은 기계가 주변 환경의 사물을 정확하게 식별하도록 어떻게 훈련시킬 수 있을지입니다. 신경망이나 ML 모델에서 일정 수준의 일관된 성능을 달성하는 것과 마찬가지로, 그 해답은 모델 훈련에 사용된 데이터에 있습니다. 일반적인 모델로
AI 인사이트 초거대 언어모델(LLM)과 인간의 두뇌: 딥러닝과 인간의 뇌 그리고 튜링테스트 클라우드 컴퓨팅 기술의 발전과 데이터의 증가로 초거대 언어모델(Large Language Model)이 가용할 수 있는 학습 데이터가 기하급수적으로 늘어나면서 성능이 점점 정교해지고 있다. 이러한 트렌드를 반영하듯 인공지능 업계에서는 ChatGPT는 거대한 변화의 서막일 뿐이라고 보는 견해가 많다. 올해 OpenAI가 공개한 GPT 시리즈의 최신버전 GPT-4.0에는 이전 버전의 1750억개를 아득히 뛰어넘는 약
AI 인사이트 텍스트 검출 및 인식 - 아날로그의 디지털화를 위해 텍스트 검출 및 인식 (Text Detection/Recognition) 텍스트 검출(Text Detection) 및 텍스트 인식(Text Recognition)은 디지털 이미지나 비디오에서 텍스트를 검출하고 인식하는 기술로 흔히 OCR(Optical Character Recognition)이라고도 불립니다. 이러한 텍스트 검출 및 인식 기술은 객체 검출(Object Detection)의 한 분야이며 영상에서 텍스트만을 추출하고 인식합니다. *편의상 텍스트
보도자료 슈퍼브에이아이, 자동으로 균형 잡힌 데이터셋 생성해 주는 '슈퍼브 큐레이트' 신규 출시 [슈퍼브에이아이-2023/04/27] 머신러닝 데이터 관리 플랫폼 기업 슈퍼브에이아이가 자동 데이터셋 생성 기능을 제공하는 ‘슈퍼브 큐레이트(SUPERB Curate)’를 정식 출시했다고 밝혔다. 슈퍼브 큐레이트는 머신러닝 팀이 손쉽게 훈련용 데이터셋을 구축하여 더 강건하고 높은 성능의 모델을 구현할 수 있도록 하는 혁신적인 데이터 큐레이션(Curation; 양질의 데이터를 취합, 선별, 분류, 구조화하는 것)
AI 인사이트 기업들이 ChatGPT 도입을 망설이는 이유: 딥러닝의 발전 과정과 한계극복 작년말 시작된 챗GPT 열풍으로 ‘생성형 AI’의 전성시대가 이어지고있다. 생성형 AI의 등장으로 그동안 인간 고유의 것이라고 생각했던 지식노동과 창작의 영역이 얼마나 손쉽게 인공지능에게 넘어갈 수 있는지를 목격한 사람들은 흥분과 망상의 도가니에 빠지거나 혹은 절망감과 무력감에 허덕이고있다. 대중의 반응을 보면 마치 생성형 AI 전에는 인공지능이 존재하지 않았으며, 생성형 AI가 곧 인공지능을
AI 인사이트 AI 민주화는 어떻게 우리 삶을 바꿀것인가?: ChatGPT가 쏘아올린 거대한 신호탄 챗GPT가 대중에게 공개된지 반년에 가까운 시간이 지났다. 대중의 뜨거운 반응은 본격적인 AI시대의 도래를 실감하게 한다. 인공지능에 회의적이던 사람들 조차 챗GPT의 놀라운 성능에 감탄하기 시작했으며, 누구나 고도화된 개인 챗봇을 활용할 수 있게 되면서 LLM App Store(초거대 언어모델 앱스토어)를 비롯해 수많은 B2C 서비스가 순식간에 세상에 등장했다. 그러나 뜨거운 관심에도 불구하고
성공사례 [애그테크] 슈퍼브 플랫폼과 함께 모델 성능을 크게 개선한 Rowbot 문제 Rowbot은 인하우스 라벨링을 통해 옥수수 세그멘테이션 및 색상 분류를 위한 데이터셋을 구축했는데, 그 과정에서 ML팀의 시간과 자원을 너무 많이 소모하게 되어 고민이라고 전했습니다. 사내 작업 인력을 늘리지는 않으면서도 라벨링 산출물의 양과 질을 개선할 수 있는 방법이 필요했습니다. 해결책 슈퍼브에이아이의 고객 맞춤형 데이터 서비스 및 라벨링 툴을 활용해 어노테이션 된
업데이트 소식 슈퍼브 큐레이트 : 더 적은 데이터로 더 강력한 모델 성능을 구현하세요 그동안 베타 버전으로 제공되었던 슈퍼브 큐레이트를 이제 공식적으로 선보일 수 있게 되었습니다. 슈퍼브 큐레이트는 누구나 한 번쯤은 경험했던 데이터 문제들에 대해 슈퍼브에이아이가 제시하는 해답입니다. “어떤 데이터를 먼저 라벨링 해야 할까?”, “어떤 데이터를 모델 학습에 사용하고, 어떤 데이터를 모델 성능 검증에 사용해야 할까?”, “얼만큼의 데이터를 사용해야 할까?” 등 익숙한 문제들이죠. 슈퍼브
성공사례 [헬스케어] 라벨링 시간을 2주에서 2일로 단축한 FitAtom 문제 Fitatom은 자사의 알고리즘을 만들기 위해 다양한 생체 정보 데이터셋을 대량으로 라벨링해야 했습니다. HITL(human-in-the-loop) 서비스와 인하우스 라벨링 툴을 도입했지만 데이터 및 프로젝트 관리가 효과적이지 않아 산출량이 너무 적고 비용이 너무 많이 드는 것이 문제였습니다. 해결 슈퍼브에이아이의 이미지 키포인트 어노테이션 툴과 매뉴얼 리뷰 프로세스, 고성능 데이터 및 유저 관리 시스템을
성공사례 [로보틱스] 어노테이션 시간을 몇 개월에서 몇 시간으로 단축한 폭스 로보틱스(Fox Robotics) 문제 Fox Robotics는 소규모 팀으로, 수기로 직접 모든 이미지를 라벨링하고 검수하는 것이 상당히 부담될 수 밖에 없었습니다. 결국 Fox Robotics는 자사의 ML 모델 훈련을 위한 현장 및 작물 어노테이션 데이터의 양을 인하우스로는 감당할 수 없다고 판단했습니다. 해결 슈퍼브에이아이의 고객 맞춤형 데이터 서비스와 커스텀 자동 라벨링, 액티브 러닝 워크플로우를 함께 활용해
성공사례 [이커머스/소매] 라벨링 자동화를 통해 고객들이 최적의 신발을 빠르게 찾을 수 있도록 한 펄핏(Perfitt) 문제 신발은 브랜드마다 사이즈가 제각기 다르게 나오는 일이 많습니다. Perfitt은 어떤 사이즈가 사용자의 발에 딱 맞는 크기인지 정밀하게 분석해 추천해 주는 기술을 제공하는 회사입니다. 워낙 높은 정확성이 요구되는 기술이기 때문에 모델 성능을 지속적으로 업그레이드 해야 하고, 그러기 위해서는 데이터 수집부터 모델 훈련까지 전 과정을 아우르는 효율적인 데이터 파이프라인을 구축해야 했습니다.
성공사례 [운송/IoT] 라벨링 자동화로 쉽고 빠르게 결과물을 취득한 엣지비전(Edge Vision) 문제 슈퍼브에이아이를 찾은 Edge Vision은 셀프 호스티드 CVAT 인스턴스와 라벨링 서비스에 과감하게 투자했지만 만족할 만한 품질의 라벨을 얻지 못했다고 했습니다. 사람이 직접 라벨링하면 섬세한 고품질의 라벨을 빠르게 얻을 수 있을 거라고 생각했는데, 오히려 인하우스 ML팀의 시간과 리소스를 너무 많이 소모하는 결과만 낳았습니다. 해결 방법 사용자가 원하는 조건에 맞추어 AI가 자동으로
소식 슈퍼브에이아이 창립 5주년을 맞이하며 슈퍼브에이아이가 창립 5주년을 맞았습니다. 슈퍼브에이아이는 2018년에 설립되어 AI가 필요한 기업의 데이터 품질을 개선하고 목표를 달성하는 데 도움이 되는 MLOps/DataOps 플랫폼을 제공하고 있습니다. 슈퍼브 플랫폼을 통해 데이터 팀은 데이터 수집 및 사전 처리에서 모델 배포 및 모니터링에 이르기까지 전체 머신 러닝 수명 주기를 관리할 수 있습니다. 저희는 지난 5년간 꾸준히
AI 인사이트 노션과 구글 워크스페이스에 AI가 더해지면?: 이전과는 전혀 다른 협업 방식 협업툴과 AI의 만남 안녕하세요, IT린이 제나팡입니다. 오늘은 협업툴의 대표 주자, 구글 워크스페이스와 노션의 최근 동향에 대해 알아보도록 할게요. ChatGPT가 촉발한 초거대 AI의 흐름에 따라, 당연히 협업툴과 AI의 만남은 예정되어 있었습니다. 그렇게 놀랍지 않은 이슈이기도 하죠. 다만, 우리의 업무 플로우를 대부분 차지하고 있는 2개의 플랫폼인만큼, 그 영향력은 매우 클 것 같습니다.
제품 및 서비스 오토 큐레이트(Auto-Curate)로 라벨링 리소스 절감하기: MS COCO 사용 실험 사례 들어가며 슈퍼브 큐레이트(Superb Curate)는 머신러닝 팀이 손쉽게 훈련용 데이터셋을 구축하여 더 강건하고 높은 성능의 모델을 구현할 수 있도록 하는 혁신적인 데이터 큐레이션(Curation; 양질의 데이터를 취합, 선별, 분류, 구조화하는 것) 툴입니다. 특히 슈퍼브 큐레이트의 핵심 기능 중 하나인 오토 큐레이트(Auto-Curate)는 훈련용 데이터셋이나 검증용 데이터셋에 반드시 포함시켜야
제품 및 서비스 오토 큐레이트(Auto-Curate)로 모델 성능 개선하기: LOCO 사용 실험 사례 학습용 데이터셋을 큐레이션해 강건한 모델 구축하기 샘플 데이터가 고르게 분포된 균형 잡힌 데이터셋을 큐레이션(Curation; 양질의 데이터를 취합, 선별, 분류, 구조화하는 것)하는 것은 상당히 어렵습니다. 특히 메타데이터가 드물거나 제한적일 경우 더 그렇죠. 슈퍼브에이아이의 큐레이트(Curate)는 이러한 불편함을 해소하고 사용자들이 희소한 엣지 케이스가 더 많이 포함된 학습용 데이터셋이나 검증용