DeepL이 AI 번역 강자로 떠오르는 이유: 치열해지는 AI 번역 시장
번역AI의 결과가 다른 이유
영어를 배우면 배울 수록, 번역기의 결과가 아쉽다는 생각이 자주 들고는 합니다. 저는 주 3회 전화 영어를 하는데, 표현이 떠오르지 않을 때는 Papago를 이용하는데 정말 편하지만 가끔은 부자연스러워요. (구글 번역은 안 쓴 지 꽤 됐구요) 여러분들은 어떠신가요? 번역기를 자주 쓰시나요?
오늘은 대표적인 번역툴 Papago와 DeepL에 대해 집. 중. 탐. 구 해볼게요 :) 직접 사용한 결과를 비교해 보면서, 왜 결과가 다른지에 대해서 분석해 보겠습니다. 또한, 한국어와 일본어가 왜 AI의 시험용으로 적합한 지에 대해서 간단히 알아보도록 해요:)
아는 사람만 쓴다는 ‘DeepL’ 번역기
독일기업 딥엘(DeepL)에 대해 들어보신 적 있나요? 딥엘은 지난 1월부터 한국어를 지원하기 시작했습니다. ‘파파고보다 자연스럽다'는 후기가 쏟아지면서 핫한 번역 서비스로 떠올랐는데요. 특히 뉘앙스 파악에 성능이 뛰어다나는 것이죠.
독일 쾰른에 본사를 둔 AI 서비스 업체 ‘딥엘'. 2009년 설립되어 2017년 서비스를 처음 선보였지만, 처음부터 한국어를 지원하진 않았습니다. ‘The world’s most accurate translator'라고 스스로 부를만큼, 자체 블라인드 테스트에서도 더 우수하다는 평가를 받았다고 합니다.
딥엘 번역기는 누구나 홈페이지에서 무료로 사용가능하며, DeepL Pro 유료 버전은 용량 제한 없이 + 빠르게 번역을 해줍니다. 한국어 버전은 8월 런칭 예정이라고 해요. 또한, API(Application Program Interface)형태로도 배포하여 다른 시스템에 응용하여 탑재가 가능합니다.
전 세계 사용자 수만 10억 명이 넘으며, 이 중 유교 고객은 50만명, 기업 고객은 2만 곳에 달합니다. 한국어를 포함하여 총 31개의 언어를 지원합니다. 텍스트 번역을 넘어, pdf/docx/pptx와 같은 파일 번역도 지원합니다. (사실 이 기능 자체는 특별하지는 않습니다.) 베타 서비스 DeepL Write(딥엘 라이트)은 문법,구두점,어조, 뉘앙스 등 문장 표현을 교정해주는 도구인데요. 현재는 영어(영국), 영어(미국), 독일어 3가지만 지원하네요.
딥엘이 더 자연스러운 이유
딥엘도 다른 번역기처럼 ‘인공신경망 기반 딥러닝'을 활용했습니다. 다만, 인공신경망의 종류가 다릅니다.Neural Network(인공신경망)은 인간의 두뇌에 있는 뉴럴의 신호체계를 모방한 AI의 동작방식으로, 뉴런에 해당하는 노드들이 여러 계층으로 연결되어 최적의 결과값을 도출해내는 구조입니다.
- 구글 / 파파고 : 순환 신경망 (RNN-Recurrnet Neural Network)
- 딥엘 : 합성곱 신경망 (CNN-Convolutional Neural Network)
RNN은 데이터의 ‘순서정보'를 반영하여, 순차적으로 ‘왼쪽 → 오른쪽'으로 읽어 내려가는 방식입니다. 구글과 파파고는 이 방식을 채택하고 있습니다. 입출력을 시퀀스 단위로 처리하여, 순차적 데이터 학습에 특화되어 있죠.
반면, CNN은 데이터의 순서정보가 아닌 ‘특징 자체'를 추출하여, 이를 기반으로 패턴을 파악하는 구조입니다. 주로 영상에서 객체, 범주 인식 등 이미지 처리에 유용한데, 딥엘은 이를 텍스트 번역에 응용한 것이죠.
현대자동차의 공식 보도를 번역해본 결과, 딥엘은 ‘의역'을 열심히 하고 있었습니다.
- 한국어 원문 - 커넥티비티는 MECA의 핵심 요소로 고품질의 안정적인 통신망이 뒷받침되어야 원활한 기술 운용이 가능하다.
- 딥엘 번역문 - Connectivity is a key element of MECA, and a high-quality, reliable telecommunications network is essential for smooth technology operations.
- 파파고 번역문 - Connectivity is a key element of MECA, and a high-quality and stable communication network must be supported to enable smooth technology operation
⇒ ‘통신망이 뒷받침되어야 ~ 가능하다'를 딥엘은 ‘is essential for’ , 파파고는 ‘must be supported to enable‘이라고 번역을 했습니다.
이외에도 딥엘 CEO 야로스와프 쿠티워프스키는 “번역에서는 일관성(consistency)도 매우 중요하다"며 “문장이나 단락에 맞게 메시지를 정확히 전달할 수 있도록 조정하고 있다"고 말하기도 했습니다. 예를 들어, 딥엘은 ‘Washington'을 ‘미국 정부'라고 번연하고, ‘갈비찜'을 ‘Braised Short Ribs’라고 번역합니다.
번역AI 시장이 한국어, 일본 시장을 공략하는 이유
이미 프랑스어, 독일어 등 유럽권 언어에서 강점을 보이는 딥엘. 그럼에도 딥엘 CEO는 한국 시장이 수년 내 글로벌 5대 시장 (독일, 미국, 프랑스, 일본, 한국)으로 성장할 것으로 예상하는 이유는 무엇일까.
그는 “전 세계적으로 한국어를 모국어로 쓰는 사람은 많지 않지만, 한국어 수요가 엄청나게 올라가고 있다.” 며 한국어를 영어로 번역하는 과정이 매우 복잡하기 때문에 한국어 번역 시장은 커질 밖에 없다며 의견을 내놓기도 했다.
실제로 한국어 사용 인구는 8000만여 명으로 전 세계 언어 가운데 23위에 불과합니다. 그럼에도 AI 기업이 한국어 AI 번역에 집중하는 이유는 ‘어려운데 번역 수요가 증가하기’ 때문입니다. 시험대 기능을 할 수 있고, 더 나아가 K콘텐츠의 정확한 번역을 요구하는 활용처가 많아지고 있습니다. 한국어 어순이 영어, 독일어와 다르고, 존칭표현, 문맥에 따른 격식 표현, 동사 활용형이 너무나도 다양하기 때문에 어려운 과제라고 하네요.
구글 CEO는 “영어와 언어적으로 매우 다른 한국어와 일본어 서비스는 일종의 도전"이라며, AI 챗봇 바드에 영어외 처음으로 한국어와 일본어 서비스를 시작한 이유를 이렇게 설명하기도 했습니다. 또한, 한국과 일본은 AI에 대한 수용도가 높은 국가인만큼 AI 서비스의 수용도가 높을 것이라고 전망하기도 했습니다.
구어체는 파파고, 전문 문서는 딥엘
의역보단 직역을 선택하는 파파고. 자연스러움은 부족하지만, 유저의 편의를 꼼꼼히 고려한 부가 서비스가 눈에 띕니다. 번역문에 쓰인 단어의 정의와 유사어 모음, 번역 기록 등등… 그리고 ‘아아 마시러 가자'를 ‘Let’s go drink iced Americano’로 번역할 만큼 (딥엘은 Aah, let’s go get a drink - 아아를 사람 이름으로 인식했네요 ㅎㅎ) 구어체에 뛰어난 성능을 보입니다.
요약해서, 캐주얼 영어는 파파고, 비즈니스 영어는 딥엘을 사용한다면 보완책이 될 것 같아요. 실제로 딥엘은 한국에서 B2B 사업을 고려 중이라고 합니다. K콘텐츠를 해외에서도 스트리밍하는 OTT 플랫폼의 수요가 있지 않을까 싶습니다. 이처럼 번역 AI 시장을 선점하려는 경쟁이 치열해질 것으로 예측됩니다.
잇린이(IT+린이) 제나팡입니다. 문돌이의 IT 이슈 따라잡기, 함께 할까요? |