인공지능을 위한 자동 학습 시스템

고도화된 인공지능 생성을 위해 필수적인 학습 데이터 구축. 그 중요성과 디에스랩글로벌의 자동화 데이터 라벨링 기술을 소개합니다.

Featured image

AI는 무엇으로 학습할까?

​ ​ ● Intro
오늘의 Blog 포스팅은 각광받는 AI 시장에서 데이터 라벨링은 무엇인지에 대한 내용과 그에 대한 디에스랩글로벌의 기술적 강점을 살펴보고자 합니다.
​ ​ ● 데이터 라벨링은 무엇이고 왜 필요할까?
​ 여러분은 갓난 아기를 직접 보신적이 있나요?
출산 직후의 아이들은 몇 가지 표정과 울음만을 이용해 자신들의 상태를 주변에 알리는 것 외에는 할 수 없습니다. 하지만 더 시간이 지나면서 주변의 모든 사물을 보고 만지고 입으로 가져가면서 사물의 특징과 성질을 자연스럽게 파악합니다. 이렇게 경험이 쌓이고 동시에 사람들이 규정한 ‘단어’ 라는 것을 함께 외우게 되면서 하늘에 날아다니는 것은 새고 우리에게 시원한 그늘을 제공하는 건 나무라고 불리우는 것을 알아갑니다. 길을 걷다가 노점상에서 파는 음식을 보며 맛있겠다고 생각하기도 하죠. 이러한 과정 전반을 우리는 '사회화' 과정 이라고 일컫습니다.
​ 실제로 모든 AI의 시작은 갓난 아이와 같습니다. 우리는 아이를 키울 때 처럼 다양한 정보를 알려주고 정확히 인지하는지 확인하는 일종의 'AI의 사회화' 과정을 통해 비로소 실제 사용 가능한 인공지능 모델을 확보할 수 있습니다. ​ enter image description here

(아이들을 가르치듯, AI를 가르치는 과정도 필요합니다)

​ 이처럼 AI에게 인간 사회의 다양한 요소들을 인지시키는 사회화 과정 중 인간의 두 눈을 통해 보고 인지하는 일을 카메라와 데이터 입력을 통해 수행하고자 할 때 AI에게는 '데이터 라벨링'이 필요합니다.
​ ​ enter image description here ​ 위 사진을 보면서 우리는 개와 고양이를 너무나 자연스럽게 떠올리지만, 학습되지 않은 AI는 그렇지 못합니다. 따라서 다양한 표본을 보여주고 개와 고양이임을 정확히 인지하도록 학습시키는 과정이 필요한 것이죠. ​ 하나씩 AI에게 학습하는 과정을 거친 이후에는, 응용 학습으로 길 위의 차량들과 보행자들을 학습시킬수도 있습니다. 해당 데이터를 학습한 AI는 또 다시 응용되어 개별 차량의 자율 주행, 도로 위 단속 카메라 등 다양한 분야에 적용될 수 있죠. ​ enter image description here

(데이터 라벨링을 응용한 자율 주행 방식)


​ ● DS2.ai의 오토(Auto) 라벨링
​ 데이터 라벨링에 대한 설명을 통해 결국 중요한 부분은 얼마나 빠르고 정확하게 AI를 사회화 시킬 수 있는가 하는 것이 곧 라벨링 경쟁력임을 깨달으셨을 겁니다.
​ 흔히 데이터 라벨링 작업을 ‘현대판 인형 눈알 붙이기’ 로 이야기 하기도 하는데요, 그러나 실제로 사람이 직접 모든 데이터를 하나씩 학습시킨다면 산업군에서 실제 활용하기까지는 많은 시간과 인건비가 필요할 것 입니다.
​ DS2.AI는 과거 인류가 인형의 눈알을 붙이는 공장을 만들어 효율을 대폭 상승시켰듯, 데이터 라벨링을 자동적으로 수행하는 딥러닝 기반의 데이터 라벨링 자동화 인공지능을 개발했습니다. 약 10여개의 표본 라벨링만 수행해주면, 똑똑한 인공지능이 표본을 바탕으로 이후 수 많은 데이터들을 자동으로 처리하는 것이죠.
​ 이를 통해 DS2.AI의 오토 라벨링은 기존 시장의 데이터 라벨링 단가의 20% 정도의 가격으로 작업을 진행합니다. 소요되는 시간 역시 최초 표본 데이터 작업 이후에는 전 자동으로 이루어지다 보니, 저희 고객사 (주)오토노미아(Success Stories 링크 연결)의 사례로 설명하자면 2~3년은 걸리는 데이터 라벨링 구축 작업을 6개월 정도만에 완료하기도 했습니다.
​ 뿐만 아니라 DS2.AI의 라벨링 자동화 인공지능은 프로젝트가 바뀌어도 소량의 표본 데이터만 바꿔준다면 똑같은 성능으로 자동 라벨링을 수행합니다. 마치 목적에 따라 내부 생산 라인을 금방 변화하고 수용하는 스마트 공장 같은 녀석인 셈입니다. ​ ​ enter image description here

(딥 러닝 기반 데이터 라벨링의 소요 공수 차이)

Summary

​ 이번 포스팅에서는 데이터 라벨링이 각 산업군에 활용될 수 있도록 AI를 학습시키는 중요한 ‘사회화’ 과정임을 살펴보았습니다.
​ DS2.AI는 타사와 달리 데이터 라벨링의 전 과정을 자동화 했다는 점을 강조드리면서, 다음 시간에는 이러한 자동화 기술의 도입이 개인 데이터 라벨링 작업자들을 활용하는 ‘크라우드 소싱’에 미칠 영향에 대해서 살펴보도록 하겠습니다.
# ​ DS2.ai의 자동 물체인식을 도와드리는 Labeling AI 솔루션과 이를 직접 활용해 비즈니스에 접목시킨 고객 사례도 확인해보세요!