5 min to read
더욱 효과적인 AI 활용을 위해서 : XAI & 처방적 분석
딥러닝 인공지능의 알고리즘을 파악하고, 수집된 데이터를 올바르게 분석하고 활용하는 방안인 XAI와 DS2.ai의 방식에 대해 살펴보시죠.
더욱 효과적인 AI 활용을 위해서 - XAI & 처방적 분석
● Intro
딥러닝을 기술을 이용한 AI의 활용은 인공지능 기술의 비약적인 발전과 시장 규모 증가를 가져왔습니다. 그러나 딥러닝 기반 인공지능의 알고리즘이 블랙박스(내부 진행 과정을 알 수 없는 형식)구조로 되어 있어 도출 결과의 이유를 쉽게 알 수 없다는 문제가 있지요.
이번 포스팅에서는 이러한 내부 알고리즘을 설명 가능한 AI, Explainable AI (이하 XAI) 및 데이터 분석의 단계 라는 2 가지 주제에 대해 DS2.AI는 어떻게 접근하고 있는지 다뤄보겠습니다.
● 결과 도출 과정, 꼭 설명할 수 있어야 할까요?
주변에서 일어나는 다양한 현상에 대해 우리 모두가 ‘Why?’를 궁금해하고 행동하지는 않습니다. 우리 모두는 잠을 자고 일어나 숨을 쉬고, 보고 듣지만 그 모든 작용이 왜 일어나고 무엇이 주요한 요소인지에 대해서 진지하게 고민하는 경우는 드무니까요. 그러나 인공지능을 활용할 때는 분명히 필요한 과정입니다.
우선, AI가 필요한 분야가 다양해지고, 많은 일을 처리하기 위해서는 고도화가 필연적입니다. 그러나 개발자가 알고리즘 프로세스를 확인할 수 없다면 모든 변수에 대해 직접적인 확인 과정을 거쳐야 하니 공수 부담이 증대될 수 밖에 없지요. AI의 적용 범위가 빠르게 늘어나지 못할 것입니다.
또, 우연히 정확도가 높은 AI를 개발했다고 해도 도출 과정을 설명하지 못한다면 활용 가능성은 매우 낮아질 것입니다. 간단한 이야기로 생각해볼까요? 훗날 AI가 실생활 곳곳에 녹아들어 어떤 영화처럼 특정 인물의 잠재적 범죄 유발 가능성을 측정하는 시대가 왔다고 가정 해보겠습니다.
어느 날 내가 잠재적 범죄자로 지목당했다는 통보를 받으면 어떨까요? 제일 먼저 왜 내가 지목당했는지, 어떤 요인이 영향을 준 것인지를 묻게 될 것입니다. 이 때 ‘범죄 가능성을 파악하는 AI의 복잡한 알고리즘에 의해 선택되었을 뿐입니다’ 라는 답변을 듣는다면, 그건 합리적이고 정당한 이유로 받아들여지지 않을겁니다. AI 자체에 대한 신뢰도 역시 확보될 수 없겠지요.
따라서 AI를 개발하고 도입하는 모든 과정에서 작동 원리와 변수들을 처리하는 프로세스에 대한 설명이 가능해야만(explainable) 유의미한 인공지능 모델로서 활용이 가능해집니다.
(고도화된 인공지능이라도 과정을 설명할 수 없다면 유의미한 모델로 보기 어렵다)
● DS2.ai의 XAI
이러한 관점에서 저희 디에스랩글로벌은 AI 모델 제작 프로젝트를 완료하면 데이터들과 변인이 어떻게 사용되었는지를 수치 및 도식으로 보여드릴 수 있도록 개발했습니다.
소개드리는 프로젝트는 ‘은행 예금 예측’과 관련된 내용입니다. 프로젝트가 완료되면 정확도와 Error rate를 통해 간략히 모델의 신뢰도를 보여주고, 우측의(붉은 박스) 메뉴들을 통해 상세한 내용을 확인할 수 있습니다.
■ Feature Importance : 해당 결과를 도출하는 과정에서 사용된 비중이 높은 데이터를 보여줍니다. 현재 ‘은행 예금 예측’ 프로젝트에서는 ‘분기별 고용 변동률’이 가장 주요한 변수로 선정되었음을 확인할 수 있습니다.
■ Kappa-Coeff (위) & Loss (아래) : 각 그래프의 지표를 통해 모델의 신뢰도를 파악할 수 있습니다. 해당 모델 자체를 얼마나 믿을 수 있고 실제로 이용가능한지 정도를 파악할 수 있죠.
소개한 대표적인 요소들 외에도 DS2.AI는 정밀한 데이터의 활용 정도와 신뢰도 확인을 전제로 한 뒤, 도출된 결과를 분석 및 활용하는 프로세스로 진행됩니다.
● 합리적인 데이터를 바탕으로 진행되는 처방적 분석
이처럼 알고리즘의 작동 과정과 주요 변인들을 파악하는 환경을 조성한 이후, 저희는 조금 더 욕심을 내서 고객에게 데이터 분석 뿐 아니라 적합한 가이드까지 제공해줄 수 있는 알고리즘을 만드는 것을 목표로 삼았습니다.
우선 데이터 분석의 유형 4단계에 대해 간략히 설명드리면
1) 설명적 분석 : 과거 또는 현재 발생한 사실을 다양한 기준으로 설명한다.
2) 진단적 분석 : 데이터를 이용해 특정 문제의 원인을 파악한다.
3) 예측적 분석 : 미래 상황 등 미지의 사실을 예측한다.
4) 처방적 분석 : 분석의 단계를 넘어 구체적인 행위를 가이드한다.
이상 4가지 분석 단계가 존재합니다.
(데이터 분석 유형 단계도. 우상향으로 갈수록 구현이 어렵지만 높은 가치 창출이 가능하다)
앞서 설명드렸던 XAI를 바탕으로 분석되는 결과는 데이터 분석의 1~3 단계를 설명하는 역할을 합니다.
('은행 예금 예측' 프로젝트 중 "진단적 분석" 단계)
해당 그래프들을 통해 우리는 어떤 변수가 어떤 수치를 가졌을 때 영향을 어느정도 미치는지에 대해 파악할 수 있습니다.
이를 활용해 복기가 가능하고 어떤 변수를 조정해야 유의미한 다른 결과가 나올거라는 간단한 예측이 가능합니다. 그러나 간단한 예측만으로는 유의미한 성과를 내기에 부족하죠.
(① - '은행 예금 예측' 프로젝트 분석 중 "처방적 분석" 단계)
(② - '은행 예금 예측' 프로젝트 분석 중 추가 변수 선정)
DS2.AI는 그림 ①과 같이 직접적인 영향을 줄 수 있는 변수들을 고려해 고객님께서 수행해야 할 작업을 알려줍니다.
고객을 관리하는 직원을 6.5% 늘리고, 고객과의 연락 빈도를 5% 늘리고 최종적으로 5월 달에 연락했다면 5월 달 고객이 은행을 이용할 확률이 약 77% 증가한다는 가이드를 제공하는 것이죠.
그 밖에 그림 ②처럼 경영진이 추가로 염두해야 할 변수들이 무엇인지 알려주어 최대한 리스크가 적은 결정을 내리도록 돕습니다. 은행 예금 예측 프로젝트를 기준으로, 기 선정된 3가지 변수 외에 ‘소비자 신뢰지수’와 ‘소비자 물가 지수’가 총합 10% 정도의 영향을 미칠 수 있다는 것을 보여주죠.
Summary
오늘 포스팅에서는 XAI 및 처방적 분석의 필요 이유와 DS2.AI의 알고리즘 분석 과정에 대해 살펴보았습니다.
앞으로 인간이 수행하는 많은 일들을 전담할 것으로 주목받는 AI인 만큼, 정확하고 합리적인 AI 모델 제작 및 데이터 분석이 수반되어야 합니다.
디에스랩글로벌은 믿을 수 있는 정보를 제공하는 기업으로 거듭날 것임을 약속드리면서, 이후 다른 주제로 찾아뵙도록 하겠습니다.
DS2.ai의 자동 물체인식을 도와드리는 Click AI 솔루션과 이를 직접 활용해 비즈니스에 접목시킨 고객 사례도 확인해보세요!
References : Should AI Explain itself? 데이터 분석의 4가지 유형