데이터 분석가, 데이터 엔지니어 그리고 데이터 과학자

데이터, 나아가 인공지능을 다루는 작업에는 데이터 분석가와 과학자, 엔지니어 등의 인력이 포진해있습니다. 그들의 업무는 어떻게 유사하고 또 무엇이 다른지, 차이를 함께 확인하시죠.

Featured image

데이터 분석가, 엔지니어 그리고 과학자


빅데이터 그리고 인공지능의 활용을 위한 작업 단계에서 데이터를 다루는 큰 전문가 유형이 존재합니다, 크게 데이터 엔지니어, 분석가와 데이터 과학자로 구성되어 있죠.

오늘은 각 직업의 특징과 차이에 대해서 살펴보며 실무에서 어떠한 작업을 통해 유의미한 결과물을 만들어 내는지에 대해 살펴보겠습니다.


정확히 무슨 일을 하나요?

데이터 분석 분야의 진로를 꿈꾸시는 분들께서 가장 많이 고민하시는 분야 중 하나가 업계에서 통용되는 데이터 분석에 관한 확실한 구분이 모호하다는 점 일 것입니다.

금융업, 솔루션 서비스 제공업, 마케팅 대행업 등 다양한 전문 분야에서 ‘데이터’를 분석하고 가공, 활용하는 방식이 다르다보니 이러한 일들이 생겨납니다.

세밀한 기준으로는 데이터 분석가, 데이터 엔지니어, 데이터 과학자 등 다양한 범주의 전문 영역들이 존재하지만 사업과 조직의 규모에 따라 그 경계가 모호해 여러가지 분야를 수행하는 경우도 종종 발견되곤 하죠.

그리고 데이터를 다루는 분야 자체가 비교적 최근 들어서야 그 규모가 커지고 있기에, 아직까지 명확한 구분을 지어줄 수 있는 기준점이 분명하지 않다는 점 역시 원인으로 꼽을 수 있겠습니다.

그럼에도 대다수의 전문가들이 동의하는 명확한 구분점이 존재합니다. 바로 '무엇을 목표로 업무를 하는가'인데요, 이를 구체적으로 살펴보면,

  1. 데이터 분석가 : 비즈니스적 결정을 서포팅합니다. 축적된 데이터를 기반으로 의사결정자에게 설명하고 더 나은 결정을 할 수 있도록 보조하죠. 시각화/커뮤니케이션과 비즈니스적 시각에 조금 더 치중해 있습니다.

  2. 데이터 엔지니어(개발자) : 날 것의 데이터를 가지고 필요한 부분을 추출하는 능력 자체에 더욱 주목합니다. 데이터를 분석하거나 유의미한 결과를 도출한다기 보다는 실제 사용할 수 있는 데이터를 찾는 일에 힘씁니다.

  3. 데이터 과학자 : 분석가에 비해 실무에서 축적된 분석 알고리즘과 기술, 시스템의 성능 향상과 같은 근본적인 영역에 주목합니다. 머신러닝 및 딥러닝을 활용해 정확한 데이터 분석에 더욱 힘쓰죠.

enter image description here

(표 형태로 살펴보는 각 포지션 별 역할과 책임)

enter image description here

(특징 중심의 3개의 포지션 일러스트. 출처 : edureka)


데이터 과학자와 분석가

눈썰미가 좋은 분들이시라면, 앞서 비교한 세 분야의 특징 중 데이터 분석가와 과학자의 역할에서 꽤나 유사한 점이 많음을 발견하셨을 겁니다.

두 직종 모두 수집된 데이터를 분석하고, 이를 기반으로 필요한 전략과 계획을 수립하는 역할을 맡고 있죠. 때문에 분석가와 과학자의 경계를 어떻게 보아야 하는지, 데이터 분석가의 상위 레벨이 데이터 과학자인지 등 다양한 주제에 대해서는 전문가들 사이에서도 의견이 갈리는 상황입니다.

의견 1 : 데이터 과학자 ≒ 데이터 분석가 + 데이터 엔지니어

하나의 의견은 데이터 과학자가 데이터 분석의 능력과 코딩 능력 기반의 개발 역할까지 동시에 수행 가능한 상위 레벨의 직군이라는 쪽입니다.

실제로 해외의 데이터 분야 종사자들의 대부분이 이런 의견을 피력하는데요. Linked IN의 프로필 조사 결과 데이터 과학자로 스스로를 칭하는 비율이 데이터 분석가보다 약 3배 이상 많다고 하니, 은연중에 1번 의견에 동의하는 종사자들이 적지 않은 상황입니다.

enter image description here

(데이터 과학자는 개발과 분석의 교집합이라는 주장)


의견 2 : 데이터 과학자 ≠ 데이터 분석가

한 편으로 데이터 과학자와 분석가의 역할은 엄연히 구분되어야 한다는 의견도 존재합니다.

해당 의견을 주장하는 측의 입장은 시대의 흐름에 따라 유행하는 주제와 단어에 치중되어 직무의 가치나 중요도가 과대 평가 혹은 평가 절하를 당하고 있음을 주장합니다.

데이터 분석가의 핵심 업무는 비즈니스적인 결정과 연결되어 즉각적으로 실행 가능한 인사이트를 얻는 데에 더 중점을 두며, 이는 데이터 과학자의 역할과는 분명히 구분되는 고유의 자질이라고 강조하죠.

enter image description here

(데이터 활용 분야는 공통 영역이 존재하나, 고유의 영역과 차이가 분명히 존재한다)



데이터 활용의 궁극적 목표를 위해, DS2.ai의 활용

데이터 활용 직군 중 일부의 R&R은 그 범위가 방대하고 통용되는 명확한 기준이 없으나, 누적된 데이터를 활용해 필요한 판단과 조치를 취하는 것이 궁극적인 목표임에 틀림 없습니다.

저희 DS2.ai는 직무의 차이보다는 각 직무에서 필수적이라고 판단되는 역할을 도와드리는 쪽에 집중했습니다. 3 종류의 핵심 직무를 맡아 작업하시는 데이터 전문가들의 수고를 덜어드릴 수 있는 형태로 기능을 제공하죠.
가령 데이터 엔지니어가 AI 모델을 개발하고자 할 때, Click AI 솔루션을 활용해 기존에 사용되는 양질의 데이터를 제공하고, Skyhub AI로 인공지능이 학습하고 배포 되는 서버 환경 등을 제공하죠.

enter image description here

(엔지니어의 모델링을 위한 Click AI 솔루션에서 제공하는 기능)

enter image description here

(모델 배포와 운영을 위한 Skyhub AI 솔루션에서 제공하는 기능)



데이터 분석가와 과학자의 데이터 활용도 증가를 위해서도 Click AI 솔루션의 Auto ML 활용 - Feature Importance 기능 및 처방적 분석 기능을 활용해 업로드한 데이터 중 어떤 항목이 가치가 있는지, 추후에 어떤 방식으로 활용 가능한지 등 다양한 정보를 도식화 해 직관적으로 보여주어 의사결정을 돕습니다.


enter image description here

(수집된 데이터의 중요도를 도식화 형태로 보여주는 Feature Importance 기능)

enter image description here

(데이터의 흐름 및 다양한 포맷의 결과를 보여주어 의사 결정에 도움을 주는 처방적 분석)


Summary

오늘은 데이터 활용 분야 중 대표적인 3 직종과 DS2.ai를 활용하여 얻을 수 있는 이점에 대해 살펴 보았습니다.

뻔한 얘기일 수 있겠지만, 주목도와 발전 가능성이 높은 분야인 만큼 앞으로 변화하게 될 흐름 속에서 본인의 능력을 중심으로 굳건히 뿌리를 내릴 수 있도록 정진하는 것이 직무를 막론하고 핵심을 관통하는 사안이겠습니다. 디에스랩글로벌 역시 데이터 활용 분야에 긍정적으로 이바지할 수 있도록 지속적인 양질의 솔루션 제공에 힘쓰겠습니다 :D

저희는 이후에 또 다른 주제로 찾아뵙도록 하겠습니다!

References : Science On, Swaastick Kumar Singh, Edureka Blog

데이터 엔지니어 및 분석가, 과학자의 원활한 작업을 돕는 Click AISkyhub AI를 직접 방문해 다양한 기능들을 확인해 보세요!