Share on facebook
Share on linkedin
Share on twitter
Share on facebook
Share on linkedin
Share on twitter

[기고] 자동화 머신러닝을 둘러싼 오해 바로잡기

머신러닝(기계학습, 이하 ML)은 여러 업계에서 데이터 수집과 분석 도구를 최적화하는 데 사용되면서 그 활용의 폭을 넓혀 왔다. 그러나 최근에는 자동화 머신러닝, 줄여서 오토ML(AutoML)이라 불리는 새로운 기술이 떠오르고 있다.

이 기술을 활용하면 고도로 전문화된 역량 때문에 공급이 부족하고 몸값이 비싼 데이터 과학자에 대한 의존도를 줄일 수 있다고 알려져 있다. 오토ML과 관련된 많은 오해 중에서 가장 만연한 것은 이 기술이 데이터 과학자를 완전히 대체할 수 있다는 오해일 것이다.

ML은 놀랍도록 다양한 분야에서 응용 가능하고 대단히 강력한 범용 기술이다. 따라서 이 기술이 오토ML로 한 단계 더 진화했다는 사실에 사람들이 환호하는 것은 당연한 일이다. 오토ML의 기능을 이해하려면 기존의 ML이 어떻게 작동하는지 먼저 알아야 한다.

ML은 여러 단계를 거쳐 작동한다. 우선 관련 데이터를 수집한 다음 원하는 내용만 학습하도록 데이터를 정리한다. 그 뒤 데이터의 대표적인 특징을 정의하고, 미리 설정된 목적을 달성하기 위해 정확도를 최적화하도록 훈련된 모델에 이 특징을 집어넣는다. 인간의 개입이 많이 요구되는 복잡한 작업이다. ML을 최대한 효과적으로 활용하려면 고도로 훈련된 데이터 과학자들로 구성된 팀을 동원하여 각 단계마다 개입하면서 모델을 구축, 적용, 최적화해야 한다.

오토ML의 궁극적인 목표는 이 모든 과정을 자동화해 효율성을 높이고 비용은 낮추는 데 있다. 제대로 작동할 경우 업종을 막론하고 다양하게 적용돼 사회의 여러 부문을 혁신할 수 있다. 오토ML이 많은 관심을 받는 이유다.

■ 데이터 과학자 역할 변화 초래

그러나 많은 신기술이 그렇듯이 현실은 좀 더 복잡하다.

오토ML이 얼마나 유용한지는 업종, 데이터 유형, 관련된 모델 클래스에 따라 다르다. 디지털 마케팅은 특히 데이터 수집과 정리의 측면에서 오토ML의 혜택을 크게 볼 수 있는 분야다. 고객이 기업의 마케팅 캠페인과 상호작용하면서 데이터 레이블이 자연스럽게 생성되기 때문이다. 이런 레이블을 정리해 불필요한 정보와 편향을 제거하는 도구들이 이미 시장에 구축돼 있다.

다른 업종에서는 데이터 수집과 정리 면에서 그렇게 유용하지는 않지만 자동 특징 구성공학(automatic feature engineering) 부문에서는 힘을 발휘하고 있다. 예를 들어 자율주행차는 보행자와 정지 신호를 구별하려면 인간의 도움을 필요로 한다. 마찬가지로 의료 영상 도구가 종양을 찾아내려면 숙련된 의사가 있어야 한다. 그러나 인공 신경망을 사용해 원본 이미지로부터 특징을 자동 구성하는 기술은 이미 많은 데이터 과학자의 수고를 덜어주고 있다.

그렇다고 과학자들이 오토ML을 무분별하게 적용해서는 안 된다. 무엇을 얻고자 목표하든 오토ML이 인간의 지식을 완전히 대체할 수는 없다. 그보다는 지식을 어느 지점에 적용할 것인지 그 포커스가 바뀌는 것으로 이해해야 한다.

가령 마케팅 분야에서는 인간이 수동으로 수행하는 것보다 훨씬 효과적인 프로세스만 자동화한다. 보통 이 프로세스는 반복적이고 복잡하며 이용 가능한 데이터도 충분한 편이다. 이를 통해 인간은 반복적인 업무에서 벗어나 데이터가 덜 축적된 영역에 자신의 지식을 적용할 수 있다.

그러므로 오토ML 기술이 아무리 발전했다 하더라도 데이터 과학자의 개입을 완전히 제거할 수는 없다. 이렇게 인간과 기계가 협력하여 일하는 접근법을 일각에서는 세미-오토ML(또는 반자동ML)이라고도 부른다. 실제로 기술이 구동되는 과정을 보다 사실적으로 반영한 용어다.

■ 효과와 비용 따져 보고 결정해야

기업이 오토ML의 효과와 작동 방식을 이해하기만 하면 오토ML을 활용해 큰 효과를 볼 수 있다. 핵심 인력 리소스를 줄일 수 있고 기계는 이런 작업을 인간보다 훨씬 빠르게 수행하기 때문에 효율이 높아진다. 적절히 사용하면 인간의 오류 위험을 최소화하면서 인간보다 뛰어난 성과를 낼 수 있다.또한 절차가 자동화되면 수동일 때보다 훨씬 효율적으로 규모를 확대할 수 있다.

그러나 종종 간과되는 요소도 몇 가지 있다. 가장 대표적인 것이 비용이다.

오토ML의 성배는 신경 구조망 탐색(neural architecture search)에 있다. 주어진 문제를 해결하기에 가장 적합한 신경망 아키텍처를 찾아내도록 AI를 프로그래밍하는 기능이다. 일단의 연구자들이 신경 구조망 탐색을 완전히 자동화 해 동일한 작업을 수행하는 인간보다 더 높은 성과를 낼 수 있음을 입증했으나, 이에는 막대한 규모의연산력이 요구된다. 예를 들면 12개 이상의 CPU를 며칠 동안 훈련해야 하는데, 그 비용이 상당히 크다. 따라서 오토ML을 활용하고자 하는 기업은 소요될 재정적, 시간적 비용과 잠재적 이익을 가늠해 현명한 결정을 내려야 한다.

또한 오토ML은 인간의 오류를 최소화하는 데 도움이 되지만, 이 또한 완전히 제거하지는 못한다. 오토ML은 사용자가 정의한 항목만 최적화하므로 항목을 잘못 정의하면 만들어진 모델이 문제를 해결할 수 없다. 이는 오토ML에만 국한된 문제는 아니다. 인간은 일반적인 ML에서도 똑같은 실수를 저지르지만, 여기서도 이미 개입돼 있는 인력이 오작동하는 모델의 행동을 파악하고 이를 바로잡도록 도움을 줄 수 있다. 따라서 인력을 줄여서 효율을 높일 수는 있겠지만 자칫 잘못하면 더 많은 오류를 초래할 위험이 있다.

■ 실제 비즈니스에 적용할 현실적인 대안

물론 실제 비즈니스에서 이 균형을 잡기가 쉽지는 않다. 인력 자원을 충분히 투입했을 때의 장점과 단점을 잘 가늠해 자사의 비즈니스 모델에 어느 쪽이 최선인지 결정해야 한다. 예를 들어 모든 단계에 인력을 투입해 작업을 수행하면 모델을 확장하기가 힘들 것이다. 반대로 모델을 구축할 때마다 전체 프로세스를 자동화하면 너무 많은 시간이 소요될 것이다. 보통 마케터에게는 시간 여유가 없다. 적당한 시기를 놓치지 않고 바로 뛰어들 수 있는 것이 중요하다.

오토ML을 적절히 활용하면 기업에, 특히 마케팅에 많은 도움이 될 수 있다. 하지만 그 작동 원리, 관련 제반 여건, 우리 기업과의 호환성을 현실적으로 따져보고 난 후에야 그 잠재력을 완전히 활용할 수 있을 것이다.

 

* 이 글은 지디넷코리아에 게재된 기고입니다. 원 기고는 여기서 확인할 수 있습니다.

 

애피어에 문의하세요!

문의를 남겨주시면 마케팅 전략을 개선할 수 있는 방법을 찾을 수 있도록 안내해드리겠습니다.

다른 최신 포스트도 둘러보세요!

전문가에게 묻다: The Drum의 발행인 샤를로트 맥엘레니의 APAC 지역 마케팅 실태

샤를로트 맥엘레니(Charlotte McEleny)는 글로벌 마케팅 전문 미디어 더드럼(The Drum)의 아시아 지역 담당 발행인으로서 싱가포르에 근거를 두고 아태지역의 흥미로운 광고 및 마케팅 뉴스와 인사이트를 찾아 제공하는 일을 하고 있습니다. 과거 10년 동안 런던에서 다수의 마케팅 전문지에 근무했으며, Marketing 지의 디지털 편집자 시절 PPA 디지털 어워드에서 베스트 디지털 팀 상을 수상한 바 있습니다. 애피어는 최근 샤를로트를 만나 아태 지역의 최신 마케팅 실태에 대한 견해를 들어봤습니다. 마케팅 및 광고 업계에 종사하고 계신 분들에게 해당 업계 최신 정보를 알리는 일을 하고 계신데요. The Drum에 대해 간단히 소개를 부탁드립니다. The Drum은 사람들에게 마케팅 및 광고 업계에서 벌어지는 일들을 알리기 위한 글로벌 마케팅 전문 간행물입니다. 저희는 마케팅이 세상을 바꿀 수 있다고 믿고 있으며, 이 업계 종사자들 또한 자신의 업무가 세상을 긍정적으로 만드는 데 기여한다고 믿도록 힘을 주고자 합니다. 이를 위해 뉴스, 콘텐츠, 행사 등 다양한 방식으로 소통하고 있습니다. B2C 브랜드의 경우, 2020년도 마케팅 기술을 어떻게 전망하고 있나요? 전반적인 전망과 현재 글로벌 상황(코로나19)과 관련된 전망을 모두 말씀해 주세요. B2C 브랜드의 입장에서는 두 가지에 대한 답이 같습니다만 현재 상황이 그 답을 더욱 증폭시킨다고 말할 수 있습니다. 제가 대화를 나눠 본 수많은 브랜드는 이커머스를 개선하려 하고 있습니다. 보다 인간적이면서 사람들이 오프라인에서 하는 경험을 대신할 수 있는 이커머스 서비스를 만들려는 것입니다. 현재 옴니채널 논의가 진행 중이고 온갖 트렌드가 난립하고 있는데요.

인공지능(AI)을 통한 광고 품질 개선으로 마케팅 효과 극대화

잠재고객에게 광고가 효과를 발휘하려면 몇 번이나 보여주어야 할까? 이것은 수 십년 전부터 이어져 내려온 마케팅 업계의 딜레마이다. 그리고 이 문제는 디지털의 등장과 함께 한편으로는 관리가 쉬워졌으면서 다른 한편으로는 관리가 더 어려워진 두 측면을 모두 지니고 있다. 이 광고 효과와 관련된 문제는 단순히 수량에 국한되지 않고, 광고의 품질과도 관련이 있다. 높은 품질의 광고란 최적의 예상 고객군을 찾아내고 이들을 정확히 타겟팅하는 것을 의미한다. 이러한 작업이 바로 인공지능(AI)이 활약할 수 있는 영역이다. 프리퀀시 캐핑(Frequency Capping)만으로는 충분하지 않은 이유 프리퀀시 캐핑 기능은 확실히 특정 개인과 광고 캠페인의 접촉 횟수를 제한하여 광고 노출을 통제하는 데 도움이 된다. 하지만 과연 몇 번이 최적의 횟수인지를 판단하는 것은 여전히 난제로 남아 있다. 노출 횟수가 너무 적으면 잠재고객이 광고를 알아 차리지 못하거나 충분한 정도로 알아차리지 못할 수가 있다. 반면, 노출 빈도가 너무 높으면 기억에 남는 수준을 넘어 성가시게 느껴질 수 있다. 이로 인해 캠페인 참여는 낮고 심지어 브랜드 이미지에 타격을 줄 수도 있다. 그 동안 이 문제에 대한 해답을 찾기 위한 많은 연구가 있었다. P&G(Procter & Gamble) 처럼 디지털 광고 노출 횟수를 월 3회로 제한하는 브랜드가 있는 반면, 페이스북(Facebook)은 주 1-2회 정도의 빈도로 최소 10주간 노출해야 최고의 캠페인 효과를 발휘한다고 주장하고 있다. 최적의 광고 노출 횟수는 광고 매체, 범주, 목적, 형태에 따라 각기 달라질 수 있기 때문에 정답을 찾는

지금 고객 인게이지먼트 마케팅이 필요한 이유

광고는 소비자의 관심을 끄는 데 효과적이다. 하지만 대부분 단발성 거래로 끝나는 경우가 많다. 충성도 높은 VIP 고객을 많이 확보하려면 고객이 제품이나 서비스 구매에서 그치지 않고 브랜드 자체를 좋아하고 브랜드가 추구하는 가치에 동의하도록 만들어야 한다. 이를 위해 필요한 것이 인게이지먼트 마케팅, 즉 의미 있는 고객 참여 프로그램 구축이다.   인게이지먼트 마케팅의 의미와 중요한 이유 인게이지먼트 마케팅은 고객이 관심을 갖고 참여할 만한 관련성 높은 콘텐츠를 사용하여 그들이 주로 이용하는 채널을 통해 의미 있는 대화를 시도하는 마케팅 전략이다. 브랜드와의 상호작용을 유도함으로써 연결성을 강화하고, 장기적인 관계를 구축하고, 구매 및 브랜드 충성도로 이어질 수 있도록 한다. 인게이지먼트 마케팅 전략을 구현한다는 것은 이메일, 블로그, 소셜 미디어, SMS 및 푸시 알림 등의 다양한 채널을 통해 고객에게 가치 있고 개인화된 콘텐츠를 전송하여 고객 참여를 높이는 것을 의미한다. 여기서 인게이지먼트 즉, 참여는 콘텐츠 클릭, 좋아요, 공유 및 댓글에 이르기까지 모든 형태의 반응이다. 행동을 장려하거나, 윤리적 공감을 구하거나, 맥락이 일치하거나, 편리성을 제공하거나, 감성을 자극하는 등 다양한 유형의 참여를 생각할 수 있다. 고객 참여를 효과적으로 구현하면 잠재고객은 브랜드가 자신을 이해한다고 느끼고 나아가 스스로 브랜드에 대한 소속감을 갖게 된다. 이는 결과적으로 고객의 행동을 유도하고, 충성도를 높이고, 고객 이탈을 줄인다. 인게이지먼트 마케팅은 그 어느 때보다 큰 힘을 가진 요즘 소비자들의 요구를 충족하는 데도 도움된다. 마케팅 전략의 중심에 소비자를 두기 때문이다. 또한, 유용한 정보를

    저희가 도와드리겠습니다

    문의를 남겨주시면 마케팅 전략을 개선하는 데 도움될 AI 솔루션을 자세히 안내드리겠습니다