Share on facebook
Share on linkedin
Share on twitter
Share on facebook
Share on linkedin
Share on twitter

[기고] 데이터 기반 마케팅 구현을 위한 데이터 관리 첫걸음

“데이터를 귀중한 자원으로서 수집하고, 정제하고 활용해야”

전문가 칼럼 | 민선, 애피어 최고 AI 과학자 

역사적으로 마케팅은 항상 데이터에 크게 의존해 왔다. 요즘과 같이 빠르게 변화하는 세상에서 데이터 기반 마케팅의 화두는 서로 다른 다양한 소스로부터 발생하는 엄청난 양의 데이터를 어떻게 잘 관리할 것인가 하는 점이다.

마케팅 데이터 관리와 관련해서 중점을 둬야 할 핵심 이슈는 세 가지로 정리할 수 있다. 첫 번째는 데이터 품질이다. ‘무가치한 데이터를 넣으면 무가치한 결과가 나온다(Garbage in, garbage out)’라는 GIGO의 법칙은 마케팅에서 염두에 둬야 할 일리 있는 격언이다.

데이터 품질이 보장됐다면 고려해야 할 두 번째 요소는 데이터의 유용성이다. 어떤 데이터가 가치 있고, 어떤 데이터 세트를 함께 살펴봐야 의미 있는 결과를 얻을 수 있는가를 판단해야 한다.

마지막으로 강력한 거버넌스, 즉 관리 규정을 확립해야 한다. 유럽연합의 일반개인정보보호법(GDPR, General Data Protection Regulation), 싱가포르의 개인정보보호법(PDPA, Personal Data Protection Act) 등 관할 지역별로 따라야 할 법적 및 기업 의무가 포함된다.

데이터 기반 마케팅 구현을 위한 데이터 관리 첫걸음(제공=애피어)

 

‘좋은’ 데이터란 무엇인가? 

데이터 품질이 좋다 좋지 않다를 규정하기 위해서는 여러 차원에서 살펴봐야 한다. 일관된 오류 또는 비일관적으로 반복되는 데이터 노이즈와 같은 문제는 데이터 세트가 엄청나게 크더라도 그 유용성과 가치를 크게 감소시킬 수 있다.

데이터가 완벽하게 정확하더라도 데이터를 선택할 때 기준으로 삼은 가정 자체가 편향되거나 왜곡된 경우에는 훨씬 더 미묘한 문제가 발생할 수 있다. 이렇게 수집된 데이터는 결과적으로 인공지능(AI) 모델이 잘못된 결과를 도출하는 원인으로 작용한다. 물론 데이터를 선택하는 과정에서 차용한 일부 편향이 유용한 경우도 있지만, 그 편향 자체를 인지하고 이해하는 것이 무엇보다 중요하다.

편향을 인지하기만 하면, 데이터의 편향을 해제해 머신러닝 및 AI 알고리즘에 미치는 영향을 제거할 수 있다.

데이터의 빈도, 최신성 및 기간 범위도 품질에 영향을 미친다. 새 데이터와 이전 데이터가 모두 유용하지만 일반적으로 마케팅에서는 보다 최근의 데이터를 더 선호하는 편인데, 관련성이 더 높기 때문이다. 또 추세 분석이나 원인과 결과를 이해하는 데는 새 데이터와 이전 데이터를 모두 살펴보는 것이 더 좋은 결과를 낸다. 그리고 광범위한 기간을 커버하는 데이터는 마케팅에서 강력한 힘을 발휘할 수 있다.

 

마케팅에 사용할 수 있는 데이터 소스는 무엇인가?

마케터가 사용할 수 있는 데이터가 너무 많기 때문에, 어떤 소스의 데이터가 가장 가치 있고 어떻게 사용할 수 있는지 그 방법을 아는 것이 중요하다. 대부분의 경우 데이터는 크게 고객의 온라인 행동 데이터와 오프라인 행동 데이터의 두 그룹으로 나눌 수 있다. 둘 다 기존 고객을 이해하고 그들에게 매력적인 상품이나 서비스를 제안하는 데 똑같이 의미 있는 작용을 한다.

요즘은 웹사이트에서의 고객 행동과 같은 온라인 데이터를 대량으로 확보할 수 있다. 여기에는 고객이 구매한 제품, 결제를 완료한 시점, 재방문 여부 등이 포함된다. 또한 오프라인 데이터 소스도 풍부하다. 실제 매장 방문, 고객 센터로 걸려 온 문의 전화, CRM 데이터 등이 포함된다.

일반적으로 온라인 데이터는 규모가 매우 큰 반면, CRM 및 금융 거래 관련 신청과 같은 오프라인 데이터 소스는 고객이 구매할 때 사용한 결제 방식과 같은 정보를 이해하는 데 유용하다. 이를 통해 할인 쿠폰, 무료 배송, ‘지금 구매, 나중에 지불’ 서비스와 같은 편리한 결제 수단을 사용할 수 있는 옵션 등 고객이 선호하는 형태로 인센티브를 제공할 적절한 시기를 파악하여 판매를 진작시키는 모델을 개발할 수 있다.

또 API 및 기타 도구를 사용해 소셜 미디어와 같은 다른 소스를 통해 잠재고객에게 도달하고 상호작용할 수도 있다. 자사 데이터에서 확보한 인사이트는 다른 플랫폼 API를 통해 다양한 유형의 신규 고객에게 다가갈 수 있는 커다란 힘을 제공한다.

 

데이터를 한 데 모아 활용하기

적합한 데이터를 찾아 수집하는 것, 즉 데이터 품질을 유지하면서 데이터를 집계하는 것이 데이터 통합 프로세스의 첫 단계다. 여기서 극복해야 할 장애물은 서로 다른 소스의 데이터를 통합해 효과적으로 사용할 수 있도록 하는 것이다. 즉, 각 소스로부터의 데이터들 사이에서 공통적인 요소를 찾아 고객 기록이 완전하고 중복이 없도록 해야 한다. 가장 이상적인 방법은 데이터를 연결하는 데 사용할 수 있는 공통 식별자를 찾아 한 소스의 데이터 포인트 A를 다른 소스의 데이터 포인트 B와 일치시키는 것이다.

예를 들어 CRM 데이터의 이름과 휴대전화 번호로 누군가를 식별할 수 있을 것이다. 또 다른 온라인 데이터 소스도 같은 휴대폰 번호를 포함하고 있다고 하자. 이 경우 두 휴대전화 번호가 동일한 사용자의 것이라는 합리적인 추정이 가능하다. 아니면 이처럼 서로 다른 시스템의 두 가지 기록이 같은 사람에 대한 것인지 확실하게 결정하기 위해 속성 조합이 필요할 수도 있다.

이는 실제 상황에서는 훨씬 더 복잡하다. 사람들이 실수로 또는 의도적으로 숫자를 잘못 입력하는 경우가 많기 때문이다. 또는 일부 시스템에서는 실명을 사용하고 다른 시스템에서는 가명 또는 아이디를 사용하는 경우도 많다. 이 때문에 데이터를 제대로 통합하기가 힘든 것이다.

데이터 집계를 어렵게 만드는 또 다른 요소는 타이밍이다. 같은 사람에 대한 두 개의 데이터 기록이 있는 경우, 어느 쪽이 최근의 기록인지 아는 것이 중요하다. 또한 가장 최근의 기록이 마케터에게 더 도움되는 기록이 아닐 수도 있다는 점에 주목해야 한다. 두 개의 데이터 기록이 하나는 원인을, 다른 하나는 결과를 반영하는 일련의 과정을 나타내는 것일 수도 있다. 이 경우, 두 기록 모두 가치가 있기 때문에 똑같이 비중 있게 다뤄야 한다.

일단 데이터를 확보하면 이를 모델에 입력하고 어떤 데이터가 유용한지, 모델 개선을 위해 사전 집계에서 누락됐지만 추가 확보해야 할 데이터가 있는지 파악해야 한다. 여기서 고객 데이터 플랫폼으로 투입하는 데이터가 선택 기준에 따라 편향을 유발할 수도 있다.

 

무엇보다 중요한 것은 데이터 거버넌스

데이터 관리에서 가장 중요한 요소는 거버넌스다. 데이터 관리 관련 내부 정책, 프로세스 및 절차로서 관할 법률이 정하는 규정에 따라야 한다.

예를 들어, 유럽연합의 GDPR은 시민과 관련된 데이터를 보유한 기업 및 기관이 일련의 특정 지침 및 규칙을 따르도록 요구하고 있다. 싱가포르의 PDPA에는 정보 수집 및 사용 동의에 관한 특별 조항이 있으며, 데이터 사용 방법 및 보존을 제한한다. 그 외에도 많은 국가에서 데이터 손실 보고와 관련한 특정 법률을 정하고 있다. 호주는 눈에 띄는 데이터 침해(Notifiable Data Breach) 통지 의무 규정을 두고 있으며, 뉴질랜드는 최근에 개인정보 보호법을 수정했다. 한국도 최근 EU 시민의 개인정보를 별도의 절차 없이 한국으로 이전할 수 있도록 하기 위해 EU로부터 GDPR 적정성 평가를 받고 있는 등 선진국 수준의 개인정보보호 국가로 인정받기 위해 노력하고 있다.

이는 실제 비즈니스에서 어떤 데이터가 수집되는지, 어떻게 사용될 것인지, 적절한 데이터 삭제 절차가 있는지를 포함해 강력한 정보 보안 체계를 갖추고 있음을 기업이 고객에게 명확하게 밝혀야 함을 의미한다. 이 모든 프로세를 명확하게 설명하고 각 요소별 책임 소재가 누구에게 있는지 밝히는 것이 데이터 거버넌스 정책이다.

데이터 거버넌스는 데이터 관련 규정을 준수하는 것 이상의 의미를 갖는다. 좋은 데이터 거버넌스는 데이터 아키텍처에서 보안 및 데이터 보존에 이르기까지 모든 과정을 포괄하여 모범 사례를 적용하고 가능한 최상의 데이터 품질을 지원하는 적절한 절차를 마련하는 것을 의미한다. 데이터를 데이터의 라이프사이클 관점에서 관리하는 것이 거버넌스라고 할 수 있다.

데이터가 새로운 시대의 석유라는 생각에 동의한다면, 마케팅 담당자는 데이터를 귀중한 자원으로서 수집하고, 정제하고 활용해야 할 것이다. 마케팅 데이터를 관할 지역에서 요구되는 의무를 준수하면서 올바르게 관리하는 것도 중요하다. 데이터를 수집하고, 저장하고, 관리하고, 사용하는 데는 비용이 발생한다. 하지만 이 비용은 고객을 깊이 있게 이해해서 고객이 관심 가질 만한 매력적인 제안으로 매출 증대에 기여할 수 있는 유형 자산으로 간주해야 할 것이다.

 

* 이 글은 지디넷코리아에 게재된 기고입니다. 

애피어에 문의하세요!

문의를 남겨주시면 마케팅 전략을 개선할 수 있는 방법을 찾을 수 있도록 안내해드리겠습니다.

다른 최신 포스트도 둘러보세요!

인공지능(AI)으로 다시 태어난 이메일 마케팅

소셜 미디어를 비롯한 디지털 채널이 고객 참여나 제품 홍보의 주요 도구로 활용되면서 이메일과 같은 “전통적인” 의미의 마케팅 기법은 간과되기 쉽다. 그러나 최근에는 이메일 마케팅도 인공지능(AI) 기술로 그 효과가 한층 개선되어 다시 효율적인 마케팅 기법으로 환영받고 있다. 이메일 마케팅은 구독자를 확보하고 유지하는 데 따르는 어려움과 상대적으로 낮은 오픈율 및 클릭률 등의 한계로 인해 즉각적인 반응을 확인할 수 있는 소셜 채널에 비해 덜 효과적인 편이다. 기존에는 이런 문제를 해결하고 실적을 개선하기 위해 할인 혜택을 제공하거나, 좀 더 눈에 띄는 제목을 부여하거나, 빈도를 달리해서 전송하는 등, 이메일 콘텐츠 자체를 변형하는 방식을 적용하는 것이 일반적이었다. 하지만 이런 해결 방식의 기저에는 수신자가 이메일 콘텐츠에 반응을 하거나 하지 않는 이유를 사람이 충분히 파악할 수 있다는 전제가 깔려 있다. 이 가정은 일정 부분 사실이지만, 수신자들로부터 브랜드가 원하는 결과를 얻기까지 많은 시행착오를 거쳐야 한다. 지금은 인공지능(AI)의 발달로 유사 고객 그룹을 찾아내고, 기존 고객을 더 잘 이해할 뿐만 아니라 세분화하고, 고객 관심사를 파악하고, 따라서 고객의 향후 행동을 보다 정확하게 예측할 수 있게 됐다. 인공지능이 가진 이런 기능들이 이메일 마케팅의 한계를 극복하는 데 큰 도움이 된다. 인공지능(AI) 기반 잠재 고객 세분화를 통한 오픈율 상승 효과   이메일 수신자들이 콘텐츠에 반응하지 않는 데는 이유가 있다. 인공지능을 접목하면 문제의 핵심은 물론 잠재 고객의 요구사항을 보다 정확하게 파악할 수 있어 추측만으로 접근했을 때보다

딥 러닝을 통한 비디오 스트리밍 휴면 사용자 재활성화

글로벌 비디오 스트리밍 시장의 가치는 2020년부터 매년 20.4%씩 성장하여 2027년에는 미화 1843억 달러에 달할 것으로 전망된다. 전세계 1억 6700만 명의 유료 구독자를 확보하고 있는 넷플릭스(Netflix)가 이 분야의 선두에 있지만, 시장 점유율은 2007년 91%에서 2019년 19%까지 큰 폭으로 감소했다. 이는 비슷한 서비스인 훌루(Hulu), 아마존 프라임(Amazon Prime), 디즈니 플러스(Disney Plus) 등으로 인해 경쟁이 점점 치열해지고 있기 때문이다. 특정 지역 스트리밍 서비스 또한 시청자와 가입자를 확대하고 있다. 중국의 스트리밍 서비스 아이치이(iQiyi)는 2019년 가입자 1억 명을 돌파했으며, 중국의 비디오 공유 및 라이브 스트리밍 플랫폼인 틱톡(TikTok)은 작년 기준으로 총 15억이 넘는 다운로드를 기록하여 세계적으로 큰 반향을 일으켰다. 틱톡 가입자들은 하루 평균 8번 앱을 연다고 한다. 비디오 스트리밍 시장이 계속 성장할 것이라는 데는 의심의 여지가 없다. 소셜 미디어 사용과 개발도상국의 초고속 인터넷 전용선 확충 외에도 블록체인 및 인공지능(AI)과 같은 첨단 기술이 이와 같은 성장의 주요 동력으로 작용하고 있다. 그러나 전세계 11억 오디언스의 관심을 끌기 위해 400개 이상의 구독 기반 주문형 비디오 서비스들이 치열한 경쟁을 펼치고 있는 상황에서 소중한 시청자를 계속 유지하기 위해서는 강력한 전략이 필수불가결하다. 사람들이 플랫폼을 떠나는 이유 사용자 이탈 및 유지는 비디오 스트리밍 서비스에게는 항상 큰 장애물로 작용해왔다. 최근의 한 연구에서는 앱 사용자의 67%가 첫 2주 이내에 활동을 멈추는 것으로 나타났다. 기본적으로 시청자들은 이전 경험에 불만족했기 때문에 돌아오지 않는다. 기술 관련 문제일 수도 있고

고객 충성도와 유지율, 너무 늦으면 5배의 비용을 지불해야 한다

고객을 잃고 싶어 하는 기업은 없다. 고객 유실은 기업의 평판에 악영향을 미치고, 매출에 타격을 입히는 데서 끝나지 않는다. 마케팅 예산과 관련해서도 추가 비용이 발생한다. 포레스터 리서치의 조사에 따르면 기존 고객을 계속 유지하는 데 드는 비용의 다섯 배를 써야 새로운 고객을 유치할 수 있다고 한다. 그렇다면, 이탈이 임박한 고객을 예측하고 이러한 잠재 이탈 고객의 재참여를 유도할 수 있는 방법은 없을까? 인공지능(AI)을 활용하여 고객에 대한 인사이트를 확보하면 가능하다. 인공지능은 활동이 없는 고객을 파악하고, 거래 사이트를 변경할 가능성이 높은 고객, 즉 고객 이탈률(churn rate)을 예측할 수 있다. 그 뿐만 아니라 고객의 관심사에 대한 심층 인사이트를 제공하여 개인맞춤형 메시지와 콘텐츠로 재참여율을 높일 수 있도록 한다. 고객의 발길을 붙잡는 비결, 그 해답은 데이터에 있다 높은 고객 유지율은 업계를 불문하고 수익 창출의 원동력이다. 기존에 사용해 오던 마케팅 방식으로 데이터는 많이 확보했다. 문제는 데이터를 해석해서 당장 적용 가능한 인사이트로 전환하는 작업이 쉽지 않다는 것이다. 또한 이런 작업은 빠른 시간 안에 이루어져야 하는데, 고객이 이탈을 고려하고 있다면 그야말로 일각을 다투는 상황이기 때문이다. 인공지능(AI) 시스템은 수동으로 데이터를 수집하는 것보다 훨씬 효율적이다. 정확한 요구 사항에 따라 자동으로 수행되기 때문이다. 일단 목표를 설정하면, 시스템도 그 목표에 맞추어 조정하면 된다. 그러면 시스템은 빠르고 정확하게 해당 작업을 수행할 것이다. 이 과정에서 사람의 실수가 개입할 가능성은 훨씬 줄어든다. 데이터 관련성이 떨어지거나 충분히 구체적이지 않다고

    저희가 도와드리겠습니다

    문의를 남겨주시면 마케팅 전략을 개선하는 데 도움될 AI 솔루션을 자세히 안내드리겠습니다