Go Back

비지도 학습(Unsupervised Learning) 이해를 돕는 심플 가이드

인공지능(AI) 모델은 사람보다 빠르게 의사결정 및 예측을 수행할 수 있다. 사람보다 빨리 의사결정을 내리고 예측을 수행하려면 먼저 데이터로부터 학습을 해야 하고, 이 데이터 학습을 수행하는 두 가지 주요 방식이 지도 학습(supervised learning)과 비지도 학습(unsupervised learning)이다.  

비지도 학습이란 무엇인가? 비지도 학습은 학습 알고리즘에 결과물이라고 할 수 있는 출력을 미리 제공하지 않고 인공지능(AI)이 입력 세트에서 패턴과 상관관계를 찾아내야 하는 머신러닝 알고리즘이다. 예를 들면, 새로 출시할 상품 유형에 맞는 타겟 시장을 정의하려고 할 때 필요한 기술이다. 비지도 학습은 데이터 자체가 부족하거나 훈련 데이터를 수집하기에는 비용이 너무 높은 등의 이유로 출력에 대해 알 수 없거나 활용할 수 없을 때 주로 사용된다. AI를 어린 아이라고 가정할 때, 지도 학습은 색깔, 숫자 또는 어휘와 같이 인간이 이미 알고 있는 것을 아이에게 가르치는 것과 같다. 비지도 학습은 아이가 스스로 문제를 풀고 추론할 수 있도록 내버려두는 방식이라고 할 수 있다. 보통 아이가 상상을 통한 놀이 또는 글쓰기와 그림 그리기 등의 창의적인 활동을 하면서 스스로 배우도록 한다. 지도 학습과 비교했을 때 비지도 학습은 다음과 같은 특징이 있다:

  • 레이블이 지정되지 않은 데이터를 처리한다
  • 사용자가 보다 복잡한 처리 작업을 수행할 수 있도록 한다
  • 더 예측이 어렵다
  • 데이터의 근본 구조를 발견하는 데 사용할 수 있다
  • 실시간으로 발생한다

비지도 학습 알고리즘의 일반 유형 클러스터링 알고리즘(Clustering algorithms) 클러스터링 알고리즘(clustering algorithms), 즉 군집화 알고리즘은 분류되지 않은 데이터에서 구조나 패턴을 찾는 데 도움을 준다. 어린이들이 좋아하는 볼풀을 미가공 데이터라고 한다면, 클러스터링 알고리즘은 모든 파란색 공을 하나의 클러스터 또는 그룹으로, 빨간색 공을 그와 다른 클러스터로 정렬하는 것과 같은 작업을 수행할 수 있다. 운영자인 사람이 알고리즘이 식별해야 할 클러스터 수를 지정 또는 수정할 수 있으며, 이를 통해 그룹들을 어디까지 세분화할 것인지 보다 쉽게 제어할 수 있다. 하지만 클러스터링 알고리즘에는 단점이 있다. 그룹 간의 유사성을 과대평가할 수 있고 각 데이터 포인트를 개별적으로 다루지 못한다. 예를 들어, 볼풀에 있는 빨간색 공들의 크기 차이가 굉장히 크더라도 알고리즘은 모두 같은 그룹으로 분류한다. 따라서 각 데이터 포인트의 개별성에 초점을 맞춰야 하는 고객 세분화 및 타겟팅과 같은 애플리케이션에 클러스터링 알고리즘을 사용할 경우 주의해야 한다.

변칙 또는 이상 감지 모델(Anomaly detection) 변칙 감지(anomaly detection) 알고리즘은 데이터 세트에서 변칙적인 것이나 이례적인 것을 자동으로 감지하고 알려준다. 사기성 거래, 하드웨어 결함 또는 사람의 실수로 인한 잘못된 데이터 포인트를 발견하는 데 유용하다.

잠재 변수 모델(Latent variable models) 데이터가 엄청나게 복잡한 경우에는 데이터를 통한 학습이 어려울 수 있다. 우선, '불량(noisy)' 데이터를 제거하여 단순화함으로써 학습을 용이하게 하고, 데이터에서 의미 있는 인사이트를 찾을 수 있다. 잠재 변수 모델(latent variable model)은 전처리 단계에서 큰 도움이 된다. 차원 축소(dimensionality reduction)로 알려진 기법을 통해 데이터 세트에서 그 특징의 수를 줄이거나 데이터 세트를 여러 구성요소로 분할함으로써 데이터를 단순화시키는 데 기여한다.

마케팅에서 비지도 학습 활용 1. 고객 행동 예측 사람의 행동은 대체로 예측이 어렵다. 불완전한 데이터를 가지고 효과적인 마케팅 전략을 수립해야 하는 어려운 게임이다. 이처럼 불완전한 데이터 세트만 있을 때 비지도 학습은 공백을 채워 줌으로써 큰 ​​도움이 될 수 있다. 예를 들어, 어떤 웹사이트 페이지의 이탈률과 전환율이 모두 높게 나타난다고 하자. 비지도 학습은 알고리즘이 찾아내도록 훈련시킨 하나의 정답에 의존하지 않고, 데이터를 분석하고 그 안에 숨겨진 통계와 정보를 발견함으로써 이 페이지가 고객들로부터 그렇게 극단적인 반응을 이끌어내는 이유를 파악하는 데 도움을 준다. 비지도 학습은 데이터 내에서 무엇이 고객들의 특이한 행동을 유발하는지 밝혀줄 특정 추세를 파악할 수 있다.

2. 고객 세분화 비지도 학습은 타겟 고객 세분화에도 유용하다. 잠재고객을 여러 세그먼트로 나누어 더 가치 있는 그룹에 우선순위를 둘 수 있도록 한다. 크게 네 가지 유형의 요소를 기반으로 고객을 분류할 수 있다:

  • 인구통계 특성(나이, 성별)
  • 지리적 특성(위치)
  • 심리적 특성(태도, 열망)
  • 행동 특성(사이트 내에서 수행하는 작업 및 외부 관심사)
  • 실시간으로 발생한다

비지도 모델을 활용하면 고객의 평생가치(LTV) 또는 전환 확률과 같은 지표를 토대로 고객 기반을 세분화하는 데 도움된다. 이런 지표를 토대로 세그먼트를 분류한 다음에는 달성하고자 하는 비즈니스 목표에 따라 우선순위를 정하여 그 그룹에 마케팅 노력을 집중할 수 있다.

3. 닮은꼴 고객 찾기 비지도 AI 모델은 기업이 이미 보유하고 있는 고가치 고객과 매우 유사한 특징을 보이는 잠재고객을 찾는 데에도 사용할 수 있다. 예를 들면, 스킨케어 브랜드는 세럼을 구매했거나 샘플을 받기 위해 등록한 모든 고객들로부터 수집된 데이터를 활용할 수 있다. 비지도 모델을 사용하여 이미 파악하고 있는 기존 고객들과 유사한 특징을 보이는 다른 고객 그룹을 찾아내어 관련성 있는 마케팅 자료로 공략할 수 있다. AI가 고객의 습관, 행동 및 성향에 대해 이 정도로 깊이 있는 인사이트를 생성해주기 때문에 고도로 개인화되고 타겟 맞춤화된 마케팅 활동으로 해당 고객 그룹의 참여율을 크게 높일 수 있다.  

* 비지도 학습 AI 알고리즘이 정확한 예측과 마케팅 의사결정을 내리는 원리와 이를 광고에 적용하는 방법을 자세히 알아보고자 하시면, 관련 백서 ‘ 지도 학습에서 비지도 학습으로: AI 재구성하는 광고 참고하시기 바랍니다. 구체적인 설명이나 컨설팅이 필요하시면 문의 남겨주세요!