이 글은 틱톡 추천(For You Page) 알고리즘의 작동 원리를 소개하고 틱톡 알고리즘이 가지는 강력한 장점이자 인스타그램, 유튜브 피드 및 추천 알고리즘과 결정적 차이점이 무엇인지 설명하고 있습니다. 이 글은 브랜드 마케터뿐 아니라 틱톡에서 영향력을 확대하려는 크리에이터에게도 도움이 될 것입니다.

지난 겨울동안 집중했던 <마케터가 즐거운 틱톡 마케팅(가안)> 원고가 출판사로 넘어갔습니다. 따라서 지금부터 다시 틱톡 또는 숏폼 플랫폼 마케팅 관련 글을 발행할 계획입니다.

가장 진화한 피드 구성 알고리즘: 틱톡 추천 알고리즘

소셜 미디어에서 피드(Feed) 구성은, 다시 말해 개인 이용자가 접하게 되는 콘텐츠의 순서는 해당 서비스의 성공, 성장 그리고 쇠퇴를 결정하는 주요 요소입니다. 유튜브 추천 알고리즘, 페이스북 및 인스타그램의 피드 알고리즘 그리고 네이버 뉴스의 알고리즘 등이 대표적인 피드 구성 알고리즘입니다.

피드 알고리즘은 이용자 개인의 만족도를 최대한 끌어 올리는 방향으로 특정 서비스를 구성하는 (무한한) 콘텐츠의 배치와 순서를 결정합니다. 여기서 핵심은 개별 콘텐츠에 가중치를 어떻게 부여할 것인가입니다. 또한 서비스를 제공하는 기업의 이윤을 극대화하도록 피드 알고리즘을 진화시키는 것도 중요합니다. 대다수 소셜 미디어는 광고를 핵심 수입원으로 삼고 있습니다. 광고의 수량을 최대화하면서도 이용자가 과하지 않다고 느껴야 하고 또한 광고주의 만족도를 극대화하기 위해 광고의 효율성도 최적화해야 합니다. 여기서 광고의 효율성을 측정하는 가장 중요한 두 가지 지표는 타겟팅과 전환율입니다.

클레이 셔키(Clay Shirky)는 2008년 "정보 과잉이 아니라 필터 실패가 문제다"라고 주장합니다. 이 표현해서 필터(filter)는 피드 구성 알고리즘을 의미합니다.

이용자, 사업자, 광고주 등의 다양한 이해를 반영해야 하는 피드 알고리즘은 고정된 것이 아니라 진화와 진화를 거듭합니다. 이용자 수가 작을 경우 일반적으로 피드는 시간순(chronological order)으로 구성됩니다. 이용자 수가 증가하고 그로 인해 콘텐츠의 수량이 급증하고 콘텐츠의 형식이 텍스트, 이미지에서 영상으로까지 확대되면 피드 구성 알고리즘은 이른바 추천 알고리즘으로 진화합니다.

피드 알고리즘은 다양한 가중치가 들어간 함수 공식입니다. 결과적으로 개별 콘텐츠가 특정 이용자에게 가지는 순서 값이 정해지고 이 수치에 따라 콘텐츠가 노출됩니다.

틱톡은 두 개의 피드를 가지고 있습니다. 하나는 팔로잉 피드입니다. 개별 이용자가 팔로잉하는 계정 그리고 해당 이용자와 각 계정사이의 상호작용 등을 측정해서 틱톡 '팔로잉' 피드가 구성됩니다. 페이스북, 인스타그램과 유사합니다. 이른바 팔로워-팔로잉이라는 소셜 그래프가 피드 알고리즘의 기초를 구성합니다. 다른 하나는 추천(For You) 피드입니다. 이 피드를 구성하는 알고리즘은 틱톡이 성공하는데 결정적 기여를 한 요인 중 하나입니다. 틱톡 추천 피드는 소셜 그래프가 아니라 이른바 콘텐츠 그래프 또는 인터레스트 그래프에 기초하고 있습니다.

틱톡 추천 알고리즘 비밀 1: 상호작용 없는 콘텐츠에 가중치 0 부여

2021년 12월 5일 뉴욕타임스는 틱톡 추천 알고리즘의 기본 구조를 공개했습니다. 틱톡 모회사 바이트댄스(ByteDance)의 개발자는 틱톡 직원 중 비개발자 직원을 대상으로 틱톡 추천 알고리즘을 설명하는 문서를 작성했습니다. 그런데 이 문서가 유출되었습니다. 뉴욕타임스가 전문가 상담을 통해 이 유출된 문서를 분석한 글이 아래 기사입니다.

How TikTok Reads Your Mind
It’s the most successful video app in the world. Our columnist has obtained an internal company document that offers a new level of detail about how the algorithm works.

위 기사에서 공개된 틱톡 추천 알고리즘의 핵심 공식은 아래와 같습니다.

(PlikeVlike)+ (PcommentVcomment)+(EPlaytimeVplaytime)+(PplayVplay)

  1. Plike: 이용자 A의 좋아요 수로 0 또는 1의 값을 가짐
  2. Vlike: 영상 전체 좋아요 수
  3. Pcomment: 이용자 A의 댓글 수로 0 또는 1 이상의 값을 가짐
  4. Vcomment: 영상 전체 댓글 수
  5. EPlaytime: 이용자 A의 재생시간
  6. Vplaytime: 영상 전체☓ 재생시간
  7. Pplay: 이용자 A의 (반복) 재생 수로 1 이상의 값을 가짐
  8. Vplaytime: 영상 전체 (반복) 재생 수

여기서 중요한 점은 1번, 3번 그리고 7번입니다. PlikePcomment는 0의 값을 가질 경우가 많습니다. 따라서 틱톡 추천 알고리즘에서 이용자가 특정 영상에 좋아요를 표시하는 경우와 댓글을 다는 경우 해당 영상의 가중치는 매우 크게 증가할 수 있습니다. 그러나 이용자가 특정 영상을 수동적으로 소비할 경우 해당 영상의 좋아요와 댓글은 해당 이용자의 인터레스트 또는 관심사를 분류하는데 어떤 역할도 할 수 없습니다.

이용자가 특정 영상에 좋아요를 표시하지 않을 경우 해당 영상이 이미 좋아요 10만개를 가졌어도 이 이용자에게 (Plike☓Vlike) 값은 0입니다. 이 부분, 다시 말해 이용자 개인의 참여 수준에 매우 높은 가중치를 부여하고 있는 점이 페이스북, 인스타그램, 유튜브 등과 틱톡의 결정적 차이점입니다.

7번도 중요합니다. 이용자의 반복 재생 수가 전체 재생 수에 곱해집니다. 이것이 숏폼 영상에서 반복 재생 수를 높이는 것이 중요한 이유입니다.

틱톡 추천 알고리즘 비밀 2: 물방울 원칙

틱톡 알고리즘의 또 다른 특징은 이른바 물방울 원칙입니다. 틱톡 추천 알고리즘은 특정 영상을 처음부터 큰 규모의 이용자에게 추천하지 않습니다. 틱톡에는 수 많은 테스트 이용자 그룹이 존재합니다. 특정 영상이 작은 규모의 이용자 그룹에서 반응이 좋다면 보다 큰 이용자 그룹에 이 영상을 추천합니다. 여기서도 반응이 좋다면 보다 더 큰 규모의 이용자 그룹으로 추천 영역이 확대됩니다. 이렇게 작은 이용자 그룹에서 시작해서 보다 큰 그룹으로 영상 추천의 반응을 점검하는 방식이 물방울 원칙입니다. 이 물방울 원칙에서 좋은 성적을 거둔 영상은 강력하게 바이럴될 가능성이 높습니다. 마케터 입장에서 물방울 원칙을 어떻게 활용할 수 있을까요? 최적의 발행 시간을 찾는데 물방울 원칙을 활용할 수 있습니다. 브랜드 계정 또는 크리에이터 계정이 주요 타켓으로 하는 이용자 그룹이 틱톡 이용이 본격화되는 시점을 찾아내는 것이 좋습니다. 그래야 물방울 크기가 커지는 시간대가 타겟 이용자 주요 이용시간과 겹치는 영역이 커질 수 있기 때문입니다. 자세한 답변은 곧 발간될 <마케터가 즐거운 틱톡 마케팅(가안)>에 담겨있습니다.

[강정수의 디지털 경제 브리핑 #25] 틱톡의 성장 비결
틱톡의 성장 속도가 놀랍습니다. 한국의 경우 2019년 12월 대비 2021년 5월 틱톡 이용시간은 2배 이상 증가했습니다. 미국 이용자의 경우 한 달 평균 틱톡 이용시간은 24.5시간입니다. 유튜브는 22시간입니다. 영국 이용자의 경우 한 달 평균 틱톡 이용시간은 26시간에 가깝습니다. 믿기 어려운 수치입니다. (더 믿기 어려운 수치로는...) 21년 5월 한국 이용자의 경우