감사합니다!

노이즈를 차단하세요: 샌드박스 환경에서의 노이즈와 리포트에 미치는 영향 예측

By Gil Bouhnick & Yifat Niv
Cut the Sandbox noise OG image

광고를 운영하는 비즈니스에 종사하고 있다면 누구나 한번 쯤은 프라이버시 샌드박스에 대해 들어봤을 것입니다. 2022년 Google이 프라이버시 샌드박스를 처음 발표한 이후 업계에 큰 파장을 불러 일으켰습니다. 프라이버시 샌드박스에서는 타겟팅, 리타겟팅, 어트리뷰션을 위한 API를 소개했지만, 오늘은 어트리뷰션 API에 초점을 맞춰 어트리뷰션 API에서 생성되는 리포트에 대해 광고주 입장에서 꼭 짚고 넘어 가야할 부분에 대해 이야기해 보겠습니다.

프라이버시 샌드박스에 대해 자세히 알아보기 전에, Apple이 iOS 14.5를 출시하고 모든 마케터가 SKAdNetwork(SKAN)에 새롭게 익숙해져야 했던 2021년 4월로 거슬러 올라가 봅시다. 이전까지는 마케터가 거의 모든 것을 원하는 만큼 측정할 수 있는 사치를 누렸었죠. 그러던 중 SKAN이 등장했고, 그 이후의 이야기는 길게 설명하지 않아도 잘 알고 계실겁니다.  

SKAN 도입 후, 가장 큰 변화는 바로 개인 정보 보호 임계값(또는 군중 익명성, Crowd Anonymity) 개념의 등장입니다. 쉽게 말하자면, 데이터가 특정 임계값을 충족하지 못할 경우, 리포트에 null 값만 기록된다는 것입니다. 광고주들은 기존의 측정 방식에 대한 접근을 재고할 수밖에 없었고, 이는 업계에 큰 변화를 가져왔습니다.

SKAN의 측정 방식(2일, 7일, 35일의 고정된 기간에 걸쳐 제공되는 3개의 포스트백)과 달리, 샌드박스는 전체 30일 동안의 측정을 제공하지만, 실제로 받을 수 있는 데이터의 양에는 자체적인 제한이 있습니다. 그리고 바로 그 지점에서 노이즈가 개입하게 됩니다.

그래서 노이즈란 정확히 무엇일까요?

프라이버시 샌드박스에서의 노이즈는 유저 개인정보 보호를 위해 리포트에 임의의 데이터를 의도적으로 도입하는 것을 의미합니다. “노이즈”가 추가되면서 시스템 상에서 개별 유저 액션을 쉽게 추적할 수 없게 되었고, 이에 따라 특정 행동을 정확히 파악하기가 더 어려워졌습니다. 

하지만 광고주 입장에서는 확보한 데이터가 다소 모호해져, 리포트에서 정확한 결론을 파악하기가 더 까다로워졌습니다. 유저의 개인정보 보호가 강화된다는 이점이 있지만, 노이즈가 많아진 데이터에 맞게 전략을 다시 조정해야 한다는 것을 의미하기도 합니다.

어트리뷰션 리포트가 상세할수록 더 많은 노이즈가 추가됩니다. 이 노이즈는 두 가지 형태로 나타날 수 있습니다. 하나는 가산적 노이즈로, 무작위 데이터가 추가되어 수치가 부풀려지는 경우이고, 다른 하나는 감산적 노이즈로, 실제 데이터가 줄어들어 수치가 낮아지는 경우입니다. 

데이터 양이 많으면 노이즈의 영향이 최소화되는 경향이 있기 때문에, 표시되는 데이터는 상당히 정확합니다. 그러나 데이터의 양이 줄어들거나 세분화될수록 노이즈의 수준이 높아져 정확한 결론을 도출하기가 더 어려워집니다. 노이즈는 전환수가 0인 지표에도 나타날 수 있어, 실제로는 아무런 활동이 없는데도 마치 존재하는 것처럼 착각하게 만들 수 있기 때문에 복잡성이 더욱 커집니다.

데이터 감소에 따른 노이즈의 영향

리포트의 노이즈를 관리하려면 어떻게 해야 하나요?

앞서 언급했듯이 데이터가 상세할수록 노이즈가 커집니다. 하지만 마케터가 리포트에 추가되는 노이즈를 통제할 수 있을까요?

노이즈를 완전히 제거할 수는 없지만, 측정하는 각 이벤트에서 수신하는 데이터의 양을 어느 정도 제어할 수 있습니다. 여기에서 기여 예산이 중요한 역할을 하며, 각 이벤트에 할당되는 데이터의 양을 관리할 수 있도록 도와줍니다.

프라이버시 샌드박스에서는 광고 클릭과 같은 모든 소스 이벤트에 사용할 수 있는 “값”의 개수가 제한되어 있으며, 이를 기여 예산(contribution budget)이라고 합니다. 기여 예산은 65,536개 값으로 설정되어 있는데, 이는 각 소스 이벤트에서 수집할 수 있는 데이터의 양을 제한하기 위한 것입니다.

샌드박스의 기여 예산은 마치 30일 동안 오픈 뷔페를 이용하는 것과 같습니다. 원하는 요리를 언제든지 맛볼 수 있죠. 하지만 여기에선 칼로리 제한이라는 상한선이 정해져 있습니다. 구매 또는 등록과 같은 각 이벤트는 뷔페의 요리와 같습니다. 이벤트에서 데이터를 수집할 수 있지만 특정 한도까지만 수집할 수 있습니다. 예산의 정해진 한도에 도달하면, 마치 뷔페에서 칼로리 제한에 도달한 것처럼 해당 이벤트에 대한 데이터 수집이 완료됩니다. 이 접근 방식은 과도하게 데이터를 수집하지 않으면서도 유의미한 인사이트를 얻을 수 있도록 도와주며, 유저의 개인정보를 보호하는 데에도 기여합니다.

예산 내에서 가치 있는 인사이트 확보

기여 예산을 할당하는 방식에 따라 노이즈가 리포트에 미치는 영향이 크게 달라집니다. 핵심 측정 항목에 집중하고 충분한 데이터를 확보하면, 노이즈의 영향이 줄어듭니다. 노이즈가 더 큰 데이터셋에 분산되기 때문입니다. 이 방식은 대규모 앱에 특히 효과적인데, 많은 데이터를 측정하더라도 데이터의 양이 충분하면 정확성이 유지되기 때문입니다.

문제는 소규모 앱에서 작은 데이터셋으로 너무 많은 세부 사항을 측정하려고 할 때 생깁니다. 데이터가 적을수록 노이즈가 인사이트를 왜곡할 여지가 더 커지기 때문입니다. 따라서 운영하는 앱의 규모가 크든 작든, 기여 예산을 현명하게 관리하여 노이즈를 억제하고 데이터를 최대한 정확하게 유지하는 것이 중요합니다.

간단한 예시를 통해 이를 다시 한 번 살펴보겠습니다. 첫 24시간 이내 또는 7일째의 수익과 같은 단기 ROI를 측정한다고 가정해 보겠습니다. 1,000달러 매출이 아닌 100달러에서 측정을 중단하기로 결정할 수도 있겠죠. 수익 범위를 줄여 측정을 더 집중적으로 수행하면, 분석 대상이 되는 구매 수 역시 줄어들어 노이즈의 영향을 감소시키고 더욱 명확한 인사이트를 얻을 수 있습니다. 반대로, 수익 한도를 최대 1,000달러로 올려서 더 광범위한 구매량을 측정할 수 있습니다. 이로 인해 더 많은 노이즈가 발생하며, 이는 다양한 수치에 분산되어 실제 데이터에서 어떤 일이 발생하는지를 파악하기가 어려워집니다.

단기 ROI에 대한 이해

위의 예시를 기반으로 구독 앱을 살펴봅시다. SKAN 이전에는 14일에서 30일의 무료 평가판을 제공하는 것이 일반적인 관행이었으며, 유저를 유료 구독으로 유도하는 데 중요한 전략이었습니다. 하지만 SKAN의 짧은 측정 기간으로 인해 이러한 전환을 측정하기 어려웠고, 개발자는 처음 24시간에서 48시간 이내의 초기 지표에 의존해야 했습니다. 프라이버시 샌드박스를 사용하면 개발자는 초기 이후의 시그널에 집중할 수 있습니다. 즉, 장기적인 성공을 위해 중요한 요소를 우선적으로 고려하고, 무료 평가판 기간을 더 길게 설정하여 전환을 더욱 정확하게 측정할 수 있습니다.

시그널 측정을 위해 캠페인 세분화

또 다른 중요한 요소는 캠페인을 얼마나 세분화하느냐의 여부입니다. 캠페인, 광고 세트 또는 크리에이티브와 같은 요소별로 데이터를 세분화할수록 기여 예산이 더 많이 분산됩니다. 즉, 세분화된 각각의 그룹이 사용할 수 있는 기여 예산이 줄어들게 되죠. 이렇게 기여 예산이 여러 조각으로 나뉘면, 각 그룹의 데이터에 노이즈가 더 많이 섞일 가능성이 커집니다. 

노이즈를 줄이기 위한 스케일링

노이즈의 영향을 줄이는 또 다른 방법은 데이터 스케일링을 활용하는 것입니다. 스케일링은 노이즈로 인해 중요한 데이터 포인트가 왜곡되지 않도록 하는 데 사용되는 기술입니다. 앱스플라이어와 같은 MMP는 데이터의 값을 조정함으로써 핵심 시그널을 증폭시켜, 개인 정보 보호를 위해 추가된 노이즈의 영향을 줄일 수 있습니다.

예를 들어, 로데이터에 적은 수의 유저 활동만 기록되어 있는 경우(예: 소수의 회원 가입), 스케일링을 통해 데이터 값을 증가시켜 노이즈의 영향을 줄일 수 있습니다. 노이즈가 추가된 후, 데이터는 실제 수치를 보다 정확하게 반영하도록 다시 스케일링됩니다. 이 과정을 통해, 노이즈가 추가되더라도 데이터가 명확하고 유용하게 쓰일 수 있도록 유지합니다.

신호 측정을 위한 캠페인 세분화

스케일링 기능을 활용하면 리포트의 정확성을 유지하면서 중요한 인사이트를 확보할 수 있으며, 동시에 개인정보 보호 요건도 준수할 수 있습니다. 스케일링을 기여 예산의 전략적 관리와 함께 활용하면, 수집한 데이터에서 최대한의 가치를 얻을 수 있습니다.

핵심 요약

프라이버시 샌드박스에서 작업할 때, 정확하고 실행가능한 데이터를 유지하기 위해서 다음 사항을 꼭 유의해야 합니다.

  • 동시에 진행되는 캠페인 수: 한 번에 너무 많은 캠페인을 실행하면 기부 예산이 너무 빠르게 분산되어 노이즈가 많아지고 데이터의 신뢰도가 떨어질 수 있습니다. 캠페인을 무리하여 확장하지 않으면서도 의미 있는 인사이트를 얻을 수 있는 적절한 균형을 찾는 것이 중요합니다.
  • 캠페인 세분화: 캠페인 세분화 정도가 높을 수록, 더 많은 노이즈가 생겨납니다. 비용 대비 가장 큰 효과를 얻을 수 있는 분석에 집중하세요.
  • 이벤트 수: 너무 많은 이벤트를 측정하려고 하면 기여 예산이 빨리 소진될 수 있습니다. 목표에 맞는 핵심 지표에 집중하세요. 초기 시그널을 찾고 있든 장기적인 결과를 목표로 하든, 데이터의 품질을 유지하는 것이 중요합니다.
  • 리포트 생성 빈도:  리포트를 너무 자주 생성하면 노이즈가 증가할 수 있습니다. 리포트를 생성할 때마다, 유저의 개인정보를 보호하기 위해 새로운 레이어의 노이즈가 추가되기 때문입니다. 특히, 데이터셋이 적은 상황에서 리포트 생성이 잦아지면, 인사이트를 얻기가 더 어려워집니다. 너무 많은 노이즈로 인해 리포트의 정확도가 떨어지지 않도록 하면서, 필요한 데이터를 확보하는 적절한 균형을 맞추는 것이 중요합니다.

이처럼 노이즈를 증가시킬 수 있는 요소를 고려하여 전략을 조정함으로써, 노이즈를 줄이고 데이터의 가치를 극대화해야 합니다.

노이즈가 리포트에 어떤 영향을 미치는지 직접 확인하고 싶으신 분들을 위해 툴이 준비되어 있습니다. 노이즈 시뮬레이터를 통해 다양한 시나리오를 살펴보고 다양한 수준의 노이즈에 따라 데이터가 어떻게 변하는지 확인해 보세요.

Gil Bouhnick

Gil Bouhnick은 앱스플라이어에서 개인 정보 보호 어트리뷰션을 이끄는 프로덕트 디렉터입니다. 20년 이상의 오랜 경력을 가진 프로덕트 전문가로서 글로벌 대기업과 초기 단계의 스타트업 모두에서 성공적인 B2B 및 B2C 제품 개발을 주도해 왔습니다.

Follow Gil Bouhnick

Yifat Niv

Yifat은 앱스플라이어의 프로덕트 마케팅 매니저로, B2B와 B2C 분야에서 6년 이상의 프로덕트 마케팅 경험을 보유하고 있습니다. Go-to-Market 전략 개발에 주력하며, 기술과 고객 니즈에 대한 깊은 이해를 바탕으로 제품을 더 쉽게, 더 가치 있게 전달하는 데 열정을 가지고 있습니다.
Background
모바일 앱 마케팅 성과 향상을 위한 현명한 선택