1 Min. Read

微谈 AppsFlyer 数据分析与应用

Leo Lee (Guest Author) Oct 10, 2018

近几年相信各位大大应该很常听见“大数据(big data)”这个名词,许多的公司或是产品都一定要和big data沾上边才会有卖点,使用者才会觉得很炫酷~身为一个“前”数据分析师,觉得应该要站出来和各位观众略略解释一下在互联网产业的数据分析相关知识与应用。首先,来定义一下大数据big data这个虚幻的名词,一般够格被称为big data的话应该具备三个V的特性:数据量(Volume)、数据类型(Variety)与数据传输速度(Velocity),顾名思义就是数据要大、要多元、也要有够快的数据传输处理速度,而现在有更多的V被加入到讨论之中,其中最为重要的为资料真实性(Veracity),以现今互联网发展的趋势而言,谁管你数据多大、多多、处理多快,数据要够真实才有应用的价值,所以说不要再被big data这高大上的名词给蒙骗了~

 

而AppsFlyer绝对够格被称为一个优质的数据公司,光是2018上半年就纪录了145亿的App安装数、250亿次App打开次数 (数据源:AppsFlyer Performance Index VII),并具备能让广告主得到实时归因的安装信息的技术,最重要的是数据的真实性,也是备受业界推崇。所以说除了数据的多元性本人无法透过AppsFlyer所拥有的数据来呈现给大家外,在这个讲求数据的时代,各位观众可以充分利用AppsFlyer,来帮助壮大自己的App事业喔。

再来应该是各位观众比较关心的事,“我在AppsFlyer拿了那么多Raw Data,那能做什么呢?”,原始数据报告(Raw Data Report)为本人最喜爱的功能,没有之一 (第二名是Protect 360防作弊功能),因为在AppsFlyer Dashboard上面9成的数字都是从原始数据报告来的,能够获取原始数据的话,自然就能够无限的发挥想象去做任何的数据分析。一般来说要做数据分析的时候会follow以下步骤:提出问题、提出假设、获取原始资料、分析证明、得出结论。

 

举例来说,我觉得用iPhone的人在我的App中应该是重点关注族群,因为iPhone比较贵,所以用iPhone的人消费力应该会比较强,那我的问题与假设就出来了:是否iPhone使用者具有更高的消费力?有了问题与假设后,再来就是获取资料,而AppsFlyer的Raw Data正好有消费事件 (如果有打点的话) 和Platform的数据,假设数据量不多的话,可以简单从Excel观察即可,如果数据量过大 (Excel只能看200K个Row),可以把数据汇入Data Base下SQL指令去观察,甚至可以用Python、R (都有现成的统计模型套件可以使用) 这种分析软件跑个线性回归或是分群来看不同参数对于购买力的影响。

 

最后为了方便大家,附上原始数据报告相关文件(https://support.appsflyer.com/hc/en-us/articles/208387843-Raw-Data-Reports-V5-),其中有关于各字段的定义和解释,还有Sample Data提供试用,比较常用的有attributed_touch_time(广告点击时间)、install_time (App激活时间)、event_time (事件触发时间)三个时间字段可用来分析,media_source、campaign、af_adset、af_ad可用来看每个install的来源,appsflyer_id、advertising_id、idfa、customer_user_id可用来针对某个特定装置或和你自己BI里的数据做mapping,如此一来广告主最欠缺的App外数据 (激活App之前的归因数据)就可以和App内数据完美接轨了~有了这些精美的素材,就能随心所欲来分析数据或用ggplot做出各种高质量的图啦~