RELATEED CONSULTING
相關咨詢
選擇下列産品馬上(shàng)在線溝通(tōng)
服務時(shí)間(jiān):9:00-18:00
你(nǐ)可(kě)能遇到了下面的問題
關閉右側工具欄
通(tōng)過數(shù)據指标分辨真假用戶
  • 作(zuò)者:admin
  • 發表時(shí)間(jiān):2015-09-14 09:38:27
  • 來(lái)源:未知


運營人(rén)員可(kě)能會(huì)遇到的事情:做(zuò)渠道(dào)投放的時(shí)候,每個(gè)渠道(dào)都投放了,點擊量特别高(gāo),但(dàn)是激活量卻隻有(yǒu)個(gè)位數(shù)。點擊量和(hé)激活數(shù)量都很(hěn)高(gāo),但(dàn)是留存率卻很(hěn)低(dī)。花(huā)了大(dà)量費用在渠道(dào)投放上(shàng),但(dàn)是效果卻并不好。

其實,在移動互聯網生(shēng)态中存在很(hěn)多(duō)不為(wèi)人(rén)知的渠道(dào)“刷量”工作(zuò)室,這些(xiē)工作(zuò)室以非常低(dī)廉的價格貢獻質量同樣低(dī)廉的用戶數(shù)據,這給 App 生(shēng)态圈帶來(lái)了很(hěn)多(duō)惡意後果。面對“刷量”,運營人(rén)員往往在虛假數(shù)據面前束手無策。那(nà)麽,“刷量”到底是怎麽進行(xíng)的?在運營過程中我們要怎樣去判斷數(shù)據是否有(yǒu)“水(shuǐ)分”?

一、關于“刷量”

早期的統計(jì)分析平台的 SDK 基于明(míng)文的 json 數(shù)據包,工作(zuò)室可(kě)以很(hěn)方便的用程序僞造這些(xiē)數(shù)據包,模拟出新增、活躍、留存、時(shí)長等用戶數(shù)據。随着統計(jì)分析平台的發展,很(hěn)多(duō)分析平台推出了基于二進制(zhì)協議的 SDK ,開(kāi)發人(rén)員還(hái)可(kě)以自行(xíng)調用加密開(kāi)關。這些(xiē)技(jì)術(shù)的提升使統計(jì)平台的安全性和(hé)數(shù)據準确性得(de)到了提高(gāo)。如果 App 升級到安全協議版本的 SDK,刷量工作(zuò)室已經很(hěn)難采用直接模拟數(shù)據包的形式來(lái)刷量了。

所謂道(dào)高(gāo)一尺魔高(gāo)一丈,平台有(yǒu)平台的方法,刷量工作(zuò)室有(yǒu)刷量的方式。他們可(kě)能是采用分布式人(rén)肉刷量的方式來(lái)刷量(形式可(kě)以參考基于任務的積分牆);也有(yǒu)可(kě)能是采用更為(wèi)智能的方式,通(tōng)過編寫程序腳本,修改真機參數(shù),驅動真機運行(xíng)(有(yǒu)興趣的同學可(kě)以了解一下 igrimace 這個(gè) iOS 的刷量工具)。這些(xiē)行(xíng)為(wèi)已經跟真實的用戶行(xíng)為(wèi)幾乎沒有(yǒu)差别了,統計(jì)平台也很(hěn)難從技(jì)術(shù)上(shàng)分辨這些(xiē)數(shù)據。

那(nà)麽,有(yǒu)什麽辦法能識别這些(xiē)虛假數(shù)據呢?一些(xiē)有(yǒu)經驗的運營人(rén)員,會(huì)通(tōng)過渠道(dào)效果評估的數(shù)據指标和(hé)反作(zuò)弊模塊兩方面來(lái)分辨出真假用戶的差異。同時(shí),友(yǒu)盟新出的用戶評級産品,通(tōng)過設備在友(yǒu)盟數(shù)據平台的全局行(xíng)為(wèi)來(lái)評估渠道(dào)用戶質量的好壞。下面,我們來(lái)仔細分析,如何通(tōng)過這些(xiē)指标和(hé)工具來(lái)辨别真假用戶。

二、如何識别“刷量”數(shù)據

第一、渠道(dào)效果評估

留存率

有(yǒu)時(shí)候渠道(dào)“刷量”會(huì)選擇在次日、7 日、30 日這些(xiē)重要時(shí)間(jiān)點上(shàng)導入用戶數(shù)據。我們會(huì)發現 App 在次日、7 日、30 日這些(xiē)關鍵時(shí)間(jiān)點上(shàng)的數(shù)據明(míng)顯高(gāo)于其他時(shí)間(jiān)點。其實真實的用戶的留存曲線是一條平滑的指數(shù)衰減曲線,如果你(nǐ)發現你(nǐ)的留存曲線存在陡升陡降的異常波動,基本上(shàng)就是渠道(dào)幹預了數(shù)據。可(kě)想而知,這樣的用戶的質量是非常差的,也不具備商業價值。

(小(xiǎo)貼士:留存曲線不僅可(kě)以幫助我們判斷渠道(dào)的質量,還(hái)可(kě)以在運營推廣和(hé)産品優化上(shàng)給出很(hěn)多(duō)參考性建議。留存率是怎麽計(jì)算(suàn)的呢?某一天的新增用戶,在n天後回訪的比例,就是這天的 n 日留存率。舉個(gè)例子,如果我們在 2 月 1 日獲取了 1000 個(gè)新增用戶,這批用戶在 2 月 2 日有(yǒu) 400 個(gè)用戶回訪,2 月 8 日有(yǒu) 200 個(gè)用戶回訪,那(nà)麽 2 月 1 日新用戶的次日留存率是 40%,7 日留存率是 20%。)

如何通(tōng)過數(shù)據指标來(lái)分辨真假用戶

用戶終端

每個(gè)渠道(dào)都有(yǒu)自己覆蓋的用戶群,他們的用戶終端會(huì)有(yǒu)區(qū)别。比如說小(xiǎo)米應用商店(diàn)的用戶可(kě)能 TOP10 的機型都是小(xiǎo)米手機,而移動 MM 的用戶可(kě)能絕大(dà)部分是移動運營商的用戶。排除這些(xiē)有(yǒu)特殊渠道(dào)的應用商店(diàn),大(dà)部分渠道(dào)的用戶終端跟整個(gè)移動互聯網終端分布是類似的。我們可(kě)以通(tōng)過查看移動互聯網數(shù)據報告或者數(shù)據指數(shù)産品來(lái)了解這些(xiē)數(shù)據,把這些(xiē)數(shù)據作(zuò)為(wèi) benchmark ,來(lái)對比分析 App 的數(shù)據。

我們可(kě)以重點關注設備終端、操作(zuò)系統、聯網方式、運營商、地理(lǐ)位置這些(xiē)手機設備的屬性。我在下面列舉了一些(xiē) tips:

方法一:關注低(dī)價設備的排名

你(nǐ)可(kě)以重點分析渠道(dào)的新增用戶或者啓動用戶的設備排名。如果你(nǐ)發現某款低(dī)價設備排名異常靠前,這種情況值得(de)我們重點關注。這些(xiē)數(shù)據可(kě)以在統計(jì)平台的終端屬性分布中找到。

如何通(tōng)過數(shù)據指标來(lái)分辨真假用戶

尤其是 iOS 平台沒有(yǒu)模拟器(qì),所有(yǒu)的用戶數(shù)據需要通(tōng)過真機觸發。很(hěn)多(duō)刷量的工作(zuò)室會(huì)選擇購買二手的 iPhone 5c 來(lái)做(zuò)刷量真機。有(yǒu)個(gè)做(zuò)渠道(dào)推廣的朋友(yǒu)踩過這樣的坑,發現某個(gè)渠道(dào)有(yǒu) 75% 的設備是 iPhone 5c ,比 top5 的 iOS 設備占比還(hái)多(duō)。繼而又發現這個(gè)渠道(dào)的留存率等指标都差強人(rén)意,最終查出這個(gè)渠道(dào)使用了大(dà)量的 iPhone 5c 來(lái)刷量。

方法二:關注新版本操作(zuò)系統的占比

如何通(tōng)過數(shù)據指标來(lái)分辨真假用戶

很(hěn)多(duō)渠道(dào)刷量工作(zuò)室在操作(zuò)系統版本的适配上(shàng)會(huì)有(yǒu)延時(shí)。所以建議渠道(dào)人(rén)員在查看渠道(dào)用戶的操作(zuò)系統時(shí),可(kě)以和(hé)全體(tǐ)手機網民的操作(zuò)系統的分布做(zuò)比較。如果你(nǐ)發現某個(gè)渠道(dào)下面,不存在新版本的操作(zuò)系統(比如iOS 8.x),有(yǒu)一種可(kě)能性就是這個(gè)渠道(dào)合作(zuò)的工作(zuò)室的技(jì)術(shù)還(hái)沒有(yǒu)适配最新的操作(zuò)系統。

方法三:關注 wifi 網絡的使用情況

如何通(tōng)過數(shù)據指标來(lái)分辨真假用戶

有(yǒu)的朋友(yǒu)問我們,用戶在 wifi 下面使用的比例達到了90%,這個(gè)比例到底正常不正常。要回答(dá)這個(gè)問題,首先我們需要對現在的大(dà)形勢有(yǒu)些(xiē)了解。現在是一個(gè)高(gāo)速網絡的環境,無論是新增用戶還(hái)是活躍用戶,wifi 的使用占比都比較大(dà)。

從用戶行(xíng)為(wèi)上(shàng)來(lái)說,如果你(nǐ)留心身邊的朋友(yǒu),會(huì)發現大(dà)家(jiā)在下載 App 的時(shí)候傾向于使用 wifi(流量貴啊),相比之下,啓動 App 時(shí),會(huì)對當前網絡的敏感性差一些(xiē)。也就是說,新增用戶的 wifi 使用比例會(huì)大(dà)于啓動用戶的 wifi 使用比例。

另外,wifi 的使用比例還(hái)跟應用類型相關。如果你(nǐ)是一個(gè)在線視(shì)頻類型的應用,wifi 的比例可(kě)能會(huì)在 90% 以上(shàng)。如果你(nǐ)是一個(gè)小(xiǎo)流量的 App ,同時(shí)能夠在新增用戶和(hé)活躍用戶的 wifi 數(shù)據對比上(shàng)看出蛛絲馬迹,可(kě)能真的是渠道(dào)在搗鬼了。

方法四:定向投放也很(hěn)重要

有(yǒu)個(gè)行(xíng)業內(nèi)做(zuò)了很(hěn)久的朋友(yǒu)傳授給我一個(gè)經驗,說福建地區(qū)的作(zuò)弊比較多(duō),我們在制(zhì)定投放策略的時(shí)候可(kě)以重點考慮屏蔽作(zuò)弊多(duō)的地區(qū)。這個(gè)黑(hēi)名單也可(kě)以根據 App 實際的分地域投放效果來(lái)定制(zhì)。

另外,我們在投放時(shí)也可(kě)以根據需要重點選擇部分地區(qū)投放。比如北上(shàng)廣這些(xiē)高(gāo)消費的地區(qū),比如三四線城市這些(xiē)相對藍(lán)海的區(qū)域。查看數(shù)據時(shí)就需要驗證用戶是否和(hé)我們的投放策略相符合了。

用戶行(xíng)為(wèi)

方法一:比較用戶行(xíng)為(wèi)數(shù)據

如果一個(gè) App 運營的時(shí)間(jiān)比較久,訪問頁面、使用時(shí)長、訪問間(jiān)隔、使用頻率等這些(xiē)行(xíng)為(wèi)數(shù)據會(huì)趨向穩定的。不同 App 的行(xíng)為(wèi)數(shù)據是有(yǒu)差異的。可(kě)能刷量工作(zuò)室可(kě)以模拟出看似真實的用戶行(xíng)為(wèi),但(dàn)是很(hěn)難跟你(nǐ)的 App 的日常數(shù)據做(zuò)的完全一緻。

一個(gè)渠道(dào)用戶的使用時(shí)長、使用頻率過高(gāo)過低(dī)都值得(de)懷疑。我們在平時(shí)做(zuò)渠道(dào)數(shù)據分析時(shí),可(kě)以将這些(xiē)數(shù)據跟整個(gè) App 作(zuò)比較,或者将安卓市場(chǎng)、應用寶這些(xiē)大(dà)型應用商店(diàn)的數(shù)據作(zuò)為(wèi)基準數(shù)據,進行(xíng)比較。

方法二:了解新增用戶、活躍用戶小(xiǎo)時(shí)時(shí)間(jiān)點數(shù)據曲線

很(hěn)多(duō)刷量工作(zuò)室通(tōng)過批量導入設備數(shù)據或者定時(shí)啓動的方式來(lái)僞造數(shù)據。這種情況下,新增和(hé)啓動的曲線會(huì)出現陡增和(hé)陡降。真實用戶的新增和(hé)啓動是一條平滑的曲線。一般來(lái)說,用戶的新增和(hé)啓動會(huì)在下午 6 點之後達到高(gāo)峰。而且新增相比啓動的趨勢會(huì)更加明(míng)顯。

如何通(tōng)過數(shù)據指标來(lái)分辨真假用戶

如何通(tōng)過數(shù)據指标來(lái)分辨真假用戶

我們可(kě)以将不同渠道(dào)的分時(shí)數(shù)據進行(xíng)對比,找到異常。需要注意的是,這種行(xíng)為(wèi)數(shù)據的對比需要遵循單一變量原則。也就是說,除了是不同的渠道(dào),實驗中的其他因素必須完全相同。如果我們選取渠道(dào) A 在周三的活躍數(shù)和(hé)渠道(dào) B 在周六的活躍數(shù)做(zuò)對比,這兩個(gè)數(shù)據肯定是有(yǒu)差異的,不具備可(kě)比性。

方法三:查看用戶訪問的頁面名稱明(míng)細

有(yǒu)些(xiē)工作(zuò)室會(huì)将 appkey 打到其它高(gāo)頻的 App 中。這樣,我們可(kě)能會(huì)發現渠道(dào)用戶的數(shù)據非常漂亮,但(dàn)是仔細觀察可(kě)以發現,頁面名中有(yǒu)大(dà)量的頁面不是自己定義的。通(tōng)過對比頁面名稱,可(kě)以定位到這種形式的渠道(dào)作(zuò)弊。

如果是 Android App,這個(gè)名稱是 activity 或者 fragment ;如果是 iOS App ,這個(gè)名稱是自定義的 view 。這段記不住也沒關系,記得(de)找開(kāi)發人(rén)員要一下具體(tǐ)頁面的名稱列表,對比一下統計(jì)後台用戶訪問的頁面明(míng)細,就能看出差異了。

轉化率分析

轉化率數(shù)據的分析不僅可(kě)以幫助我們應對渠道(dào)作(zuò)弊,還(hái)可(kě)以幫助我們判斷不同渠道(dào)的用戶質量,提高(gāo)投放效率。每一個(gè) App 都有(yǒu)自己的目标行(xíng)為(wèi)。比如電(diàn)商類應用的目标行(xíng)為(wèi)就是用戶購買商品的情況。遊戲類的應用需要考察應用內(nèi)付費。社交類應用會(huì)關注用戶産生(shēng)內(nèi)容的情況。運營人(rén)員需要定義和(hé)設計(jì)應用的目标行(xíng)為(wèi)。

如果一個(gè)用戶是真實的流量,他會(huì)經曆點擊、下載、激活、注冊、直到觸發目标行(xíng)為(wèi)的過程。我們可(kě)以将這些(xiē)步驟做(zuò)成漏鬥模型,觀察每一步的轉化率。漏鬥的步驟越靠後,作(zuò)弊的難度越大(dà),所獲取用戶對系統的價值越高(gāo),同時(shí)我們付出的用戶成本也越高(gāo)。運營人(rén)員需要對目标行(xíng)為(wèi)進行(xíng)監控,在渠道(dào)推廣時(shí),考察目标行(xíng)為(wèi)的轉化率,提高(gāo)渠道(dào)作(zuò)弊的邊際成本。

友(yǒu)盟近期推出的用戶評級産品,可(kě)以綜合友(yǒu)盟數(shù)據平台全量數(shù)據進行(xíng)挖掘和(hé)分析,通(tōng)過設備在友(yǒu)盟數(shù)據平台的全局活躍情況、存活時(shí)長、App使用情況等六大(dà)特征來(lái)衡量各個(gè)渠道(dào)的新增用戶表現,幫助開(kāi)發者更有(yǒu)效的評估用戶質量。

第二:反作(zuò)弊模塊

除了使用現成的統計(jì)分析工具,還(hái)可(kě)以申請(qǐng)讓研發人(rén)員開(kāi)發自己的反作(zuò)弊模塊。我們可(kě)以定義一些(xiē)行(xíng)為(wèi)模式,加到反作(zuò)弊模塊的黑(hēi)名單庫中。如果一個(gè)新增設備滿足定義的行(xíng)為(wèi)模式,就會(huì)被判定為(wèi)一個(gè)作(zuò)弊設備。每個(gè)運營人(rén)員都可(kě)以根據自己的 App 來(lái)定義。我列舉了一些(xiē)常用的行(xíng)為(wèi)模式:

設備号異常:頻繁重置 idfa ip 異常:頻繁更換地理(lǐ)位置 行(xíng)為(wèi)異常:大(dà)量購買特價商品等 數(shù)據包不完整:隻有(yǒu)啓動信息,不具備頁面、事件等其他用戶行(xíng)為(wèi)信息

注:相關網站(zhàn)建設技(jì)巧閱讀請(qǐng)移步到建站(zhàn)教程頻道(dào)。