如何從零開始構建「用戶行為分析」:數(shù)據(jù)加工+案例演示
上篇聊了用戶行為分析的構建指南,此篇繼續(xù)聊聊一些常見的分析方法與實踐,不會太深奧,主要是面向產品設計或初中級用研這些群體,目的是更好服務"用戶體驗"與"商業(yè)轉化",期望能幫助大家更好達成分析訴求推進業(yè)務,或是與數(shù)據(jù)相關崗位的同事更好交流,說不定還能在各位的簡歷或作品集里添點新貨。
期望是:不止會看報表,還能搞定報表跟業(yè)務分析
一、非數(shù)據(jù)分析師的我們能做些什么?
答:
① 「需求是什么」
知道業(yè)務需求是什么?需要什么樣的行為數(shù)據(jù)支撐?即能夠根據(jù)業(yè)務提出行為分析訴求,來輔助實現(xiàn)業(yè)務改進或驗證。
② 「指標怎么算」
清晰字段參數(shù)的含義與數(shù)據(jù)口徑,知道用哪些數(shù)據(jù)可以獲取目標指標,例如通過哪些數(shù)據(jù)可以視用戶為活躍用戶?哪些數(shù)據(jù)可以視為用戶有高價值,既然上一篇有人不關心如何構建用戶行為數(shù)據(jù)集,那么作為產研設計人員,你要什么數(shù)據(jù)和什么口徑你總得說清楚吧。
③ 「報表報什么」
期望匯報哪些指標數(shù)據(jù),用什么圖表形式表達更合適,或許很多同學沒有上手執(zhí)行過這些,甚至認為都是 BI 或開發(fā)的事情,不然,實際上不同職能角色的報表的訴求是不一樣的,即然你提出了需求,那么需求落地的規(guī)格肯定是要參與啊,要是你有能力使用 BI 工具自己執(zhí)行,那還不是得心應手?
二、用戶行為分析的構建工作有什么?
整個構建流程或概念參考下圖,或前往上一篇的《用戶行為分析-構建篇》了解更多,此處不贅述;
三、用戶行為分析一般分析些什么?
通常我們做用戶行為分析時會分析哪些東西?能解決或反映什么問題?適合哪些產品或業(yè)務場景?
事實上概念很簡單,請看下圖;
如果只是聊用戶什么時候在什么場景做了什么事件,實際對業(yè)務意義不大,所以這里結合一些典型的用戶行為分析方法的模型,聊聊一般分析些什么,起到些什么作用。
但此前請讓我再補充一個后文經常出現(xiàn)的基礎概念,即"度量指標"是什么?這是一個用戶行為分析中常見的基本概念,度量指標通常就是一個數(shù)值,可以用作衡量業(yè)務的好壞或高低,它就像是試卷的分數(shù)通過每道題的得分統(tǒng)計得到,也可以像是體溫,數(shù)值即指標結果。
常見的用戶行為分析工作基本上就圍繞拉新、促活、轉化、留存開展,根據(jù)不同的業(yè)務訴求會配合各類分析方法來找問題或改問題,以下表中羅列了主流的行為分析工作與說明,以幫助你了解和匹配業(yè)務訴求。
四、如何搭建用戶行為分析報表「案例實踐」
以下會用到神策的 Demo 演示如何實操,以幫助大家更快上手和理解,用其他產品來構建分析報表也是大同小異的,Excel 也能勝任,熟悉數(shù)據(jù)庫操作與寫代碼腳本分析的大佬可以保持硬核的分析手段哈;
首先再幫助大家回顧一下數(shù)據(jù)報表的生產過程,后續(xù)會圍繞這個過程的節(jié)點來講怎么搭建分析;
1. 采集數(shù)據(jù)
主要是通過數(shù)據(jù)埋點、傳感器采集或是后臺日志等方式獲取用戶操作的行為數(shù)據(jù),即每一個功能按鈕發(fā)生操作行為時的事件日志,這些日志會包含多個維度的數(shù)據(jù),例如頁面場景信息、動作類型信息、用戶角色信息,為分析出更完整有效的結論,業(yè)務上也會盡可能的收集到更多業(yè)務或用戶信息,然后將不同類型的數(shù)據(jù)表進行關聯(lián)以產生更完整的數(shù)據(jù)集,這種關聯(lián)也被叫做數(shù)據(jù)表的血緣關系。
例如一張用戶行為數(shù)據(jù)表+用戶屬性表,其中通過相同且唯一的數(shù)據(jù)進行綁定,如果你做分析時發(fā)現(xiàn)缺少數(shù)據(jù)就可以詢問有無相關數(shù)據(jù)表可以綁定,最終你會看見一個更完整的行為事件的數(shù)據(jù),這也是為什么用戶數(shù)據(jù)會被拿來交易的原因之一;
2. 清洗數(shù)據(jù)
① 數(shù)據(jù)口徑校驗
數(shù)據(jù)源準備好以后,就可以接入到數(shù)據(jù)分析平臺或工具之中,當我們發(fā)覺數(shù)據(jù)源里的數(shù)據(jù)特征有異常或不符合業(yè)務場景,那么就需要將數(shù)據(jù)清理或糾正,以保證用作分析的數(shù)據(jù)是有效的,因此在產品開發(fā)前,作為產品或是交互,定義好這些信息規(guī)格很重要,常見的數(shù)據(jù)格式可參考下表,先從熟悉業(yè)務數(shù)據(jù)特征開始吧,
如果業(yè)務數(shù)據(jù)特征都不熟悉,還談什么數(shù)據(jù)敏感。
② 異常數(shù)據(jù)識別
清洗數(shù)據(jù)簡單概括就是在應用或構建指標及報表前,對行為數(shù)據(jù)查缺補漏,去除無效以及糾正錯誤,通常這些工作都是由開發(fā)或數(shù)據(jù) BI 去進行,但我們需要能夠識別出缺少什么數(shù)據(jù)、哪些數(shù)據(jù)有異常、哪些數(shù)據(jù)不符合規(guī)范、哪些數(shù)據(jù)口徑對不上,這些就需要通過熟悉業(yè)務場景或產品需求設定來進行識別了。
如果說數(shù)據(jù)基本是符合預期的,那么在下一階段的指標度量工作中,剩余的清洗工作主要就是條件過濾,幫助篩選出符合預期或有效的數(shù)據(jù)進行分析應用,這種頭疼的清洗或過濾需求我時常碰到,我來給你們舉個例子;
3. 構建指標度量
① 常見指標度量怎么來的
當我們清楚數(shù)據(jù)的含義與特征后,其實就應該發(fā)現(xiàn)很多數(shù)據(jù)是可以直接拿來統(tǒng)計后作基礎指標的,如常見的人數(shù)、某事件的操作次數(shù)、人均操作次數(shù)等,并且有些指標結合時間分布、動作類型、用戶去重統(tǒng)計等就可以產生更多其他的基礎指標,這些經過簡單加工的基礎指標還可能會被其他指標計算時用上。
例如將常見的「用戶 ID」「首頁訪問」「充值金額」結合「時間維度」就可以得到以下各種指標;
當然,不同的行業(yè)會有不同的基礎指標,在上一篇的《用戶行為分析構建篇》中已經為大家羅列了一份常見的通用指標構建表,大家可以回顧一下,這里也提供了一個神策的指標拆解工具作為構建基礎指標的參考;指標拆解工具|數(shù)據(jù)指標體系查詢平臺 》〉
② 指標構建常用的算法
當我們需要一些特別的或定制化的指標時,就需要對數(shù)據(jù)表的參數(shù)截取、分組、計算等,一般會用到數(shù)據(jù)庫的函數(shù)運算或條件判斷,最常見的就是加減乘除、是否、等于、排除、且、或這些,對于這些運算函數(shù),相信學過 Excel 統(tǒng)計的同學并不會很陌生,以下是一份 SQL 常見的函數(shù)整理,因為不同平臺的函數(shù)應用格式會有差異,這里就不展開應用案例了,大家先了解下常見算法的函數(shù)類型與用途,有些 BI 平臺甚至把這些函數(shù)做成了特定選項或模版了,實際需要運算時,查閱資料或找客服即可;
③ 數(shù)據(jù)到業(yè)務指標構建
為了更好的聚焦"用戶行為",那么以下是一份游戲行業(yè)的用戶行為數(shù)據(jù)源,這份數(shù)據(jù)表具備了主要的業(yè)務字段或參數(shù),通常每一個用戶行為事件的數(shù)據(jù)都會包攬這些信息,便于我們根據(jù)指標對數(shù)據(jù)進行計算或加工成指標度量。
為了方便大家理解,這里我撈取了部分字段參數(shù)做成了表格說明,以便于大家消化理解每個字段數(shù)據(jù)背后代表了什么信息或指標,后半截則會通過這些原始數(shù)據(jù)演示如何構建基礎指標的計算列或是度量參數(shù);
如上,我們對一些數(shù)據(jù)進行組合加工時會用到"計算列",實際上它的概念很簡單,這里我用 Excel 的數(shù)據(jù)表格舉個例子;
如圖下,每個大寫字母開頭的數(shù)據(jù)組為列,編號開頭的則為行,計算列則是在已有數(shù)據(jù)列的基礎上進行計算或條件判斷加工得出的新數(shù)據(jù)列。
Excel 表格通常是創(chuàng)建完成目標列以后,在表格上方的輸入框中填寫對應的計算函數(shù)或公式,在數(shù)據(jù)庫或其他 BI 工具中,也都相應的會提供計算列的新增編輯窗口,以滿足數(shù)據(jù)的加工。
相信看到這里,你已經知道數(shù)據(jù)是怎么加工成基礎指標的了,如果這些數(shù)據(jù)加工你不熟悉甚至不會,你依舊可以找數(shù)據(jù)的同事輔助或是找開發(fā)在數(shù)據(jù)表里預處理好目標計算列或度量。
那么基于這份游戲行為數(shù)據(jù)表,我們繼續(xù)開展行為分析案例。
4. 分析方法應用「案例演示」
前面枯燥的行為數(shù)據(jù)構成 End 了,基于完成采集和加工的數(shù)據(jù)集,就可以開始著手用戶行為的數(shù)據(jù)分析與報表構建了,興奮的搓搓小手~~
① 數(shù)據(jù)選用
從用戶行為數(shù)據(jù)構建篇到此篇,前面鋪墊了這么多是為了幫助我們弄清楚三點,即數(shù)據(jù)的范圍、數(shù)據(jù)的含義、數(shù)據(jù)的特征,怎么理解呢?
- 數(shù)據(jù)的范圍:哪些業(yè)務場景的用戶行為數(shù)據(jù)是可以采集到的,結合業(yè)務指標與分析,是否需要完善數(shù)據(jù)采集。
- 數(shù)據(jù)的含義:數(shù)據(jù)表中的各個行為事件有什么含義,結合到業(yè)務場景中,能代表什么指標或是關鍵事件?
- 數(shù)據(jù)的特征:即行為事件中記錄了哪些業(yè)務擴參、用戶資料、行為類型等,這些信息在行為事件分析或過濾判斷時都會用到,這些特征信息不僅可以幫助我們鎖定指定的數(shù)據(jù),還可以通過配合其他產生一些新的業(yè)務指標,詳細可參考前面「構建指標度量〉〉常見指標度量怎么來的」部分。
OK~那么當我們明確了業(yè)務分析的目標和這些行為數(shù)據(jù)后,數(shù)據(jù)選用無非就是以下幾點;
- 我要分析什么:分析什么行為事件?分析哪兒出問題了?分析哪個場景熱鬧?分析用戶在逛啥等?(注:第三部分"用戶行為分析一般分析些什么有講到")
- 用什么分析模型:對應到分析目標,找到合適的分析方法或模型,如事件分析、漏斗分析、行為路徑分析等。
- 用到哪些行為數(shù)據(jù):結合分析方法或模型的構成特征,準備好相應的數(shù)據(jù),如各個核心頁面的訪問、關鍵信息或模塊的曝光、下單等核心的行為事件日志等。
- 用到哪些參數(shù)屬性加工:通過參數(shù)進行條件過濾或是統(tǒng)計計算等,例如通過性別參數(shù)只看女性行為數(shù)據(jù),通過用戶類型過濾掉內部員工數(shù)據(jù),總是使得分析結果能夠滿足分析訴求!
廢話 END 那么說完了數(shù)據(jù)選用,這里我用神策 RPG 游戲的 Demo 數(shù)據(jù)開始演示如何開始用戶行為分析。Demo 地址:https://www.sensorsdata.cn/demo/game.Html
② 事件分析
這都叫啥事兒!分析單個或多個行為指標的數(shù)據(jù)情況,可以觀察出行為指標的趨勢變化,不通條件下的數(shù)據(jù)體量、多個行為指標的趨勢關系等。
③ 漏斗分析
哪兒出了問題?常用作消費決策場景、渠道增長、任務流程的轉化分析,以了解轉化流失的情況和原因深入分析。
④ 留存分析
還愛嗎?常用作用戶粘性評估、用戶忠誠度評估、市場認可度相關評估對比。
⑤ 分布分析
哪里熱鬧哦?常用作業(yè)務場景的流量分布、不同時段的流量趨勢或是核心行為指標的頻次分布等洞察。
⑥ 行為路徑分析
瞎逛啥呢?常用作用戶在產品頁面之間的跳轉關系示意,以觀察用戶的活動路徑、訪問習慣、活動范圍與偏好。
⑦ 歸因分析
這事兒賴誰?常用作業(yè)務核心指標轉化相關的事件貢獻度分析,用作改善或調整運營策略。
⑧ 用戶屬性分析
這幫人咋樣?常用作用戶畫像完善、行為趨勢或偏好洞察、功能或營銷效果對比、用戶生命周期、用戶標簽分類。
五、行為分析篇實戰(zhàn)小結
看到這里,且不說完全掌握相關處理方法與應用,至少各個節(jié)點的流程事項能通過數(shù)據(jù)源串起來了吧。在案例實踐過程中,也都是用的一些相對簡單的方法不是嘛,因為是案例演示,所以精細化與嚴謹程度是不夠的,但真實的業(yè)務場景中,更多的也只是確保數(shù)據(jù)準確與口徑一致,然后搭建報表時確保指標算法無誤,并過濾出有效的數(shù)據(jù)。
好了,那么當我們形成報表后,怎樣才能知道報表對不對呢?下篇揭曉:
下一章《(用戶行為分析)-異常修復》終篇
感謝耐心閱讀,如果覺得寫的還行,歡迎點贊關注一下,下次更新先通知你~
泡泡bing
想了解更多網(wǎng)站技術的內容,請訪問:網(wǎng)站技術