做好數據分析的4大思維 如何數據分析?( 二 )


很明顯 , 指標就是用來定義、評價和衡量業務的一個標準 。 比如網站相關用戶訪問量、停留時長、跳出率等 。 銷售相關銷售量、銷售額、客單價等 。 應該很好理解 。
指標的設定有兩個經驗:
1.“有總比沒有強” 。 對于要監控的事物 , 能有指標的盡量要有指標 。
2.“一個好的指標應該是用來衡量具體且可量化的事物” 。 比如 , 用戶訪問量、停留時長、跳出率等 。
下面這張圖 , 解釋了什么是指標化 , 這就是有無數據分析思維的差異 , 也是典型的數據化運營 。
指標體系
有指標是否就夠了呢?指標按照結構化思維可以形成一個體系 , 如銷售分析指標體系 , 生產指標體系 , 電商行業指標體系 。
一家企業建立的數據分析體系通常細分到了具體可執行的部分 , 可以根據設定的某個指標異常變化 , 相應立即執行相應的方案 , 來保證運營的正常進行 。
附上一張電商行業的指標體系 , 各運營模塊的指標體系網上一搜一大把 , 可以參考著建立 , 后面我也會在我的文章里闡述 。
建立指標體系的思路:
向上
可以按業務職能結構劃分 , 映射出更多維度 , 比如渠道 , 運營 , 產品等相關模塊 , 將相關指標映射到主要模塊 , 通過簡單快速的溝通 , 快速定位問題原因 。
向下
可以按因果結構劃分 , 也就是指標分解 , 利用公式的方法 。 比如營收=日活*付費率*arpu等指標因果關系進行劃分 , 通過定位指標波動 , 定位最細指標 , 輔助維度下轉 , 能夠清楚的問題原因 。
就像枝丫一樣 , 從主干不斷延伸枝丫 , 將業務用指標評價量化 , 逐漸形成一個健全的數據分析體系 。
4、維度分析思維最后 , 站在分析的角度講一下維度思維 。
當你有了指標 , 可以著手進行分析 , 數據分析大體可以分三類 , 第一類是利用維度分析數據 , 第二類是使用統計學知識如數據分布假設檢驗 , 最后一類是使用機器學習 。 這里我們主要了解維度分析法 。
維度是觀察數據的角度 , 例如“時間”、“地區”、“產品” 。 在具體分析中 , 我們可以把它認為是分析事物的角度 。 時間是一種角度、地區是一種角度 , 產品也是一種角度 , 所以它們都能算維度 。
當我們有了維度后 , 就能夠通過不同的維度組合 , 形成數據模型 。 數據模型不是一個高深的概念 , 它就是一個多維立方體 。
這個概念最早來源于商業智能OLAP技術 。 數據按照事實表(Fact Table)和維表(Dimension Table)的形式存在 。 事實表用來記錄具體事件 , 比如銷量、銷售額、售價、折扣等具體的數值信息 。 維度表是對事實表中事件的要素的描述信息 , 比如時間、城市、品牌、機型等 。
這是一個最簡單的星形模型的實例 。
事實表里面主要包含兩方面的信息:維和度量 , 維的具體描述信息記錄在維表 , 事實表中的維屬性只是一個關聯到維表的鍵 , 并不記錄具體信息;度量一般都會記錄事件的相應數值 , 比如這里的產品的銷售數量、銷售額等 。 維表中的信息一般是可以分層的 , 比如時間維的年月日、地域維的省市縣等 , 這類分層的信息就是為了滿足事實表中的度量可以在不同的粒度上完成聚合 , 比如2016年商品的銷售額 , 來自上海市的銷售額等 。
下圖舉例一個簡化的分析模型 , 分別由產品、城市、時間這三個維度組成 , 實際數據分析中 , 維度遠不止三個 。
在數庫中 , 可能是這樣兩張表:

做好數據分析的4大思維 如何數據分析?

文章插圖
我們可以將品牌作為維度 , 分析手機的銷量情況 , 也可以將時間作為維度 , 分析每一年手機市場的份額情況 。
多維分析操作包括:鉆?。―rill-down)、上卷(Roll-up)、切片(Slice)、切塊(Dice)以及旋轉(Pivot) 。
鉆?。―rill-down):在維的不同層次間的變化 , 從上層降到下一層 , 或者說是將匯總數據拆分到更細節的數據 , 比如通過對2018年華為的總銷售數據進行鉆取來查看各個手機型號的銷售數據 。
上卷(Roll-up):鉆取的逆操作 , 即從細粒度數據向高層的聚合 。 如將江蘇省、上海市和浙江省的銷售數據進行匯總來查看江浙滬地區的銷售數據 。
切片(Slice):選擇維中特定的值進行分析 , 比如只選擇蘋果手機的銷售數據 , 或2017年的手機銷售數據 。
切塊(Dice):選擇維中特定區間的數據進行分析 , 比如選擇2016年2017年的銷售數據 。

推薦閱讀