分享寫數據分析報告的教程 如何寫數據分析報告?( 二 )


再進一步 , 觀察各個類別11月的銷售情況:
從圖中可以明顯看到 , 主要銷量來源于類別50014815 , 查詢具體數據發現 , 11月13日總銷量10138 , 類別50014815就占了10030(99.7%) 。
④ 分析類別50014815在11月13日銷量暴增的原因
把類別50014815歷史所有的數據調出來看:
從類別50014815的歷史銷售數據可以發現 , 之前銷售一直維持在一個比較平穩的水平 , 只是在2014年11月13日這天出現了暴增 。
回到分析表 , 篩選出2014年11月13日類別50014815的銷售明細查看 。
從銷售明細可以看出 , 該類別的商品由用戶2288344467單次購買了10000件 , 占了99.7%(當天共10030) , 由此可得出以下結論:

  • 不是雙十一活動活動導致的 。 因為如果是雙十一活動 , 必然很多用戶購買導致銷售量暴增 , 而不是只有一個用戶購買大量商品;
  • 需要找工程師確認數據源是否記錄有誤;
  • 如果數據無誤 , 則要將情況反饋給運營人員 , 跟蹤該用戶是否存在可疑行為(刷單 , 或者利用網站漏洞薅羊毛) 。
⑤ 排除異常值 , 重新再觀察銷售趨勢
經過上述分析 , 用戶2288344467購買的這條記錄屬于異常值 , 記錄為“異常數據1” , 應該刪除 , 再重新分析銷量隨時間變化的規律 。
把刪除“異常數據1”后新的數據表再用折線圖展示:
從圖中可以看出類別38、類別50014815、類別50022520、類別122650008的銷售情況都趨于平穩 , 類別28的銷量起伏較大 , 類別50008168出現一個極端高峰點 。
⑥ 分析類別50008168的銷售出現極端高峰點的原因
通過同樣的方法可以分析出類別50008168在2014年9月20日由用戶173701616購入2748件 , 將此數據記錄為“異常數據2” , 處理方法參照異常數據1 。
⑦ 分析類別28銷量波動大的原因
同樣地把“異常數據2”刪除后 , 得到折線圖:
觀察發現類別28的波動比較大 , 查找到類別28的銷售明細 , 按照銷量倒序排序:
從表中發現類別28并沒有明顯的異常數據 , 不過前三項較其他項差距較大 , 應該標記為“關注數據” , 結合更多的其他數據來分析原因 。
⑧ 小結
  • 類別50014815、類別50008168均出現異常值 , 分別標記為“異常數據1”、“異常數據2” , 排除是營銷活動導致的 。 因為如果是營銷活動 , 必然很多用戶購買導致銷售量暴增 , 而不是只有一個用戶購買大量商品;
  • 類別50014815、類別50008168這兩項異常數據需要找工程師確認數據源是否記錄有誤;如果數據無誤 , 則要將情況反饋給運營人員 , 跟蹤該用戶是否存在刷單情況(網站可能會存在漏洞 , 被黑客利用進行刷單薅羊毛) , 后續分析排除這兩項數據;
  • 類別28標記出三項“關注數據” , 目前沒有其他數據結合分析 , 暫時保留 。
(2)分析哪些是熱銷產品 , 哪些是滯銷產品 , 它們有什么特征
“熱銷”和“滯銷”應該根據購買人數來判斷 。
① 找出熱銷和滯銷商品
可以看出類別50008168商品最熱銷 , 而類別38商品的購買人數最少 , 結合之前的購買數量圖可以看出類別38的銷量也相對較少 , 因此類別38商品是滯銷商品 。
② 分析熱銷商品和滯銷商品的購買人數變化
a. 先按【年份】來看
2015年只取到2月6日 , 數據不全 , 整體上可以看出所有類別的購買人數都是逐年增加 。
b. 再按【季度】來看
整體上表現為第一季度下滑 , 第二季度上升 , 第三季度下滑 , 第四季度上升 。
c. 最后按【月份】來看
從圖中可以看出 , 滯銷商品類別38的人數表現平穩 , 一直維持在較低的水平 , 由此可判斷該類商品基本是靠自然流量 , 或者是冷門類別 。
除類別38外 , 其他五類商品都有一些共同特征(第一季度下滑 , 第二季度上升 , 第三季度下滑 , 第四季度上升) , 而熱銷商品類別50008168的波動較大 。
③ 分析熱銷商品類別50008168購買人數波動的原因

推薦閱讀