三問數據中臺 數據中臺

數據中心(三個問題的數據中心)
自從阿里提出“大中小前臺”的概念后 , 數據中臺的概念這幾年火了起來 , 互聯網巨頭紛紛成立自己的數據中臺 。數據中臺到底有什么魅力能讓企業如此重視?筆者從什么是數據中心 , 怎么做 , 為什么要做三個方面來回答這個問題 。

1.什么是數據中心?很多人會問 , 數據中心到底是什么?
一般來說 , 數據中心是在數據層面為企業業務提供幫助和決策的工具 。
過去 , 數據往往只顯示 , 不存儲;慢慢的 , 人們需要隨時隨地查找數據 , 存儲數據的概念被普遍認可;慢慢的 , 人們逐漸養成了數據思維 , 發現可以通過看數據來制定運營策略 。當互聯網時代已經進入爆發期 , 產生了大量的數據 。人們通過數據挖掘收集大量的外部數據作為決策的依據 。
現在的互聯網已經進入了一個相對成熟的時期 , 大公司都建立了自己的數據中心 , 把海量的數據作為自己的資產 , 并且善于利用數據中心來整合和智能分析數據 , 驅動決策 。
說到數據中心 , 就會涉及到數據倉庫 。很多人看 , 數據倉庫?它只是一個數據庫 , 一個存儲數據的東西 。其實這并不是一個正確的認識 。兩者有什么區別?
1.不同的業務場景 。數據倉庫主要對收集的數據進行分析和處理;
數據庫主要面向事務;
2.專注于以不同的方式優化數據 。數據倉庫主要是集中資源優化獲取資源的方式 , 因為業務人員和運營人員對數據的獲取需求很大 , 往往每天都會調用、獲取和處理大量的數據;
數據庫主要集中資源優化添加、刪除、修改、搜索等功能 。 , 防止過多的數據更新和事務影響數據庫的效率和穩定性;
3.數據以不同的方式組織 。數據倉庫通常按時間組織數據 。以電商訂單為例 。數據倉庫會分別用“1小時訂單”、“1天訂單”、“1個月訂單”組織數據分析表 , 方便業務人員獲取分析;
數據庫按索引和物理內容組織數據 , 如“數碼產品訂單”、“生鮮食品訂單”、“服裝訂單”等 。
4.冗余是不同的數據倉庫往往是高度冗余的 , 因為數據倉庫希望用更多重復類型的數據來分析整個產品的運營趨勢 , 為下一步的運營決策做依據;
而數據庫往往冗余度較低 , 數據庫不希望存儲大量重復類型的數據 , 從而影響數據庫的整體性能和效率 。
說到這里 , 我們大概對數據中心有了初步的了解 , 那么我們就來看看如何搭建一個最適合我們公司的數據中心 。
二、如何建設最合適的數據中心?為什么說它是“最適合”自己的數據中心?
【三問數據中臺 數據中臺】數據中心在功能和邏輯上非常復雜 , 涉及很多領域和維度 , 那么如何打造最適合的數據中心呢?請這樣想:
1.先分析你需要什么數據 。首先要根據自己的業務來分析需要哪些數據 。下面是一個例子:
(1)電子商務業務
電子商務離不開訂單、商品、支付等數據 。就訂單數量而言 , 可以拆分這些維度進行統計:分鐘/小時/天/周/月訂單、人均訂單、男/女用戶訂單、服裝/數碼產品訂單、復購訂單數量、訂單銷售額、訂單周轉率、訂單退貨率等 。
如果是商品 , 會涉及到商品類型的交易次數 , 商品的點擊率 , 商品的評價次數等 。
如果是支付 , 會涉及到支付成功率/失敗率、支付次數、支付渠道、支付優惠使用率等等 。
(2)直播服務
說到直播業務 , 核心角色可以分為主播和用戶 , 整個直播平臺都是圍繞這兩個核心角色來設計的 。
簡單來說 , 直播就是主播和用戶進行信息交流的過程 。主播提供內容 , 用戶消費內容 , 反饋信息(發彈幕 , 送禮物等 。).當然 , 用戶可以什么都不做 , 但也為主播提供了人氣和受眾);
整個直播過程可以分析如下:主播打開直播間——用戶通過接收推薦/訂閱提醒/搜索/首頁推薦等方式進入直播間 。-主播與用戶交流信息互動-用戶退出直播間/主播下載-直播過程結束 。
那么 , 從這個簡單的過程中 , 我們可以挖掘出很多數據指標 , 比如:播出后每小時的觀看人數、消息推送/訂閱/首頁推薦的點擊率、搜索次數、彈幕發送次數/速率、禮物類型/數量、觀看直播1/5/10…分鐘的用戶數、各種留存率等 。由于數據指標太多 , 以上數據暫且列出 。

推薦閱讀