推薦引擎基本概念及內容 如何搭建個性化推薦引擎系統?

什么是RecEng:
推薦引擎( Recommendation Engine , 簡稱RecEng )是在阿里云計算環境下建立的一套推薦服務框架 , 用于實時預測用戶對物品偏好 , 支持您定制推薦算法 , 支持 A/B Test 效果對比 。 阿里云推薦引擎 , 以數據驅動業務 , 通過人工智能實現1對1營銷 , 為您的顧客提供量身定做的服務 , 幫助企業快速創新 。 同時能夠為您的企業降低運營成本 , 提高顧客對企業的滿意度和忠誠度 , 提升企業的業務目標 。
課程詳細內容:(點擊下方“了解更多”立即學習)
本認證系統的講解了推薦系統的概念、應用、算法原理 , 并詳細介紹了阿里的推薦引擎產品RecEng , 最后通過一個微項目讓學員親自動手搭建一個推薦系統 。
整個過程分為數據上傳、數據預處理、推薦系統設置、測試上線四個部分 , 學員可參考本實驗 , 結合企業自身業務和需求 , 將所學應用到實踐中去 。
通過本案例 , 學員可了解推薦系統的概念、應用、算法原理以及阿里的推薦引擎產品RecEng的使用方法 。 通過動手實踐 , 學員可以獨立使用推薦引擎產品RecEng快速搭建企業推薦系統 。
推薦引擎基本概念:

  • 客戶/租戶(org/tenant)
指RecEng的使用者 , 系統中由其阿里云賬號代表 。 通常客戶是一個組織 , RecEng中常用org表示客戶 。
  • 用戶(user)
指客戶的用戶 , 即RecEng使用者的用戶 。 推薦是一個2C的服務 , 使用推薦服務的客戶必然有其自己的用戶 , RecEng使用者的用戶簡稱為“用戶” , 系統中常用user表示用戶 。
  • 物品(item)
指被推薦給用戶的內容 , 可以是商品 , 也可以是歌曲 , 視頻等其他內容 , 系統中常用item表示物品 。
  • 業務(biz)
業務針對數據集定義 , 定義了算法所能使用的數據范圍 。 一個客戶在RecEng上可以有多個業務 , 不同的業務必然有不同的數據集 。 RecEng要求每個業務提供四類數據(不要求全部提供):用戶數據 , 物品數據 , 用戶行為數據 , 推薦效果數據 。 每一組這樣的數據就構成一個業務 。 系統中常用biz表示業務 。
比如某客戶A有兩類被推薦的物品 , 分別是視頻和歌曲 , 于是客戶A可以在RecEng上建立兩個業務M和N , 其中M的物品數據為視頻 , N的物品數據為歌曲 , 其他的數據(指用戶數據 , 用戶行為數據等)可以都相同 。 在這種方案下 , 業務M和N的數據是獨立的 , 即業務M雖然能看到用戶對于歌曲的行為 , 但是業務M中不包含歌曲的物品數據 , 所以會丟棄用戶對于歌曲的行為;如果業務M中某用戶只對歌曲有行為 , 對視頻沒有行為 , 業務M也會丟棄這類用戶 。 反之對業務N亦然 。
一個業務最好只推薦一類物品 。 多類物品的推薦在后續的行業模板會有支持 , 需要引入板塊(plate)的概念 , 一份業務數據可以生成多個板塊的數據集 , 場景綁定某個板塊進行推薦算法計算 。
  • 場景(scn)
場景指的是推薦的上下文 , 每個場景都會輸出一個API , 場景由推薦時可用的參數決定 。 有兩種場景最為常見 , 分別是首頁推薦場景和詳情頁推薦場景 。 顧名思義 , 在執行首頁推薦時 , 可用的參數只有用戶信息;而在執行詳情頁推薦時 , 可用的參數除了用戶信息 , 還包括當前詳情頁上所展示的物品信息 。 系統中常用scn表示場景 。
一個業務可以包含多個場景 , 即對于某個業務A , 它包含多個首頁場景也是完全可以的 。
事實上 , 回到場景的原始定義 , 場景只是由推薦的上下文決定 , 客戶完全可以根據自己的需求建立全新的場景 , 比如針對搜索關鍵詞的推薦場景 , 這時可用的參數除了用戶信息 , 還有用戶所輸入的關鍵詞 。
  • 流程(flow)
算法流程指數據端到端的處理流程 , 一部分流程屬于業務范疇 , 如數據導入流程 , 效果計算流程 , 數據質量分計算流程;一部分屬于場景 , 比如場景算法流程 。 從數據源類型和產出來劃分 , 又分為離線流程 , 近線流程 , 在線流程

推薦閱讀