視頻加速器有用嗎 可以讓視頻加速的軟件

視頻加速器有用嗎,可以讓視頻加速的軟件 。欲強網帶你了解更多相關信息 。
視頻是互聯網應用中占比最大的數據類型 。智慧城市、視頻直播、短視頻、線上會議、VR、云游戲、視頻AI分析等視頻相關應用近期獲得了迅猛發展,在這些應用場景中對視頻的處理效率直接關系到用戶體驗 。如何獲得高品質、高性能、低功耗的智能視頻處理成為了目前業界關注的熱點技術 。
視頻是以單一格式創建和上傳的,但最終以不同的分辨率在不同的終端設備上播放,需要將原視頻解碼、后處理、再編碼,這一過程稱為轉碼 。同時,還需要根據不同應用場景的需求對視頻進行各種處理,如視頻縮放、視頻圖像增強、視頻增加廣告/字幕/水印/臺標、視頻拼接等 。隨著視頻處理需求激增,視頻業務成本快速上漲,各大視頻業務服務廠商不得不在用戶體驗和資源成本之間做平衡 。
在這種情況下VPU應運而生 。VPU全稱Video Processing Unit(視頻處理單元),是專門面向AI場景優化設計的視頻加速器,內置視頻編碼加速專用功能模塊,具有高性能、低功耗、低延時等特性,為視頻行業應用帶來高效能的加速計算 。目前已有多家廠商宣布了VPU的開發計劃 。Google近期宣布了一款名為Argos的視頻芯片(VCU)并將其大規模用于YouTube的視頻轉碼處理任務中 。在國內,浪潮前不久發布了AI視頻處理加速器M10A 。浪潮M10A在8W超低功耗下可以實現16路1080P全高清視頻處理加速,支持H.264、H.265、VP9等多種視頻格式,兼容PCIE的服務器,為廣泛的互聯網視頻廠商提供計算支撐 。

視頻加速器有用嗎 可以讓視頻加速的軟件

文章插圖
浪潮M10A加速卡
M10A系統架構
M10A板卡的系統架構設計兼顧了穩定的數據流程和完善的控制流程 。VPU芯片是整張板卡的數據處理核心單元,視頻數據的解碼、編碼、轉碼、后處理等功能都是在VPU芯片中完成的 。為了與服務器BMC控制系統進行連接,M10A板卡上設計了單獨的板級BMC管理芯片,完成板卡狀態收集和控制,包括溫度、功耗、告警、輸出復位等 。從服務器BMC的控制界面中,可以獲取M10A板卡的狀態和控制等操作,這是M10A產品相比同類產品的顯著優勢 。
M10A板卡在完成視頻轉碼的過程中,僅需要輸入原始視頻就可以得到最終重新編碼的視頻,在整個轉碼的過程中不需要CPU數據面的參與,從而減少HOST主機CPU的性能消耗,降低轉碼延時 。

視頻加速器有用嗎 可以讓視頻加速的軟件

文章插圖
M10A加速卡架構圖
M10A智能視頻處理加速器處于視頻業務流程中的核心位置 。如下圖所示,在數據中心,M10A搭載服務器組成高密度、低功耗、低成本的視頻處理專用服務器,進而組建數據中心視頻處理加速集群 。視頻輸入源完成視頻數據采集后,通過網絡傳輸到數據中心視頻處理加速集群中,M10A完成視頻流的解碼、后處理工作,比如對視頻YUV原始數據進行縮放和裁剪操作,最后完成高質量的視頻編碼,通過CDN分發給最終觀看者 。
M10A除了完成支持傳統視頻轉碼操作外,還針對互聯網視頻的需求特點,研發了多播模式,針對輸入視頻進行衍生操作,最多可以支持1路視頻衍生4路視頻的操作,每路輸入視頻單獨調整幀格式、分辨率等屬性 。

視頻加速器有用嗎 可以讓視頻加速的軟件

文章插圖
M10A核心技術
無狀態設計
無論是解碼核心還是編碼核心,浪潮M10A在開發中均采用了無狀態設計思想 。軟件通過操作一系列控制寄存器來管理編解碼核心 。所有的輸入和輸出,比如待解碼幀、參考幀、運動向量都存儲在設備DRAM中 。編解碼核心不會保存編解碼的狀態,當編解碼核心處理完一路視頻流的某一幀后,隨時可以切換到其它路視頻流進行處理 。這樣編解碼核心的調度管理將變的十分簡潔,軟件可以派發任務到任意一個空閑的編解碼核,隨著編解碼核心的頻率提升,可處理視頻路數也將以接近線性的方式提升 。這種上下文切換的消耗相較于編解碼一幀來說幾乎是忽略不計的 ??赡軐τ跀z像頭等某些邊緣嵌入式設備來說,在幀間處理時保留狀態是一種十分簡潔的設計 。但是就大型數據中心來說,它們要處理成千上萬不同分辨率、不同碼率的視頻流,無狀態設計將是一種更友好、更高性能的選擇 。
主觀畫質優化
浪潮M10A是目前市面上首款支持窄帶高清技術的視頻轉碼加速卡 。窄帶高清技術的目標是在標準編碼內核的基礎上,在降低碼率的同時保持主觀質量不下降 。那它是如何做到的呢?現有視頻編碼是基于香農定理,它的率失真模型都是連續的,但是人眼視覺模型是階梯性非連續的,因而在這個階梯上存在一個降碼率的空間 。

推薦閱讀