攀登比珠穆朗瑪更高的山峰,數據存儲技術的突破之路( 二 )


然而,作為存儲技術中的重磅難題,壓縮算法多年來未有突出成果 。
為了突破壓縮算法面臨的瓶頸,激發數據壓縮領域的活力,自2020年起,華為與莫斯科國立大學合作,舉辦全球數據壓縮大賽,以促進數據壓縮根技術的研究 。
今年的第二屆全球數據壓縮大賽,邀請了壓縮領域享有盛譽的技術專家擔任評委;使用電子顯微鏡、遙感等高性能計算數據,更貼近前沿、更貼近實際場景 。大賽設計了五種類型的數據集(賽事項目):定量數據壓縮、定性數據壓縮、混合數據壓縮、小塊數據壓縮和熵編碼優化 。
同時,大賽還增設了面向高校學生、難度相對較小的編碼算法優化項目,以吸引更多校園算法高手參與比賽 。在獎項設置方面,進一步體現多維激勵,增設領先獎、特等獎和學生參與獎 。
本屆數據壓縮大賽,已于6月15日正式開賽,接收參賽作品截止到11月底,將于12月底公布獲獎結果 。截至7月中旬,開賽僅1個月大賽組委會就已經收到了來自全球近80個報名申請 。
出色的開始,更高的期待
伴隨著奧林帕斯大獎和全球數據壓縮大賽相繼進入第二屆,“奧林帕斯”已經成為華為數據存儲正在著力打造的新品牌,專門用來加強產學研合作,聯合學界一起推動數據存儲產業的進步 。
從第一屆奧林帕斯大獎得主那里,我們已經看到科研界在數據技術創新領域的突破 。
獲得百萬懸紅大獎的清華大學舒繼武老師團隊的“持久性內存存儲系統構建與關鍵技術”,創新地提出了持久性內存文件系統與鍵值存儲的設計方法和分布式持久性共享內存框架,攻克了其數據結構、內存管理、一致性與安全等方面的一系列難題,解決了基于新型內存介質的高效數據存儲問題 。
此外,上海交通大學的陳榕團隊的“基于新型異構硬件的高效數據處理系統”,華中科技大學的馮丹團隊的“NVM(新型非易失存儲)高效可靠技術”,也具有較高的創新性和先進性,具備產業價值和應用前景 。
同樣,在第一屆全球數據壓縮大賽上,也涌現出了很多令人矚目的成果 。
比如獲獎選手Peter Thamm設計的pglz算法在壓縮率和性能上,打破了快速壓縮算法的一般認知,指引了壓縮算法優化方向;Konstantinos Agiannis的參賽算法,在文本場景測試中的壓縮率和壓縮性能,均超過業界公認的標桿算法;Andreas Debski的快速圖像壓縮算法,達到了業界公認標桿算法120%的壓縮率,展現了深厚的圖像壓縮算法功底 。
尤為難得是來自全球各地的壓縮算法高手的積極參與 。正如業界大咖Ilya Muravyov所說,這一比賽激發了人們對數據壓縮行業的關注,并讓那些數據壓縮大牛重回他們的主戰場 。
過去一年的成功,也讓我們對今年的“奧林帕斯”有了更高的期待 。對這個太陽系最高峰的攀登,意味著整個數據存儲技術領域的參與者,首次能夠團結一致,共同牽引基礎理論研究方向,突破關鍵技術難題,加速科研成果產業化,實現產學研合作共贏 。
在此進程中,華為一方面發揮了產業引領者的角色,大力推動產學研的合作進程;另一方面也積極投身其中,通過Data Fabric、智能存儲、內存型存儲、數據縮減、視頻存儲等五大創新實驗室,通過4000多名研發工程師的協同努力,圍繞下一代存儲的介質、網絡、架構和管理等進行系統化創新 。
我們也有理由相信,通過全球、全領域的協同創新,我們一定能夠迎來數據存儲技術的突破,通過技術重構實現更好的數據存儲效能,讓全世界共享數字技術紅利,進而推動千行百業的智能化升級 。

推薦閱讀