MindStudio模型訓練場景精度比對全流程和結果分析

摘要:MindStudio是一套基于華為昇騰AI處理器開發的AI全棧開發平臺
本文分享自華為云社區《MindStudio模型訓練場景精度比對全流程和結果分析》,作者:yd_247302088。
一、基于MindStudio模型精度比對介紹1.1 MindStudio介紹MindStudio是一套基于華為昇騰AI處理器開發的AI全棧開發平臺 , 包括基于芯片的算子開發、以及自定義算子開發,同時還包括網絡層的網絡移植、優化和分析,另外在業務引擎層提供了可視化的AI引擎拖拽式編程服務,極大的降低了AI引擎的開發門檻 。MindStudio工具中的功能框架如圖1所示:
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
圖1 MindStudio功能框架
MindStudio工具中的主要幾個功能特性如下:
  • 工程管理:為開發人員提供創建工程、打開工程、關閉工程、刪除工程、新增工程文件目錄和屬性設置等功能 。
  • SSH管理:為開發人員提供新增SSH連接、刪除SSH連接、修改SSH連接、加密SSH密碼和修改SSH密碼保存方式等功能 。
  • 應用開發:針對業務流程開發人員,MindStudio工具提供基于AscendCL(Ascend Computing Language)和集成MindX SDK的應用開發編程方式,編程后的編譯、運行、結果顯示等一站式服務讓流程開發更加智能化 , 可以讓開發者快速上手 。
  • 自定義算子開發:提供了基于TBE和AI CPU的算子編程開發的集成開發環境,讓不同平臺下的算子移植更加便捷,適配昇騰AI處理器的速度更快 。
  • 離線模型轉換:訓練好的第三方網絡模型可以直接通過離線模型工具導入并轉換成離線模型,并可一鍵式自動生成模型接口 , 方便開發者基于模型接口進行編程,同時也提供了離線模型的可視化功能 。
  • 日志管理:MindStudio為昇騰AI處理器提供了覆蓋全系統的日志收集與日志分析解決方案 , 提升運行時算法問題的定位效率 。提供了統一形式的跨平臺日志可視化分析能力及運行時診斷能力 , 提升日志分析系統的易用性 。
  • 性能分析:MindStudio以圖形界面呈現方式,實現針對主機和設備上多節點、多模塊異構體系的高效、易用、可靈活擴展的系統化性能分析,以及針對昇騰AI處理器的性能和功耗的同步分析 , 滿足算法優化對系統性能分析的需求 。
  • 設備管理:MindStudio提供設備管理工具,實現對連接到主機上的設備的管理功能 。
  • 精度比對:可以用來比對自有模型算子的運算結果與Caffe、TensorFlow、ONNX標準算子的運算結果,以便用來確認神經網絡運算誤差發生的原因 。
  • 開發工具包的安裝與管理:為開發者提供基于昇騰AI處理器的相關算法開發套件包Ascend-cann-toolkit,旨在幫助開發者進行快速、高效的人工智能算法開發 。開發者可以將開發套件包安裝到MindStudio上,使用MindStudio進行快速開發 。Ascend-cann-toolkit包含了基于昇騰AI處理器開發依賴的頭文件和庫文件、編譯工具鏈、調優工具等 。
1.2 精度比對介紹自有實現的算子在昇騰AI處理器上的運算結果與業界標準算子(如Caffe、ONNX、TensorFlow、PyTorch)的運算結果可能存在差異:
  • 在模型轉換過程中對模型進行了優化,包括算子消除、算子融合、算子拆分,這些動作可能會造成自有實現的算子運算結果與業界標準算子(如Caffe、TensorFlow、ONNX)運算結果存在偏差 。
  • 用戶原始網絡可以遷移到昇騰910 AI處理器上執行訓練 , 網絡遷移可能會造成自有實現的算子運算結果與用業界標準算子(如TensorFlow、PyTorch)運算結果存在偏差 。
為了幫助開發人員快速解決算子精度問題,需要提供比對自有實現的算子運算結果與業界標準算子運算結果之間差距的工具 。精度比對工具提供Vector比對能力 , 包含余弦相似度、最大絕對誤差、累積相對誤差、歐氏相對距離、KL散度、標準差、平均絕對誤差、均方根誤差、最大相對誤差、平均相對誤差的算法比對維度 。
二、環境準備在進行實驗之前需要配置好遠端Linux服務器并下載安裝MindStudio 。
首先在Linux服務器上安裝部署好Ascend-cann-toolkit開發套件包、Ascend-cann-tfplugin框架插件包和TensorFlow 1.15.0深度學習框架 。之后在Windows上安裝MindStudio , 安裝完成后通過配置遠程連接的方式建立MindStudio所在的Windows服務器與Ascend-cann-toolkit開發套件包所在的Linux服務器的連接,實現全流程開發功能 。
接下來配置環境變量,以運行用戶登錄服務器,在任意目錄下執行vi ~/.bashrc命令,打開.bashrc文件,在文件最后一行后面添加以下內容(以非root用戶的默認安裝路徑為例) 。

推薦閱讀