MindStudio模型訓練場景精度比對全流程和結果分析( 三 )


在出現的信息配置框輸入相關配置信息 , 如下圖所示:

MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
輸入服務器的SSH信息,如果測試連接失敗,建議使用CMD或XShell等工具進行排查 。
選擇遠程 CANN 安裝位置 , 如下圖所示:
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
在Remote CANN location中選擇CANN的路徑,需要注意的是必須選擇到CANN的版本號目錄 , 這里選擇的是5.1.RC2版本,如下圖所示:
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
點擊確定后,需要等待MindStudio進行文件同步操作 , 這個過程會持續數分鐘,期間如果遇到Sync remote CANN files error.錯誤,考慮是否無服務器root權限 。
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
配置完成CANN點擊下一步
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
在訓練工程選擇界面,選擇“TensorFlow Project” , 單擊“Finish” 。
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
進入工程界面,單擊工具欄中
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
按鈕( TensorFlow GPU2Ascend工具) 。
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
進入“TensorFlow GPU2Ascend”參數配置頁,配置command file
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
  • Command File:tfplugin插件包中的工具腳本文件 。
  • Input Path:待轉換腳本文件的路徑 。
  • Output Path:腳本轉換后的輸出路徑 。
根據tfplugin文件所在路徑選擇/Ascend/tfplugin/5.1.RC2/python/site-packages/npu_bridge/convert_tf2npu/main.py,如下圖所示
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
同樣的 , 選擇下載的代碼路徑作為input path,并選擇輸出路徑,如下圖所示:
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
點擊Transplant進行轉換,如下圖所示:
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
出現“Transplant success!”的回顯信息,即轉換成功 。如下圖所示:
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
4.2 生成dump數據和計算圖文件步驟一 dump前準備 。
編輯resnet_run_loop.py文件,修改如下(以下行數僅為示例,請以實際為準):
注釋掉第83、85行
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
把max_steps設置為1 。
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
注釋掉第575~582行
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
注釋掉第595行,修改為“return None” 。
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
編輯cifar10_main.py文件,將train_epochs的值改為1 。
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
步驟二 dump參數配置 。
為了讓訓練腳本能夠dump出計算圖,我們在訓練腳本中的包引用區域引入os,并在構建模型前設置DUMP_GE_GRAPH參數 。配置完成后,在訓練過程中,計算圖文件會保存在訓練腳本所在目錄中 。
編輯cifar10_main.py,添加如下方框中的信息 。
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
修改訓練腳本(resnet_run_loop.py),開啟dump功能 。在相應代碼中,增加如下方框中的信息 。
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
步驟三 環境配置 。
單擊MindStudio菜單欄“Run > Edit Configurations...” 。
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
進入運行配置界面,選擇遷移后的訓練腳本 。
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
MindStudio模型訓練場景精度比對全流程和結果分析

文章插圖
配置環境變量,打開下圖所示界面 , 配置訓練進程啟動依賴的環境變量,參數設置完成后,單擊“OK” , 環境變量配置說明請參見下表 。

推薦閱讀