超越蘋果 M1,OpenCV 4.7 在華為昇騰架構(gòu)下僅 3.29ms 完成 ResNet50 推理
IT之家(汪淼)
IT之家 1 月 18 日消息,英特爾開源計算機視覺庫 OpenCV 4.7 于去年 12 月正式發(fā)布。新版本帶來了全新的 ONNX 層,大大提高了 DNN 代碼的卷積性能,還為 DNN 模塊提供了華為昇騰 CANN 后端支持。
根據(jù) OpenCV 中國團隊的最新測試,基于昇騰異構(gòu)計算架構(gòu) CANN 的加速能力,用 OpenCV Zoo 中的 PP-ResNet50、MobileNet 和 YOLOX 對 CANN 后端進行了測試,發(fā)現(xiàn)三個模型在 CANN 后端下分別達到了 3.29ms,1.21ms,12.80ms 的優(yōu)異結(jié)果。

同時,CANN 后端的推理結(jié)果也與默認 CPU 后端的基本保持一致。使用 OpenCV,用戶只需下面 7 行 Python 代碼,無需學習 CANN 的 API,就可以簡潔地調(diào)用起昇騰 AI 處理器,實現(xiàn)神經(jīng)網(wǎng)絡(luò)加速推理(核心為第三、四行代碼,其余為常見模型推理邏輯代碼):

?南方科技大學計算機系的于仕琪老師表示,即使 OpenCV 針對 ARM CPU 進行了 winograd conv 等優(yōu)化,在蘋果標桿 CPU M1 上完成 ResNet50 推理都要跑 20ms 以上,而華為昇騰僅用了 3.29ms。

IT之家了解到,昇騰 CANN(Compute Architecture for Neural Networks)是華為針對 AI 場景推出的異構(gòu)計算架構(gòu)。昇騰 CANN 支持昇思 MindSpore,OpenCV DNN,飛槳 Paddle、PyTorch、TensorFlow 等神經(jīng)網(wǎng)絡(luò)推理和訓練框架,并兼容多種底層硬件設(shè)備。
