原创 CPU推理性能提高數十倍,MegEngine計算圖、MatMul優化解析 | 工程之道

本文針對曠視天元深度學習框架在推理優化過程中所涉及的計算圖優化與 MatMul 優化進行深度解讀。 背景及引言在深度學習大規模落地邊緣端場景的今天,如何最大程度降本增效,是企業與開發者共同關注的話題。其中,模型的訓練與推理是兩個關鍵環節。