原创 SystemVerilog計算規則:你真的懂賦值規則嗎?

最基礎的,往往最容易出錯。 最近,用到了SystemVerilog去寫計算,然後,各種賦值規則,讓人眼花繚亂,特此記錄。 下面以int類型的賦值爲例。 int的賦值方式有三種,分別是: (1)unsized, unbased inte

原创 磨刀不誤砍柴工:開發Model,輔助設計DUT

論開發Model對設計DUT的重要性 最近在設計一個模塊。 時間緊,任務重。一開始,覺得爲了節約時間,沒有先開發Model,直接去寫DUT。 整個模塊分成三部分。 在分別完成三個部分時,由於並不十分複雜,故都是手算的計算結果,然後驗證

原创 verilogHDL,system Verilog代碼的多驅動問題

信號多驅動問題0.起因1.現象起源2.原因分析3.解決辦法4.思維拓展(1)兩個always塊的時鐘不同,條件互斥;(2)時鐘相同,但是條件不互斥,可能發生衝突;(3)時鐘不同,且條件不互斥; 0.起因 最近在項目設計時,遇到了信號多

原创 AI芯片:寒武紀PuDianNao結構分析

PuDianNao 之前介紹了寒武紀的DianNao和DaDianNao,其實內部處理邏輯可以說是一樣的。 這種架構,只能適用特定的算法類型,比如深度學習(CNN,DNN,RNN)等。 但是,深度學習只是機器學習中的某一類,整個機

原创 AI芯片:深鑑科技基於深度壓縮的ESE方案分析

ESE 這篇論文,將之前介紹的韓鬆的Deep Compression技術在FPGA上具體實現。 爲了達到更高的效率,論文的設計從三個層次提高計算效率:算法優化,編譯高效的調度程序,硬件加速。如Figure 2所示。 論文設計的語

原创 AI芯片:寒武紀ShiDianNao結構分析

ShiDianNao ShiDianNao的出現是寒武紀在深度學習處理器上細分領域的更加深入。 前面介紹的DianNao針對的是大部分的深度學習神經網絡算法,包括CNN和RNN等。 目前比較火而且應用面非常廣的領域是計算機視覺,若在

原创 AI芯片:寒武紀Cambricon-X結構分析

五、Cambricon-X Cambricon-X是針對稀疏係數的矩陣計算架構。 深鑑科技的韓鬆等人的研究發現,可以將傳統的深度學習網絡模型的許多權重係數去掉,甚至能去掉90%以上,而並不影響模型的計算精度。如下圖所示。 目

原创 AI芯片:寒武紀DaDianNao結構分析

DaDianNao 寒武紀的DaDianNao的誕生稍晚於DianNao,同樣也是在2014年。(這裏僅僅指論文發表時間) 如果把DianNao看作是嵌入式終端使用的處理器,那麼DaDianNao就是服務器上用的大規模高性能處理器。

原创 調試代碼模塊功能的小技巧:化繁爲簡

實際項目中,設計往往有許多功能模塊,設計人員會各自負責一個或幾個功能模塊。 如何有效調試代碼功能呢? 下面就結合我最近的設計階段,所經歷的問題及解決問題的感悟。 只是我自己的一些經驗心得,一家之言,姑且聽之。 第一階段 站在設計人員的

原创 基於python的機器學習人工智能入門之tensorflow / keras安裝(Windows環境)

因爲項目需要,研究基於機器學習的人工智能。 俗話說,工欲善其事,必先利其器。 學習人工智能,首先就要有一個開發環境,也就是寫代碼跑仿真的地方。 折騰了幾天,終於成功建立了基於tensorflow和keras的開發環境。 中間遇到了

原创 AI芯片:商湯科技基於winograd算法的FPGA方案分析

商湯科技2017年發表了一篇論文:Evaluating Fast Algorithms for Convolutional Neural Networks on FPGAs. 商湯科技的這篇論文,利用論文Fast Algorithms

原创 UVM register model 寄存器模型中:peek()與reg_model.reg_name.value獲取的值不同的原因

最近因爲項目需要,負責給基於UVM驗證平臺添加寄存器模型。 參考了張強的《UVM實戰:卷1》中第七章的內容,並借鑑了其他項目的code。 總算實現了寄存器模型,利用predictor和adapter,實現了寄存器模型的前門訪問。 然

原创 AI芯片:寒武紀NPU設計分析(DianNao/DaDianNao/ShiDianNao)

國內人工智能處理器獨角獸寒武紀,在這個領域,算是走在了世界前沿,經過最近幾年的迅猛發展,取得了輝煌的成果。 最近花了些時間研究了下寒武紀發表的一系列論文中介紹的NPU的結構。 記錄下來,算是對最近學習內容的總結。 寒武紀從2014年開

原创 AI芯片:谷歌TPU1設計分析

前言 (作者原創,未經允許不得轉載。) 最近在研究人工智能芯片架構,反複分析了谷歌公開的TPU ( Tensor Processing Unit) 專利,從中獲得些許感悟,記錄下來,以備之後查看,也方便廣大知友查閱。 特此感謝谷歌的分

原创 Linux中如何殺掉任務進程?

跑仿真時,因爲各種原因,導致仿真軟件沒有了反應,而且點擊關閉也無法響應。 這該怎麼辦? 百度了之後,從許多博客/經驗/知道中提取了兩個有用的命令。 特此記錄,以備後續使用。 第一步: ps -ef | grep XXXX 這個