原创 AI芯片:寒武紀NPU設計分析(DianNao)

國內人工智能處理器獨角獸寒武紀,在這個領域,算是走在了世界前沿,經過最近幾年的迅猛發展,取得了輝煌的成果。 最近花了些時間研究了下寒武紀發表的一系列論文中介紹的NPU的結構。 記錄下來,算是對最近學習內容的總結。 寒武紀從20

原创 System Verilog的task與function,以及task的接口信號與function的返回值

最近寫代碼,調試過程中,踩了無數坑,摘取一些作爲記錄。 以備之後查看。 1.Task和function 不同點: Task,只用來仿真調試,可以有延遲。 Function,可以綜合成一堆組合電路,所以,不能加延遲。 相同點: 內部

原创 linux中如何創建及複製文件/文件夾的軟鏈接?

在Windows中有快捷方式。 對應的,在linux中有軟鏈接。 1.如何生成軟鏈接呢? 命令: ln -s a b 其中,a代表想要進行軟鏈接的單個原始文件,如果是多個文件,那麼就包括文件路徑及文件夾名。 b 就是給軟連接重

原创 github 修改遠程倉庫地址

首先查看github遠程倉庫的地址,比如:abc.git 那麼在倉庫對應的本地文件夾abc中,輸入命令: git remote set-url origin abc.git 回車 即可。

原创 github下載新的倉庫

當需要下載新的倉庫(地址:http://a/aa)。 首先,在本地的某個路徑下,建立一個文件夾a(你想要放置新的倉庫的地方); 然後,進入文件夾a,輸入命令 git clone http://a/aa/aa.git 回車 就可以了

原创 cadence關於延遲的命令

在 irun 命令行中加上 -define_sequdp_delay 可以讓仿真器認爲信號經過器件有延遲。 比如有兩個信號a和b。 a有3個buffer b有1個buffer 那麼,會認爲同一個信號經過a和b,a的延遲大,b的延遲

原创 AI芯片:華爲Ascend(昇騰)910結構分析

前幾天,華爲發佈了最新的AI芯片,號稱目前全球最強,算力吊打谷歌TPU3和英偉達Tesla V100。 這麼震撼人心,必須挺一波!! 華爲牛逼!! (這句5毛) 下面來具體分析一下。 一、昇騰910的整體結構 我去華爲官網查了一下

原创 AI芯片:清華天機芯片內部結構分析(TianJic)

最近,清華七年磨一劍,放出一大招,文章直接登上NATURE的封面。 《Towards artificial general intelligence with hybrid Tianjic chip architecture》。

原创 AI芯片:華爲昇騰(ASCEND)310結構分析

華爲的麒麟SOC中使用的是寒武紀的AI芯片模塊。 但是,華爲自己也推出了自有的AI芯片架構。 本文根據華爲公佈的信息,簡單分析下其結構。 所有信息都來自互聯網,來自華爲的官方信息。 感謝華爲的分享!! 首先看看,華爲發佈的一張海報

原创 linux中如何創建文件/文件夾的軟鏈接?

在Windows中有快捷方式。 對應的,在linux中有軟鏈接。 如何生成軟鏈接呢? 命令: ln -s a b 其中,a代表想要進行軟鏈接的單個原始文件,如果是多個文件,那麼就包括文件路徑及文件夾名。 b 就是給軟連接重新命名。

原创 AI芯片:SystemVerilog Debug常用的參考數據--16進制數/半精度浮點數

作爲AI芯片設計驗證工程師,會用到SystemVerilog/Verilog等硬件語言去寫設計代碼。 寫好設計代碼後,都會自己先簡單測試一下。 目前的AI芯片,不再選擇傳統的單精度和雙精度浮點數作計算,而是選擇半精度浮點數,如果做了量

原创 SystemVerilog驗證編譯錯誤:關於動態變量的賦值問題

今天遇到一個編譯錯誤, 如下: Reference to automatic variable and elements of dynamic variables is not allowed outside procedual b

原创 AI芯片:清華大學可重構混合神經網絡處理器結構分析

清華大學微納電子系的尹首一等人於2018年發表論文《A 1.06-to-5.09 TOPS/W Reconfigurable Hybrid-Neural-Network Processor for Deep Learning Appl

原创 AI芯片:寒武紀DianNao,英偉達NVDLA和谷歌TPU1的芯片運算架構對比分析

前面幾篇博客分別分析了目前市面上能夠找到的各家AI芯片的結構。 下面做一個階段性的對比分析及總結。 AI芯片運算架構對比 整體來看,NVDLA的架構與寒武紀的DianNao比較像。所以,單位資源的性能應該是差不多的。 二者性能的區別,

原创 AI芯片:英偉達NVDLA結構分析

英偉達開源了深度學習硬件架構:NVDLA。 包括完整的源代碼:Verilog代碼,C_Model代碼,以及驗證平臺代碼。 英偉達官網上也有詳細的文檔。 英偉達NVDLA官網:http://nvdla.org/primer.html 非