原创 python tile函數
在看機器學習實戰這本書時,遇到numpy.tile(A,B)函數,愣是沒看懂怎麼回事,裝了numpy模塊後,實驗了幾把,原來是這樣子: 重複A,B次,這裏的B可以時int類型也可以是遠組類型。 >>> import numpy >
原创 cublas vs nervana
測試nervana 與 cublas的性能: 矩陣A:[M,K] 矩陣B:[K,N] 矩陣C:[M,N] C = A * B code: test_nervana_vs_cublas.cpp #include <iostream> #
原创 kaldi 安裝
一、預習安裝包(系統Ubuntu) #install some package first sudo apt-get install libtool sudo apt-get install autoconf sudo apt-ge
原创 EVP 對稱加密
openssl evp 對稱加密(AES_ecb,ccb) evp.h 封裝了openssl常用密碼學工具,以下主要說對稱加密的接口 enc_dec.cpp #include <stdio.h> #include <stdlib.h>
原创 MIC卡驅動安裝
KNC mic 卡驅動安裝 一:從Intel的官網獲得MPSS 1、查看自己主機操作系統版本 【host】#cat /etc/*release 2.從Intel官網選擇對應的MPSS版本(本文是redhat7.
原创 HDF5 使用介紹
1、HDF5介紹 HDF 是用於存儲和分發科學數據的一種自我描述、多對象文件格式。HDF 是由美國國家超級計算應用中心(NCSA)創建的,以滿足不同羣體的科學家在不同工程項目領域之需要。HDF 可以表示出科學數據存儲和分佈的許多必要條件。
原创 caffe 計算過程
caffe計算過程 一: caffe中Blob是數據存儲的基本單位。層的計算過程是上一層的輸出Blob作爲本層的輸入Blob,經過當前層的計算得到當前層的輸出Blob(如下圖,取自caffe教程)。作爲初學者來講,
原创 caffe im2col 詳解
caffe im2col詳解 本文講解的是caffe中卷積過程,衆所周知caffe中卷積採用的是im2col和sgemm的方式。網上已經有很多的im2col的講解。原本不打算寫這篇文章(在此不得不吐槽下,網上有不少的講解caffe i
原创 CUDA C 矩陣乘優化
CUDA C 矩陣乘的分塊優化 使用分塊的矩陣乘法是比較常用的優化矩陣乘法的方式,作爲初學CUDA的人來講理解起來還是略微有點困難的。同時矩陣乘法在HPC工程師面試的過程中也是被經常提到的。在CUDA的samp
原创 caffe blobs 共享內存分析
caffe blobs 共享內存分析 1、caffe中內存分配情況 caffe層間的輸入輸出是以Blob爲單位,每個Blob中存儲有訓練數據和梯度,caffe也給出了Blob級的接口函數。caffe在初始化階段就會