原创 python tile函數

在看機器學習實戰這本書時,遇到numpy.tile(A,B)函數,愣是沒看懂怎麼回事,裝了numpy模塊後,實驗了幾把,原來是這樣子: 重複A,B次,這裏的B可以時int類型也可以是遠組類型。 >>> import numpy >

原创 cublas vs nervana

測試nervana 與 cublas的性能: 矩陣A:[M,K] 矩陣B:[K,N] 矩陣C:[M,N] C = A * B code: test_nervana_vs_cublas.cpp #include <iostream> #

原创 kaldi 安裝

一、預習安裝包(系統Ubuntu) #install some package first sudo apt-get install libtool sudo apt-get install autoconf sudo apt-ge

原创 EVP 對稱加密

openssl evp 對稱加密(AES_ecb,ccb) evp.h 封裝了openssl常用密碼學工具,以下主要說對稱加密的接口 enc_dec.cpp #include <stdio.h> #include <stdlib.h>

原创 MIC卡驅動安裝

KNC mic 卡驅動安裝 一:從Intel的官網獲得MPSS     1、查看自己主機操作系統版本     【host】#cat  /etc/*release     2.從Intel官網選擇對應的MPSS版本(本文是redhat7.

原创 HDF5 使用介紹

1、HDF5介紹 HDF 是用於存儲和分發科學數據的一種自我描述、多對象文件格式。HDF 是由美國國家超級計算應用中心(NCSA)創建的,以滿足不同羣體的科學家在不同工程項目領域之需要。HDF 可以表示出科學數據存儲和分佈的許多必要條件。

原创 caffe 計算過程

caffe計算過程      一:        caffe中Blob是數據存儲的基本單位。層的計算過程是上一層的輸出Blob作爲本層的輸入Blob,經過當前層的計算得到當前層的輸出Blob(如下圖,取自caffe教程)。作爲初學者來講,

原创 caffe im2col 詳解

caffe im2col詳解 本文講解的是caffe中卷積過程,衆所周知caffe中卷積採用的是im2col和sgemm的方式。網上已經有很多的im2col的講解。原本不打算寫這篇文章(在此不得不吐槽下,網上有不少的講解caffe i

原创 CUDA C 矩陣乘優化

       CUDA C 矩陣乘的分塊優化        使用分塊的矩陣乘法是比較常用的優化矩陣乘法的方式,作爲初學CUDA的人來講理解起來還是略微有點困難的。同時矩陣乘法在HPC工程師面試的過程中也是被經常提到的。在CUDA的samp

原创 caffe blobs 共享內存分析

caffe blobs 共享內存分析     1、caffe中內存分配情況         caffe層間的輸入輸出是以Blob爲單位,每個Blob中存儲有訓練數據和梯度,caffe也給出了Blob級的接口函數。caffe在初始化階段就會