原创 PyTorch學習筆記(16)——編寫你自己的PyTorch kernel(基於PyTorch1.2.0)

在前一陣看過PyTorch官方核心開發者Edward Z, Yang的在紐約舉辦的PyTorch NYC Meetup的關於PyTorch內部機制的講解。從通過strides指定邏輯佈局,tensor wrapper到autog

原创 基於TensorRT 5.x的網絡推理加速(python)

本文目的主要在於如何使用TensorRT 5.x的python api來進行神經網絡的推理。因爲目前TensorRT只支持ONNX,Caffe和Uff (Universal Framework Format)這三種格式。這裏以t

原创 gRPC python封裝深度學習算法教程

最近需要提供一個包含多個神經網絡推理的python代碼供gRPC調用,即我需要在這個主程序的基礎上封裝一個支持gRPC的服務端(server)。本教程的目的在於通過簡單的代碼,來幫助有需求的朋友使用python來構建屬於自己的g

原创 2018 輕量化網絡Mobilnet v2

0. MobileNet介紹 MobileNet是M爲移動和嵌入式設備提出的高效模型。MobileNet基於流線型(streamlined) 架構,使用深度可分離卷積(depthwise separable convolutions,

原创 2017 如何訓練一個GAN網絡

GAN, 作爲一種非常厲害的生成模型, 在近年來得到了廣泛的應用. Soumith, PyTorch之父, 畢業於紐約大學的Facebook的VP, 在2015年發明了DCGAN: Deep Convolutional GAN. 它

原创 2018 Additive Attention分析及代碼

最近需要評估一些self-attention模塊的效果, 除了簡單好用的Squeeze-Excitation外, Additive Attention (AA) 是最近開始受到人們注意的一個新型self-attention的注意力

原创 PyTorch學習筆記(14) ——PyTorch 1.0 的C++ FrontEnd初體驗

在去年12月份,我嘗試了一下PyTorch 1.0的C++前端, 當時官方負責PyTorch的C++前端的老哥是: Peter Goldsborough, 當時的C++前端還不夠穩定,官方文檔提供的demo無法跑通. 所以爲了避免後

原创 Nevergrad: 一個Facebook發佈的derivative-free的開源優化工具包

本文翻譯自Olivier Teytaud等人於2018年底發佈在code.fb.com上的一篇文章Nevergrad: An open source tool for derivative-free optimization . N

原创 2017 Deformable ConvNets V1介紹及分析(包括代碼)

最近Deformable Conv V2比較火, Deformable Conv的概念是MSRA的戴季峯等人提出來的, 挺不錯的一個東西, 對於有形變的物體的識別效果很好, 今天先把其前身Deformable ConvNets V1

原创 2018 Iterative Visual Reasoning Beyond Convolutions 論文梳理

18年是GNN開始初出茅廬也是大放異彩的一年, 這篇論文是李飛飛團隊的關於GNN在CV領域中的一個開拓性的應用.甚至作者陳鑫磊稱, 通過結合CNN和GNN, 本文發明了"下一代的視覺識別系統". 這個觀點是不是很讓人瑟瑟發抖? 好了

原创 Tensorflow③ Keras的LSTM和TF的LSTM實現的源碼剖析

最近在做可以轉成pb模型的RNN/LSTM層的實現細節分析。經過一些分析,發現了在Keras裏面常見的keras.layers.LSTM和Tensorflow的tf.contrib.rnn.LSTMCell有一些實現上面的區別。本文

原创 阿里雲ECS搭建gogs(Ubuntu16.04)

前言 因爲我的阿里雲服務器是隻有1核和512MB內存最“頂級”的配置。安裝和配置gitlab做版本管理的話至少需要4GB,即便我搞了4G的SWAP分區也不行。 在gitlab的配置過程中不只一次把我搞死,所以在請教大神的意見後,轉而搭

原创 PyTorch學習筆記(13)——強力的可視化工具visdom

今天,讓我們來放鬆一下大腦,學習點輕鬆的東西————可視化工具Visdom,它可以讓我們在使用PyTorch訓練模型的時候,可視化中間的訓練情況,無論是loss變化還是中間結果比較。相比干呆呆的瞪着命令行,Visdom讓我們的調參之

原创 Ubuntu /boot 佔滿解決方案

轉載自SpeculateCat寫的文章<Ubuntu /boot 佔滿解決方案> 我們在安裝 Window 和 Ubuntu 雙系統的時候,往往會自定義 /boot 分區,一般網上的教程都會建議給 /boot 分區分配 200M-

原创 Tensorflow模型轉換 ckpt轉pb h5轉pb

此篇博客重在總結Tensorflow,Keras模型訓練的模型文件轉換爲pb結構的方式,節省尋找轉換工具的時間。 1. Tensorflow ckpt模型轉換pb模型 我們在Tensorflow中訓練出來的模型一般是ckpt格式的