Project: Inference Framework based TensorRT

原創

2020-02-20 21:42

引言

視覺算法經過幾年高速發展，大量的算法被提出。爲了能真正將算法在實際應用場景中更好地應用，高性能的 inference框架層出不窮。從手機端上的ncnn到tf-lite，NVIDIA在cudnn之後，推出專用於神經網絡推理的TensorRT. 經過幾輪迭代，支持的操作逐漸豐富，補充的插件已經基本滿足落地的需求。筆者覺得，尤其是tensorrt 5.0之後，無論是接口還是使用samples都變得非常方便集成。

版本選型與基本概念

FP16 INT8

The easiest way to benefit from mixed precision in your application is to take advantage of the support for FP16 and INT8 computation in NVIDIA GPU libraries. Key libraries from the NVIDIA SDK now support a variety of precisions for both computation and storage.

Table shows the current support for FP16 and INT8 in key CUDA libraries as well as in PTX assembly and CUDA C/C++ intrinsics.

Feature	FP16x2	INT8/16 DP4A/DP2A
PTX instructions	CUDA 7.5	CUDA 8
CUDA C/C++ intrinsics	CUDA 7.5	CUDA 8
cuBLAS GEMM	CUDA 7.5	CUDA 8

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

高通SNPE開發筆記

引言從2011年甚至更早開始，智能手機，智能終端，車載芯片等等智能終端中，高通芯片無處不在。相比較Intel，高通抓住了移動處理器中續航的問題，不斷推出低功耗移動處理器，從而抓住移動處理器的市場。日常工作中接觸到很多冠以高通之名的產品，

2020-06-26 09:03:21

Caffe: 使用經驗總結

引言在深度學習框架caffe的使用過程中，加深了對神經網絡的理解，同時也將神經網絡知識從理論落到實處。希望日後多多拿代碼時間，將該總結繼續增廣~~ 深度學習中常用的調節參數學習率步長的選擇：你走的距離長短，越短當然不會錯過，但是耗時

2020-06-26 09:03:24

caffe之工具

引言最近跟小夥伴設計訓練了很多模型，我們主要通過看mAP進行判斷這個模型的好壞，沒有將模型實際效果進行顯示觀察。這不，就想着寫個調用的程序進行顯示。顯示訓練過程中的loss變化情況顯示訓練過程中的lr變化情況模型的inferenc

2020-06-26 09:03:24

DenseNet: Densely Connected CNN

文章來源 arxivtorch代碼地址caffe模型地址突出貢獻 In this paper, we propose an architecture that distills this insight into a simple

2020-06-26 10:14:56

CNN的感受野

原文地址翻譯來源：A guide to receptive field arithmetic for Convolutional Neural Networks 看這篇博客之前希望對CNN的基本概念有所瞭解，尤其是卷積和pooling操

2020-06-26 10:14:55

OpenCV中的算法--透視和仿射變換

引言仿射變換保證物體形狀的“平直性”和“平行性”。透視變換不能保證物體形狀的“平行性”。仿射變換是透視變換的特殊形式。仿射變換，又稱仿射映射，是指在幾何中，一個向量空間進行一次線性變換並接上一個平移，變換爲另一個向量空間。仿射變換是在

2020-06-26 10:14:55

Inception Architecture for Computer Vision

目的 2014年之後，深度CNN網絡成爲主流，其中出現了Inception之後，將神經網絡由十幾層加深到34層[^2], Inception作爲後來深度神經網絡中的重要組成模塊，有對其中的原理和效果進行鑽研學習一下。論文 [Networ

2020-06-26 09:03:24

格式塔心理學--產生和基本觀點

格式塔心理學的產生和基本觀點格式塔學派（德語:Gestalt theorie）是心理學重要流派之一，興起於20世紀初的德國，由魏特海默(M．Wetheimer，1880~1943)、苛勒(W．kohler，1887~1967)和

2020-06-23 06:26:48

Tensorrt環境搭建

Tensorrt環境搭建環境安裝 python 3.6 TensorRT 7.0.0.1 https://developer.nvidia.com/nvidia-tensorrt-7x-download cd /path/to/

2020-07-03 21:24:43

【PyTorch】模型部署

Backto PyTorch Index 最佳實踐 Best Practice 2020-07-03 Server/Nvidia ：C++ / TensorRT Mobile/Non-Nvidia : TVM 技術路徑 Pat

北境の守卫

2020-07-03 17:34:31

TensorRT (一） Win10 安裝配置

我的環境： Anaconda3 / Python 3.7 Tensorflow-gpu 1.14 TensorRT 7 CUDA 10 CUDNN 7.6 VS 2019 一、下載TensorRT TensorRT 官方下載：地址

2020-06-29 06:51:07

TensorRT (二）Python3 yoloV3 / yoloV3-tiny 轉 onnx

環境: python3.6 /anacoda cuda10.0 cudnn7.６.4 一、所需的包 pip install numpy #1.16.1 如果你有tensorflow

2020-06-29 06:51:07

解決：src/cpp/cuda.hpp:fatal error: cuda.h

在.bashrc中，如下修改： vi ~/.bashrc export PATH=/usr/local/cuda-10.0/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-10.0/

2020-06-29 06:51:07

TensorRT (一） Ubuntu 安裝配置

環境： Ubuntu 18.04 CUDA 10 CUDNN 7.6.3 TensorRT 7 一、下載tar包 TensorRT官方：地址二、解壓tar包 $ tar xzvf TensorRT-7.x.x.x.<o

2020-06-29 06:51:07

TensorRT使用基本流程

tensorRT的使用包括兩個階段， build and runtime (deployment)： build：Import and optimize trained models to generate inference e

2020-06-21 19:18:11

24小時熱門文章

最新文章

最新評論文章