ChainerCV是一個使用Chainer訓練和運行神經網絡以進行計算機視覺任務的工具集合。
GitHub項目地址:https://github.com/chainer/chainercv
文檔鏈接: http://chainercv.readthedocs.io/en/stable/
ChainerCV支持的任務如下:
- 圖像識別 (ResNet, SENet, VGG)
- 對象檢測 (教程, 更快的 R-CNN, SSD, YOLO)
- 語義分割 (SegNet, PSPNet)
- 實例分割 (FCIS,)
指導原則
ChainerCV 根據以下三個原則進行開發:
- 易用性:實現具有內聚性和簡單接口的計算機視覺網絡。
- 再現性:其訓練腳本非常適合作爲參考實現。
- 組合性:工具中具有通用API的數據加載器和評估腳本。
安裝
$ pip install -U numpy$ pip install chainercv
用Anaconda進行安裝的說明,請訪問: http://chainercv.readthedocs.io/en/stable/#install-guide(推薦)
安裝要求
- Chainer及其依賴項
- Pillow
- Cython (構建要求)
額外功能
- Matplotlib
- OpenCV
- SciPy
- mpi4py
- pycocotools
ChainerCV已經測試了在Python 2.7.12 和 3.6.0下的環境
- 主分支設計用於Chainer v4(穩定版)和Chainer v5(開發版)。
- 以下的分支保留了Chainer過去的版本,需要注意的是這些分支已經不再維護。
0.4.11(Chainer v1)。可以通過命令pip install chainercv == 0.4.11安裝。
0.7(Chainer v2)。可以通過命令pip install chainercv == 0.7安裝。
0.8(Chainer v3)。可以通過命令pip install chainercv == 0.8安裝。
0.10(Chainer v4)。可以通過命令pip install chainercv == 0.10安裝。
數據規範
1.圖像
- 色彩通道的順序爲RGB;
- 形狀爲CHW(例如:(通道,高度,寬度));
- 數值的範圍是[0,255];
- 大小用 行-列 的順序表示(例如:(高度,寬度))
2.邊界框
- 形狀爲(R,4);
- 座標排序爲(y_min,x_min,y_max,x_max),順序與OpenCV相反
3.語義分割圖像
- 形狀爲(高度,寬度);
- 值爲 class id,其數值範圍在[0,n_class - 1]之間
樣本可視化
上圖是ChainerCV支持的檢測模型所輸出的結果
引文
如果ChainerCV有助於你的研究,請引用ACM多媒體開源軟件競賽的論文。以下是一個BibTeX條目:
@inproceedings{ChainerCV2017, author = {Niitani, Yusuke and Ogawa, Toru and Saito, Shunta and Saito, Masaki}, title = {ChainerCV: a Library for Deep Learning in Computer Vision}, booktitle = {ACM Multimedia}, year = {2017}, }
論文的查看入口: https://arxiv.org/abs/1708.08169