GitHub項目推薦 | ChainerCV:計算機視覺中的深度學習圖書館

ChainerCV是一個使用Chainer訓練和運行神經網絡以進行計算機視覺任務的工具集合。

GitHub項目地址:https://github.com/chainer/chainercv

文檔鏈接: http://chainercv.readthedocs.io/en/stable/

ChainerCV支持的任務如下:

  • 圖像識別 (ResNet, SENet, VGG)
  • 對象檢測 (教程, 更快的 R-CNN, SSD, YOLO)
  • 語義分割 (SegNet, PSPNet)
  • 實例分割 (FCIS,)

指導原則

ChainerCV 根據以下三個原則進行開發:

  • 易用性:實現具有內聚性和簡單接口的計算機視覺網絡。
  • 再現性:其訓練腳本非常適合作爲參考實現。
  • 組合性:工具中具有通用API的數據加載器和評估腳本。

安裝

$ pip install -U numpy$ pip install chainercv

用Anaconda進行安裝的說明,請訪問: http://chainercv.readthedocs.io/en/stable/#install-guide(推薦)

安裝要求

  • Chainer及其依賴項
  • Pillow
  • Cython (構建要求)

額外功能

  • Matplotlib
  • OpenCV
  • SciPy
  • mpi4py
  • pycocotools

ChainerCV已經測試了在Python 2.7.12 和 3.6.0下的環境

  • 主分支設計用於Chainer v4(穩定版)和Chainer v5(開發版)。
  • 以下的分支保留了Chainer過去的版本,需要注意的是這些分支已經不再維護。

0.4.11(Chainer v1)。可以通過命令pip install chainercv == 0.4.11安裝。

0.7(Chainer v2)。可以通過命令pip install chainercv == 0.7安裝。

0.8(Chainer v3)。可以通過命令pip install chainercv == 0.8安裝。

0.10(Chainer v4)。可以通過命令pip install chainercv == 0.10安裝。

數據規範

1.圖像

  • 色彩通道的順序爲RGB;
  • 形狀爲CHW(例如:(通道,高度,寬度));
  • 數值的範圍是[0,255];
  • 大小用 行-列 的順序表示(例如:(高度,寬度))

2.邊界框

  • 形狀爲(R,4);
  • 座標排序爲(y_min,x_min,y_max,x_max),順序與OpenCV相反

3.語義分割圖像

  • 形狀爲(高度,寬度);
  • 值爲 class id,其數值範圍在[0,n_class - 1]之間

樣本可視化

上圖是ChainerCV支持的檢測模型所輸出的結果

引文

如果ChainerCV有助於你的研究,請引用ACM多媒體開源軟件競賽的論文。以下是一個BibTeX條目:

@inproceedings{ChainerCV2017,
    author = {Niitani, Yusuke and Ogawa, Toru and Saito, Shunta and Saito, Masaki},
    title = {ChainerCV: a Library for Deep Learning in Computer Vision},
    booktitle = {ACM Multimedia},
    year = {2017},
}

論文的查看入口: https://arxiv.org/abs/1708.08169

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章