可以對着圖閱讀代碼,這樣會更有概念
Mask-RCNN 代碼實現
文中代碼的作者是Matterport: 代碼github地址,文中詳細的介紹了各個部分,以及給了demo和各個實現的步驟及其可視化。
代碼總體框架
先貼出我對作者代碼流程的理解,及其畫出的流程圖。
圖1.代碼中training的流程圖
圖2.代碼中predict的流程圖
兩張流程圖其實已經把作者的代碼各個關鍵部分都展示出來了,並寫出了哪些層是在training中用,哪些層是在predict中用,及其層的輸出和需要的輸入。可以清晰的看出training和predict過程是存在較大的差異的,也是之前說過的,training的時候mask與classifier是並行的,predict時候是先classifier再mask,並且兩個模型的輸入輸出差異也較大。
已經有一篇博客寫的很好,對作者代碼的那幾個ipynb都運行了一遍,並且加上了自己的理解。非常的感謝那位博主,之前在探究Mask-RCNN的時候那邊博文對我的幫助很大,有興趣的可以看看那片博文:http://blog.csdn.net/u011974639/article/details/78483779?locationNum=9&fps=1