跟蹤問題觀點

Q1: 如何看待機器學習算法(如模型及優化算法)在處理視覺跟蹤問題上的作用?

A1: 多數在模型層面思考跟蹤問題 。(左旺孟)

A2: 機器學習算法十分重要,基於learning-based算法仍然十分有效。跟蹤領域要求可能不太一樣,根據問題特點提出適合的算法,offline training, online finetuning等都是tracking的特色。(魯繼文)

A3: 跟蹤本是一個oneshot learning問題。解決問題時,要從tracking問題本身出發,模型更新,特徵選取與學習,時序建模等。CV會議一般從問題本身出發,機器學習刊物更看重模型的通用性。(馬超)

A4: 機器學習算法作爲工具,從不同角度發掘潛力。另外,tracking中的核心問題是online問題,如何建立online 與offline的關係,使online update 更加快速準確非常重要。(彭厚文)

A5: 機器學習作爲工具,結合tracking問題設計解決方案。(李成龍)

Q2: 相比目標檢測、圖像分割等基礎視覺問題,視覺目標跟蹤目前發展還存在哪些不足之處?

A1: Tracking對其他領域的影響不足。(李成龍)

A2: online 是tracking的本質問題,很多vision問題所不具有。detection在複雜場景中依然需要依賴tracking技術。某些角度看,tracking比detection滯後,但是有本身的特點。(彭厚文)

A3: tracking的evaluation是大問題,現有的metric不太可靠。tracking的框架沒有突破detection/verification,沿用tracking-by-detection,沒有發展獨立的研究問題,本質問題有待突破。(魯繼文)

A4: 對其他學科啓發、促進作用有限。如果將tracking作爲oneshot learning發展的平臺,影響力會更大。雖然oneshot learning無法解決tracking中的所有問題,但如果最好的oneshot learning算法來自於tracking,則會更好。(左旺孟)

A5: detection對領域的貢獻的確比較大,tracking相比較爲有限。時序連續性,例如motion建模是tracking的重要問題,但目前的方法主要基於appearance缺乏時序建模。忽視了tracking本身的一些問題。對這些問題的研究可以提升tracking領域研究的個性。(馬超)

Q3: 目前視覺目標跟蹤研究更加註重外觀建模而較爲忽視時序信息建模,如何看待這一現象?有沒有好的時序建模思路?

A1: LSTM在tracking上的應用較爲困難,訓練需要大量數據,但目前tracking數據集有限。(馬超)

A2: 時序建模問題的確很多,反而簡單的,相鄰幀模型更爲有效。LSTM在視頻超分辨中反倒有效果,可能和tracking本身的特性有關。(左旺孟)

A3: 能否預測目標外觀的變化,這與時序建模可能有很大的關聯性。(李成龍)

Q4: 如何看待深度學習(深度特徵)對跟蹤效果的提升?如何看待當前各種深度學習算法採用的訓練數據集不一致的問題?

A1: 當常採用小樣本訓練時,訓練數據的不同會影響對比公平性情況確實存在。(李成龍)。

A2: 對現有方法的改進,應當採用相同的訓練數據,否則實驗不公平。我會要求在相同數據量下比較,但同時鼓勵使用大數據訓練,分開進行對比。(彭厚文)

A3: tracking與計算機視覺的推動得益於同一平臺,同一設置的實驗對比。一定要保證實驗的公平性。(魯繼文)

A4: 要重點強調自己的貢獻,不要將tracking作爲數據、模型複雜度等因素都綜合考慮。做研究一定要控制變量考慮問題、驗證算法貢獻。(左旺孟)

A5: 模型過於複雜可能最終效果不佳,應更多的考慮如何根據跟蹤問題本身設計算法。(馬超)

Q5: 視覺目標跟蹤有哪些新的方向、新的應用?

A1: 多目標跟蹤發展空間很大,機器人方面可能會有更多應用。(彭厚文)

A2: 跨模態、多模態數據的跟蹤可以進一步研究。(李成龍)

A3: 體育視頻、軍事、等方面是tracking理想的應用場景。tracking在交通監控中的性能如果可以提升,一定會取得進一步的重視。(魯繼文)

A4: 垂直領域應用可能更有效。對於研究,被其他研究領域應用更爲重要。(左旺孟)

A5: 無人駕駛是潛在的應用領域。(馬超)

Q6: 視頻類別無限,幀間連續性複雜,通用跟蹤是不是僞命題?能否開闢分類別、場景跟蹤?

A1:與tracking的起源有關,將tracking定義general,則會更加註重motion和appearance。(彭厚文)

A2:限制場景更加合理,但是類別不太好限定,否則和detection難以區分。如果能將某種挑戰解決也十分可觀。(李成龍)

Q7: 目標與多目標跟蹤比較割裂。如何將單目標用於多目標?

A1: 算法角度,多線程的單目標跟蹤可用於MOT,但不理想,計算量大。MOT主要解決的問題是instance之間的匹配問題,MOT近年來受到關注,相信未來會有快速發展。(彭厚文)。

Q8: RGBT算法在融合時還是data-based的,能否有先驗信息指導?從多模態融合角度發展趨勢。

A1:沒有想到理想的先驗信息。應根據T模態本身的特性出發,設計多模態融合。(李成龍)

Q9: CV領域前景問題。

A1: 學生也憂慮CV前景問題。今年進展有限,與期待有落差。該領域競爭激烈,發展快。只要做的好,一定有出路。選擇CV行業一定要是真愛。(魯繼文)

A2: 未來發展可能更加偏實用的、具體的領域。(左旺孟)

A3: 只有工作優秀才能脫穎而出,對大多數專業可以作爲實踐的方向,鍛鍊編程等實踐內容。(馬超)

A4: 感覺CV是很實用的,比較看好CV的發展。(李成龍)

A5: 主要看興趣,思考問題要長遠,結合自身目標。(彭厚文)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章