跟踪问题观点

Q1: 如何看待机器学习算法(如模型及优化算法)在处理视觉跟踪问题上的作用?

A1: 多数在模型层面思考跟踪问题 。(左旺孟)

A2: 机器学习算法十分重要,基于learning-based算法仍然十分有效。跟踪领域要求可能不太一样,根据问题特点提出适合的算法,offline training, online finetuning等都是tracking的特色。(鲁继文)

A3: 跟踪本是一个oneshot learning问题。解决问题时,要从tracking问题本身出发,模型更新,特征选取与学习,时序建模等。CV会议一般从问题本身出发,机器学习刊物更看重模型的通用性。(马超)

A4: 机器学习算法作为工具,从不同角度发掘潜力。另外,tracking中的核心问题是online问题,如何建立online 与offline的关系,使online update 更加快速准确非常重要。(彭厚文)

A5: 机器学习作为工具,结合tracking问题设计解决方案。(李成龙)

Q2: 相比目标检测、图像分割等基础视觉问题,视觉目标跟踪目前发展还存在哪些不足之处?

A1: Tracking对其他领域的影响不足。(李成龙)

A2: online 是tracking的本质问题,很多vision问题所不具有。detection在复杂场景中依然需要依赖tracking技术。某些角度看,tracking比detection滞后,但是有本身的特点。(彭厚文)

A3: tracking的evaluation是大问题,现有的metric不太可靠。tracking的框架没有突破detection/verification,沿用tracking-by-detection,没有发展独立的研究问题,本质问题有待突破。(鲁继文)

A4: 对其他学科启发、促进作用有限。如果将tracking作为oneshot learning发展的平台,影响力会更大。虽然oneshot learning无法解决tracking中的所有问题,但如果最好的oneshot learning算法来自于tracking,则会更好。(左旺孟)

A5: detection对领域的贡献的确比较大,tracking相比较为有限。时序连续性,例如motion建模是tracking的重要问题,但目前的方法主要基于appearance缺乏时序建模。忽视了tracking本身的一些问题。对这些问题的研究可以提升tracking领域研究的个性。(马超)

Q3: 目前视觉目标跟踪研究更加注重外观建模而较为忽视时序信息建模,如何看待这一现象?有没有好的时序建模思路?

A1: LSTM在tracking上的应用较为困难,训练需要大量数据,但目前tracking数据集有限。(马超)

A2: 时序建模问题的确很多,反而简单的,相邻帧模型更为有效。LSTM在视频超分辨中反倒有效果,可能和tracking本身的特性有关。(左旺孟)

A3: 能否预测目标外观的变化,这与时序建模可能有很大的关联性。(李成龙)

Q4: 如何看待深度学习(深度特征)对跟踪效果的提升?如何看待当前各种深度学习算法采用的训练数据集不一致的问题?

A1: 当常采用小样本训练时,训练数据的不同会影响对比公平性情况确实存在。(李成龙)。

A2: 对现有方法的改进,应当采用相同的训练数据,否则实验不公平。我会要求在相同数据量下比较,但同时鼓励使用大数据训练,分开进行对比。(彭厚文)

A3: tracking与计算机视觉的推动得益于同一平台,同一设置的实验对比。一定要保证实验的公平性。(鲁继文)

A4: 要重点强调自己的贡献,不要将tracking作为数据、模型复杂度等因素都综合考虑。做研究一定要控制变量考虑问题、验证算法贡献。(左旺孟)

A5: 模型过于复杂可能最终效果不佳,应更多的考虑如何根据跟踪问题本身设计算法。(马超)

Q5: 视觉目标跟踪有哪些新的方向、新的应用?

A1: 多目标跟踪发展空间很大,机器人方面可能会有更多应用。(彭厚文)

A2: 跨模态、多模态数据的跟踪可以进一步研究。(李成龙)

A3: 体育视频、军事、等方面是tracking理想的应用场景。tracking在交通监控中的性能如果可以提升,一定会取得进一步的重视。(鲁继文)

A4: 垂直领域应用可能更有效。对于研究,被其他研究领域应用更为重要。(左旺孟)

A5: 无人驾驶是潜在的应用领域。(马超)

Q6: 视频类别无限,帧间连续性复杂,通用跟踪是不是伪命题?能否开辟分类别、场景跟踪?

A1:与tracking的起源有关,将tracking定义general,则会更加注重motion和appearance。(彭厚文)

A2:限制场景更加合理,但是类别不太好限定,否则和detection难以区分。如果能将某种挑战解决也十分可观。(李成龙)

Q7: 目标与多目标跟踪比较割裂。如何将单目标用于多目标?

A1: 算法角度,多线程的单目标跟踪可用于MOT,但不理想,计算量大。MOT主要解决的问题是instance之间的匹配问题,MOT近年来受到关注,相信未来会有快速发展。(彭厚文)。

Q8: RGBT算法在融合时还是data-based的,能否有先验信息指导?从多模态融合角度发展趋势。

A1:没有想到理想的先验信息。应根据T模态本身的特性出发,设计多模态融合。(李成龙)

Q9: CV领域前景问题。

A1: 学生也忧虑CV前景问题。今年进展有限,与期待有落差。该领域竞争激烈,发展快。只要做的好,一定有出路。选择CV行业一定要是真爱。(鲁继文)

A2: 未来发展可能更加偏实用的、具体的领域。(左旺孟)

A3: 只有工作优秀才能脱颖而出,对大多数专业可以作为实践的方向,锻炼编程等实践内容。(马超)

A4: 感觉CV是很实用的,比较看好CV的发展。(李成龙)

A5: 主要看兴趣,思考问题要长远,结合自身目标。(彭厚文)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章