JaConTeBe benchmark

原創

2018-08-21 22:18

Abstract

意義：研究人員提出了很多方法來檢測併發錯誤和改善多線程程序，但是對這些方法有效性的評估仍是一個問題
現有的研究中用於檢測這些方法有效性的程序代碼或者是Bug都不具有現實意義的代表性。
論文的工作：爲了提升代表性，論文提出了JaConTebe benchmark，47個併發錯誤；測試用例來描述buggy行爲；驗證檢測方法的有效性；提交到開源庫中

Introduce

很重視併發bug + 非法的交互很容易引入併發錯誤 + 現有的研究提出了很多方法，能檢測錯誤，但在實際中不知道也是否能有效，即方法提出的人使用的被測程序不具有代表性 + 缺乏比較性。
爲了解決bug檢測方法的評估問題，需要benchmark suite（benchmark suit = 併發錯誤 + 測試用例） + benchmark能反應真實併發錯誤的特徵 + benchmark的五個特徵：代表性、多樣性、可移植、可訪問、公平性 + 現有的研究不完全具備，特別是代表性
論文：通過收集現有的benchmark然後引入了自己的benchmark：檢測現有的測試方法的有效性 + 檢測一個方法是否能檢測現實的錯誤（對植入的bug有效，而對現實的bug不一定） + 對比這側檢測方法之間發現bug的強弱能力
論文貢獻
1、對現有的benchmark調查並他們對現有的併發錯誤方法進行研究，而現有的研究不包含現實的錯誤的benchmark
2、創建了JaConTeBebenchmark，量化 + 提交到開源社區 + 實現了benchmark被測程序和測試用例
3、用benchmark檢測三種bug檢測方法的有效性(檢測能力 + 侷限性)

現有的benchmark研究
現有的benchmark suite研究 + 如何檢測方法的有效性(侷限 + benchmark特徵)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.