直播 | AAAI 2021:文本對抗攻防中的對抗訓練方法

「AI Drive」是由 PaperWeekly 和 biendata 共同發起的學術直播間,旨在幫助更多的青年學者宣傳其最新科研成果。我們一直認爲,單向地輸出知識並不是一個最好的方式,而有效地反饋和交流可能會讓知識的傳播更加有意義,從而產生更大的價值。

本期 AI Drive,我們邀請到華中科技大學計算機學院碩士生王曉森,爲大家解讀其發表於 AAAI 2021 的最新工作。對本期主題感興趣的小夥伴,1 月 12 日(週二)晚 7 點,我們準時相約 PaperWeekly B 站直播間。

直播信息

深度模型對抗樣本最先在圖像分類任務中提出,即通過微小擾動使得神經網絡產生錯誤輸出。近幾年來,研究者發現自然語言處理模型中同樣存在對抗樣本,並提出一系列的對抗攻擊和防禦方法。但是由於文本的離散性和語義約束,在圖像對抗攻防中被廣泛使用的梯度信息和對抗訓練防禦方法一直未能有效地在基於近義詞替換的文本對抗中使用。

本篇工作針對文本分類模型進行研究,提出了: 

1. 快速梯度投影攻擊:通過投影方式將梯度引入到基於同義詞替換的文本對抗攻擊,在保證現有攻擊成功率的前提下,速度比目前最快的攻擊提升了至少 20 倍;

2. 基於快速梯度投影攻擊的對抗訓練:由於快速梯度投影攻擊的高效性,我們利用其實現了對抗訓練,顯著地提升了深度模型的魯棒性。 

代碼和模型公開於:

https://github.com/JHL-HUST/FGPM

本次分享的具體內容有: 

  • 文本對抗攻防現狀

  • 快速梯度投影算法

  • 基於快速梯度投影攻擊的對抗訓練

  • 實驗結果和分析

嘉賓介紹

 王曉森 華中科技大學碩士生 

王曉森,華中科技大學計算機學院 2019 級碩士生,師從何琨教授,主要關注深度學習的對抗樣本。

直播地址 & 交流羣

本次直播將在 PaperWeekly B 站直播間進行,掃描下方海報二維碼點擊閱讀原文即可免費觀看。線上分享結束後,嘉賓還將在直播交流羣內實時 QA,在 PaperWeekly 微信公衆號後臺回覆「AI Drive」,即可獲取入羣通道

B 站直播間:

https://live.bilibili.com/14884511

合作伙伴

????

現在,在「知乎」也能找到我們了

進入知乎首頁搜索「PaperWeekly」

點擊「關注」訂閱我們的專欄吧

關於PaperWeekly

PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公衆號後臺點擊「交流羣」,小助手將把你帶入 PaperWeekly 的交流羣裏。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章