計算機網絡A類頂會NSDI 2020剛剛結束!65篇優秀論文精彩亮相

會議之眼A類、CCF A類會議, 第17屆USENIX網絡系統設計與實現專題討論會NSDI 2020(Symposium on Network System Design and Implementation)於美東時間2020年2月25日至27日在美國加利福尼亞州聖克拉拉舉行。

會議介紹

NSDI專注於網絡和分佈式系統的設計原理,實現和實際評估。其目的是將來自網絡和系統領域的研究人員召集在一起,以建立廣泛的方法來應對重疊的研究挑戰。NSDI提供了一個高質量的論壇,用於展示結果和討論想法,這些想法可以加深對整個網絡系統社區的認識和理解,繼續進行重要的研究對話,或者推動網絡服務的體系結構邊界。

本屆大會的主題涵蓋了:高可用性和可靠的網絡系統、網絡系統的安全性和私密性、分佈式存儲,緩存和查詢處理系統、網絡系統中的節能計算、雲/多租戶系統、移動和嵌入式/傳感器應用程序和系統、無線網絡系統、網絡和工作負載測量系統、自組織,自治和聯合網絡系統、管理,調試和診斷網絡系統中的問題、物聯網系統的虛擬化和資源管理、網絡硬件的系統方面、有部署網絡系統的經驗、網絡系統上的大數據通信和計算、經濟學和驗證的實踐方面應用於網絡系統、針對涉及網絡系統的重大問題的任何創新解決方案。

截止日期

NSDI 2020爲作者提供了兩個提交截止日期的選擇。在這些截止日期之前提交併在隨後的審覈期間接收的任何論文都將在會議上被展示。

在NSDI '20的春季截止日期之前提交併被拒絕的論文要等到NSDI '21的春季截止日期才能再次提交。在NSDI '20的秋季截止日期之前提交併被拒絕的論文要等到NSDI '21的秋季截止日期才能再次提交。

接收論文

本次會議總計14個主題,接收了65篇論文。

NIDS 接收論文列表:

https://www.usenix.org/sites/default/files/nsdi20_full-proceedings.pdf

小編爲大家精心挑選了三篇值得細品的論文,內容如下:

 

主題:分佈式系統

摘要:藉助GPU,現代分佈式機器學習(ML)訓練工作負載會顯著受益。但是,當多個此類工作負載在共享GPU集羣上運行時,就會出現重大競爭。關鍵問題是如何在工作負載之間合理分配GPU。我們發現,由於ML工作負載的獨特屬性,已建立的集羣調度規則不適合:ML作業具有需要長期調度的長期任務,其性能對任務的相對位置很敏感。

我們提出THEMIS,這是用於ML訓練工作量的新計劃框架。 GPU的分配政策要求ML工作負載在公平的方式下完成,這是我們引入的新概念。爲了捕獲位置敏感性並確保效率,THEMIS使用兩級調度體系結構,其中ML工作負載競標由中央仲裁員運行的拍賣中提供可用資源。我們的拍賣設計通過在短期內權衡公平性以提高效率,但在長期內確保完成時間的公平性,從而將GPU分配給中標者。我們的評估顯示,與最新的調度程序相比,THEMIS可以將公平性提高2.25倍以上,並且集羣效率提高了5%到250%。

論文鏈接:

http://wisr.cs.wisc.edu/papers/nsdi20-themis.pdf

 

 

主題:部署經驗

摘要:現代雲系統具有大量不斷更新的組件。在不中斷系統的情況下快速部署這些更新的組件具有挑戰性。

在本文中,我們介紹了Gandalf,這是一種在大規模系統基礎架構中進行安全部署的端到端分析服務。Gandalf可以對軟件部署進行快速而穩健的影響評估,以在不良部署造成大面積停機之前及時發現它們。Gandalf監視並分析各種故障信號。它將使用空間和時間相關算法將每個信號與所有正在進行的任務相關聯。Gandalf的核心決策邏輯包括:集成排序算法,用於確定哪個啓動可能導致故障信號;以及二進制分類器,用於評估故障信號的影響。通過使用lambda架構,Gandalf可以通過自動決策和提供實時信息以及長期部署監視。Gandalf已在Microsoft Azure中投入生產運行超過18個月,爲數據平面和控制平面組件提供服務。對於數據平面部署,它可以達到92.4%的精度和100%的召回率(Azure Compute中不會因不良的部署而造成高影響的服務中斷)。對於控制平面服務,Gandalf達到94.9%的精度和99.8%的召回率。

 

 

論文鏈接:

https://www.usenix.org/system/files/nsdi20-paper-li.pdf

 

主題:測量與適應

摘要:十多年來,雲實踐者和性能工程師已將性能可變性視爲一個問題。但是,我們對頂級系統會議的調查顯示,研究團體在雲中運行實驗時經常忽略可變性。我們通過收集主流商業雲和私有研究雲的蹤跡來評估可變性對基於雲的大數據工作負載的影響。我們的數據收集包括在傳輸9 PB數據時收集的數百萬個數據點。我們對數據中存在的網絡可變性進行了表徵,並表明,即使商業雲提供商實施了服務質量實施機制,可變性仍然會發生,並且這種機制和服務提供商策略甚至會加劇這種可變性。我們展示了即使使用最先進的實驗技術,大數據工作負載也將遭受嚴重的減速,缺乏可預測性和可複製性。我們爲從業人員提供了指南,以減少大數據性能的波動性,使實驗更具可重複性。

論文鏈接:

https://arxiv.xilesou.top/pdf/1912.09256.pdf

 

會議預告

沒有來得及趕上這次盛會的小夥伴們也不用着急,好好備戰吧!擔心錯過會議信息的小夥伴們挺好啦!下一期會議又來咯!點擊關注會議之眼,小助手將會爲大家持續關注會議的相關事宜,及時推送一線消息。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章