OpenAI將k8s擴展至7500個節點以支持機器學習;Graph Diffusion Network提升交通流量預測精度

開發者社區技術週刊 又和大家見面了,快來看看這周有哪些值得我們開發者關注的重要新聞吧。

  • Google研究院推出處理文本圖像新框架TReCS

  • OpenAI將k8s擴展至7500個節點以支持機器學習

  • Apache ECharts 5正式發佈

  • WebRTC成爲W3C與IETF正式標準

  • 國內首個自主可控區塊鏈技術體系“長安鏈”發佈

  • 京東開源PyTorch人臉識別工具包FaceX-Zoo

  • AAAI 2021丨Graph Diffusion Network提升交通流量預測精度

  • AAAI 2021丨利用標籤之間的混淆關係,提升文本分類效果

行 業 要 聞

1.Google研究院推出處理文本圖像新框架TReCS

爲創建一種能夠在任何語言之間進行翻譯的通用神經機器翻譯系統,Google 研究人員研發了一種新框架,即 TReCS(Tag-Retrieve-Compose Synthesize system) 。通過改進圖像元素的喚起方式以及跡線如何通知其位置,從而顯着增強圖像生成過程。該系統接受了超過250億個示例的培訓,具有處理103種語言的潛力。其功能使鼠標軌跡與文本描述對齊,併爲提供的短語創建可視標籤。該框架利用可控的鼠標軌跡作爲細粒度的視覺基礎,根據用戶的敘述生成高質量圖像。標記器被用來預測短語中每個單詞的對象標籤。

2.OpenAI將k8s擴展至7500個節點以支持機器學習

爲了滿足GPT-3、CLIP和DALL+等大型模型的需要,以及類似於神經語言模型的縮放定律的快速小規模迭代研究, OpenAI將基礎設施k8s集羣擴展到7500 各節點。 據其描述,對於大型機器學習作業來說,一個節點通常由單個pod佔據,並且OpenAI部署的集羣具有二等分帶寬,因此儘管其有許多節點,但是調度程序的壓力相對較低,僅在一項新任務一次性創建數百個pod時會有調度壓力。除此之外,OpenAI還詳細說明了其在擴展k8s集羣時的重要工作內容,比如通過改用基於別名的IP尋址來解決大量節點的聯網問題,在專用節點上部署etcd和API服務器以分散負載,定位使用Prometheus和Grafana收集指標時的OOM問題,設計對集羣的健康檢查,以及在團隊中合理分配集羣資源等。

3.Apache ECharts 5正式發佈

1月28日,Apache Echarts 5正式發佈,此次帶來了 5大模塊15項特性 全新升級,具體內容如下:

  • 動態敘事(新增動態排序柱狀圖和折線圖,多維度展示、更加細膩的自定義系列動畫)。

  • 視覺設計(默認設計大改進、標籤更加清晰、時間軸功能、個性化的提示框、全面升級的儀表盤、更加好看的扇形圓角設計)。

  • 交互能力(狀態管理優化改進,新增特效、性能大幅提升)。

  • 開發體驗(加強了數據集數據轉換能力、更簡單的語言包更換設置)。

  • 用TypeScript重寫代碼, 帶來了非常多激動人心的特性。

  • 可訪問性(依舊注重無障礙設計、新增貼花圖案區分顏色表達)。

4.WebRTC成爲W3C與IETF正式標準

經過多年發展,WebRTC已獲得諸多流行Web瀏覽器的支持。最細消息是,萬維網聯盟(W3C)和互聯網工程任務組(IETF)剛剛宣佈: 基於Web的實時通訊技術(簡稱 WebRTC),已經正式成爲Web領域的一項音視頻傳輸標準。 從技術層面上來說,該框架允許開發者輕鬆地將音視頻聊天功能添加到各自的項目中。IETF主席Alissa Cooper評論道:“基於IP的音視頻通訊技術,已經徹底改變了全世界人民的交流方式。通過將這些技術集成到Web平臺,更是有助於極大地擴展其使用範圍”。得益於IETF和W3C之間的緊密合作,WebRTC技術終於在今日正式完成了標準化工作。據悉,在WebRTC標準化工作完成之後,未來任何想要實現類似功能的軟件項目,都將擁有一套可明確遵循的準則,以確保相關功能可以正確實現和滿足各項需求。

5.國內首個自主可控區塊鏈技術體系    “長安鏈”發佈

據央視新聞報道,國內首個自主可控的區塊鏈軟硬件技術體系“長安鏈”在北京正式發佈,並推出供應鏈金融、碳交易等首批應用場景。

據悉,“長安鏈”具有模塊化特點,支持按需定製,實現數據“可用不可見”, 構建共享機制,助力在交易、流通、統計等全流程的數據可信存儲和共享。目前,“長安鏈”已實現軟硬件全部自主研發。

6.京東開源PyTorch人臉識別工具包       FaceX-Zoo

京東開源了框架FaceX-Zoo。依靠高度模塊化和可擴展的設計,FaceX-Zoo 提供具備多種多種supervisory head和骨幹網絡的訓練模塊,以實現效果最優的人臉識別。 在這個工具中,人們只需改動簡單的配置就可以在大多數流行基準上進行模型測試。此外,它還有一個簡單但功能齊全的人臉SDK用於驗證訓練後的模型,並進行初步應用。該工具並不包含大量現有技術,但也因此易於拓展升級。京東的開發者們表示,在未來研究人員還計劃進一步增加FaceX Zoo的模塊數量,如面部分析和face lightning,補充骨幹網絡架構和supervisory head數量,並嘗試通過分佈式數據並行技術和混合精度訓練來提升模型訓練的效率。

學 術 前 沿

1.AAAI 2021丨Graph Diffusion               Network提升交通流量預測精度

城市流量預測作爲智能交通中的一個重要問題,致力於精確預測城市中不同區域的流量信息,從而更好地實現區域間的流量管控、擁塞控制以及保障城市公共安全。本文將介紹一種 基於時空圖擴散網絡的城市交通流量預測模型。 由京東數科硅谷研發實驗室,京東城市和華南理工大學合作的一篇論文《Traffic Flow Forecasting with Spatial-Temporal Graph Diffusion Network》,目前該論文已經被人工智能領域的頂級會議AAAI 2021(CCF A類)接收。

*論文鏈接:

http://urban-computing.com/pdf/AAAI2021TrafficFlow.pdf

2.AAAI 2021丨利用標籤之間的混淆關係,提升文本分類效果

本文主要是針對標籤信息的充分利用進行了深入的研究。區別於傳統的 label smoothing 或者 label embedding 方法,本文希望在利用標籤信息時能夠充分考慮輸入的情況,是輸入影響了標籤之間的重疊或者依賴關係。同時本文的方法是模型不可知的,能夠進一步提升不同模型的效果,具有靈活的使用方法。最後對標籤進行更全面的建模,更充分的使用,能夠以較小的代價取得更好的效果。

*論文鏈接:https://arxiv.org/abs/2012.04987

*以上信息來源於網絡,由“京東科技開發者”公衆號編輯整理,

不代表京東科技開發者立場*

推薦閱讀

歡迎點擊【京東科技】,瞭解開發者社區

更多精彩技術實踐與獨家乾貨解析

歡迎關注【京東科技開發者】公衆號

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章