YAML 有漏洞被棄用？網友：YAML 不背鍋！

原創

2021-09-10 21:29

點擊關注公衆號，Java乾貨及時送達

文 | Travis
出品 | OSC開源社區（ID：oschina2013）

Tensorflow 是一個基於 Python 的機器學習和人工智能項目，該項目由 Google 開發。

近日 TensorFlow 已經放棄了對 YAML 的支持，以修復一個關鍵的代碼執行漏洞。

YAML 或 YAML Ain't Markup Language 是一種人類可讀的數據序列化語言，用於在進程和應用程序之間傳遞對象和存儲數據，許多 Python 應用程序都使用 YAML 來序列化和反序列化對象。

該漏洞的 CVE ID 爲 CVE-2021-37678。TensorFlow 和 Keras（TensorFlow 的一個封裝項目）的維護者表示，該漏洞源於對 YAML 的不安全解析，漏洞會在應用程序反序列化以 YAML 格式提供的 Keras 模型時，使攻擊者可以執行任意代碼。反序列化漏洞通常發生在應用程序讀取來自非真實來源的不良或惡意數據時。

這個 YAML 反序列化漏洞的嚴重程度被評爲 9.3 級，由安全研究員 Arjun Shibu 報告給 TensorFlow 維護者。

這個漏洞的來源是 TensorFlow 代碼中臭名昭著的 "yaml.unsafe_load()" 函數。

安全研究員 Arjun Shibu 表示，"我在 TensorFlow 中搜索了 Pickle 和 PyYAML 的反序列化模式，令人驚訝的是，我發現了對危險函數 yaml.unsafe_load() 的調用。"

衆所周知，"unsafe_load" 函數可以對 YAML 數據進行相當自由的反序列化 —— 它解析了所有的標籤，即使是那些不受信任的輸入上已知不安全的標籤。該函數直接加載 YAML 輸入而不對其進行清理，這使得使用惡意代碼注入數據成爲可能。

序列化的使用在機器學習應用中非常普遍。訓練模型是一個昂貴且緩慢的過程。因此，開發人員經常使用預先訓練好的模型，這些模型已經存儲在 YAML 或 TensorFlow 等 ML 庫支持的其他格式中。

在該漏洞被披露後，TensorFlow 的維護者決定完全放棄對 YAML 的支持，而使用 JSON 進行反序列化。

值得注意的是，TensorFlow 並不是第一個、也不是唯一一個被發現使用 YAML unsafe_load 的項目。該函數的使用在 Python 項目中是相當普遍的。

TensorFlow 的維護者表示，CVE-2021-37678 漏洞將於 TensorFlow 2.6.0 版本的更新中進行修復，並且還將被回傳到之前的 2.5.1、2.4.3 和 2.3.4 版本。自年初以來，Google 已經在 TensorFlow 上修復了 100 多個安全漏洞。

關注Java技術棧看更多幹貨

獲取 Spring Boot 實戰筆記！

本文分享自微信公衆號 - Java技術棧（javastack）。
如有侵權，請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”，歡迎正在閱讀的你也加入，一起分享。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

AI從入門到入門之手寫數字識別模型java方式Dense全連接神經網絡實現

前言：授人以魚不如授人以漁.先學會用，在學原理，在學創造，可能一輩子用不到這種能力，但是不能不具備這種能力。這篇文章主要是介紹算法入門Helloword之手寫圖片識別模型java中如何實現以及部分解釋。目前大家對於人工智能-機器學習-神經網

2024-04-19 23:17:21

如何基於香橙派AIpro對視頻/圖像數據進行預處理

本文分享自華爲雲社區《如何基於香橙派AIpro對視頻/圖像數據進行預處理》，作者：昇騰CANN。受網絡結構和訓練方式等因素的影響，絕大多數神經網絡模型對輸入數據都有格式上的限制。在計算機視覺領域，這個限制大多體現在圖像的尺寸、色域、歸一

2024-04-19 10:32:52

基於香橙派AIpro將開源框架模型轉換爲昇騰模型

本文分享自華爲雲社區《如何基於香橙派AIpro將開源框架模型轉換爲昇騰模型》，作者：昇騰CANN。在前面的介紹中，我們知道了如何基於香橙派AIpro開發AI推理應用，也大致瞭解到在推理之前，需要把原始網絡模型 (可能是 PyTorch 的

2024-04-12 10:32:18

大模型分佈式訓練並行技術

隨着深度學習的發展，模型規模逐漸增大，數據量和計算需求也呈爆炸式增長。在單個計算設備上完成大模型的訓練變得不切實際，因此，分佈式訓練成爲了解決這一問題的關鍵。在分佈式訓練中，數據並行是一種非常有效的策略，通過將數據和計算任務分佈到多個計算設

2024-04-10 23:29:41

TorchAcc：基於 TorchXLA 的分佈式訓練框架

本文旨在探討阿里雲 TorchAcc，這是一個基於 PyTorch/XLA 的大模型分佈式訓練框架。過去十年 AI 領域的顯著進步，關鍵在於訓練技術的革新和模型規模的快速攀升。儘管大模型展現了堪比人類的理解力，但其訓練卻對算力提出了極高的

2024-04-01 23:39:48

愛奇藝 CTR 場景下的 GPU 推理性能優化

01 背景介紹 GPU 目前大量應用在了愛奇藝深度學習平臺上。GPU 擁有成百上千個處理核心，能夠並行的執行大量指令，非常適合用來做深度學習相關的計算。在 CV（計

2024-03-15 15:57:51

雲原生週刊：Terraform 1.8 發佈｜ 2024.5.6

開源項目推薦 xlskubectl 用於控制 Kubernetes 集羣的電子表格。xlskubectl 將 Google Spreadsheet 與 Kubernetes 集成。你可以通過用於跟蹤費用的同一電子表格來管理集羣。 git-

2024-05-06 22:46:37

ACK One x OpenKruiseGame 全球遊戲服多地域一致性交付最佳實踐

作者：劉秋陽、蔡靖前言在當今全球一體化的經濟環境下，數字娛樂產業正日益成爲文化和商業交流的有力代表。在此背景下大量遊戲廠商嘗試遊戲出海並取得了令人矚目的成績，許多遊戲以全球同服架構吸引着世界各地廣泛的玩家羣體。遊戲全球化部署不僅擴大了單

2024-04-30 21:12:18

告別手動調度，海豚調度器 3.1.x 集羣部署讓你輕鬆管理多機！

轉載自第一片心意 1 前言由於海豚調度器官網的集羣部署文檔寫的較亂，安裝過程中需要跳轉到很多地方進行操作，所以自己總結了一篇可以直接跟着從頭到尾進行操作的文檔，以方便後續的部署、升級、新增節點、減少節點的相關操作。 2. 提前準備 2.

2024-04-23 21:18:20

code-server 實踐

最近看到code-server 比較有意思，可以在線搭建一個開發環境，於是驗證了一下 1、安裝 curl -fsSL https://code-server.dev/install.sh | sh -s -- --dry-run brew

2024-04-15 22:16:07

詳解K8s 鏡像緩存管理kube-fledged

本文分享自華爲雲社區《K8s 鏡像緩存管理 kube-fledged 認知》，作者：山河已無恙。我們知道 k8s 上的容器調度需要在調度的節點行拉取當前容器的鏡像，在一些特殊場景中，需要快速啓動和/或擴展的應用

2024-04-15 10:32:44

基於istio實現單集羣地域故障轉移

本文分享自華爲雲社區《基於istio實現單集羣地域故障轉移》，作者：可以交個朋友。一背景隨着應用程序的增長並變得更加複雜，微服務的數量也會增加，失敗的可能性也會增加。微服務的故障可能多種原因造成，例如硬件問題、網絡延遲、軟件錯誤，甚

2024-04-10 22:32:54

如何使用pingora構建自己反向代理

如何使用pingora構建自己反向代理 Cloudflare開源了其基於rust構建的反向代理框架pingora，已經在Cloudflare的雲服務中實際使用，每秒支撐起超過4000萬個互聯網請求(需要注意，此處並不是性能指標)。pinga

2024-04-01 21:57:09

運維人少，如何批量管理上百個微服務、上千條流水線？

作者：周靜隨着微服務和雲原生技術的發展，一個業務系統往往由多個微服務應用組成，多個業務方向涉及幾十上百應用。每個應用研發過程又劃分爲測試、預發、生產多條流水線，也即成百上千條流水線。而一個企業下通常只有 1～2 個運維或架構師負責這些應用

2024-03-21 21:13:40

雲效 AppStack + 阿里雲 MSE 實現應用服務全鏈路灰度

作者：周靜、吳宇奇、泮聖偉在應用開發測試驗證通過後、進行生產發佈前，爲了降低新版本發佈帶來的風險，期望能夠先部署到灰度環境，用小部分業務流量進行全鏈路灰度驗證，驗證通過後再全量發佈生產。本文主要介紹如何通過阿里雲 MSE 微服務引擎和雲效

2024-03-21 21:13:39

24小時熱門文章

最新文章

最新評論文章