原创 我們爲什麼構建自己的serverless計算平臺,而非使用AWS Lambda?

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

原创 機器學習面臨的挑戰是工程問題,不是數據科學問題

本文講述了從數據科學轉向機器學習工程的途徑及意義。 本文最初發表在 Towards Data Science 博客上,經原作者 Caleb Kaiser 授權,InfoQ 中文站翻譯並分享。在過去 20 年,機器學習一直圍繞着這樣一個問題

原创 GitHub “唯星論”可以休矣

本文最初發表在 Towards Data Science,經原作者 Caleb Kaiser 授權,InfoQ 中文站翻譯並分享。 開源項目在 GitHub 上的星(Star)並不是它的全部意義。 譯註:星是倉庫的書籤或讚賞表示。星標是項

原创 爲什麼我們建立機器學習工程平臺,而不是數據科學平臺?

本文最初發表在 Towards Data Science 博客上,經原作者 Caleb Kaiser 授權,InfoQ 中文站翻譯並分享。 導讀:如果將機器學習工程理解爲一門學科的話,那麼這個問題就迎刃而解了:爲什麼我們建立了機器學習工程

原创 生產機器學習不再是困難

本文最初發表在 Towards Data Science,經原作者 Caleb Kaiser 授權,InfoQ 中文站翻譯並分享。 在許多軟件工程學科中,生產用例是相當標準化的。以 Web 開發爲例:要在 Web 應用中實現身份驗證,你無

原创 你是否真的需要機器學習?

文中內容並非是從理論上去探討哪些問題可以通過機器學習解決,而是意在幫助那些沒有數據科學家的團隊理解應用機器學習是否真的有效。 機器學習當前處境微妙。 機器學習的可行性已得到充分證明,幾乎所有最受歡迎的移動應用都或多或少使用了該項技術,從

原创 爲何我們用 Go 而非 Python 來部署機器學習模型?

作者 Caleb Kaiser 此前曾撰寫過《爲何我們用 Go 而非 Python 編寫機器學習基礎設施平臺?》,InfoQ 中文站曾經翻譯並分享。今天,我們帶來了作者的新作《爲何我們用 Go 而非 Python 來部署機器學習模型》,在

原创 機器學習本該用起來更簡單

免責聲明:本文內容是基於我對一些機器學習團隊的觀察結果,而不是對這個行業的一份學術調查。利益相關,我需要先表明自己是Cortex項目的貢獻者,Cortex是一個用來在生產中部署模型的開源平臺。 爲了方便讀者理解,我拿軟件中無處不在的東西

原创 機器學習模型越來越大,開發者應該如何部署?

對於機器學習,樂觀的人認爲其可能完成人類級別的任務,比如開車、接電話、預約會議、回覆郵件等。但現實是機器學習只不過解決了狹窄範圍內的問題,比如視頻推薦、商品推薦和估算到達時間。然而,當 OpenAI 發佈 GPT-2 時,這一差距開始縮小

原创 不要再讓數據科學家管理Kubernetes集羣了

本文內容基於我對機器學習團隊的觀察,而不是對該行業的學術調查。我是Cortex的貢獻者,這是一個用於在生產環境中部署模型的開源平臺。生產級機器學習有一個組織性的問題,這是因爲它相對還比較新。雖然更成熟的領域(例如Web開發)經過幾十年的發