想留住人才?先要管理好數據科學團隊

本文最初發佈於 Domino 官方博客,經原作者授權由 InfoQ 中文站翻譯並分享。

不管在什麼地方做一名管理者,都不是一件易事,但管理一支數據科學團隊的話,可能就特別富有挑戰性了。角色仍然不斷變化,加之人員流動率居高不下,公司正在尋找團隊運作的最佳實踐方式。而成爲一名技術專家,卻未必能讓你爲管理他人做好準備。

無論你現在是在管理一支數據科學團隊,還是準備啓動一支數據科學團隊,亦或者希望將來能夠成立一支數據科學團隊,本指南將使你成爲企業中更好的數據科學團隊管理者。

如何聘用和留住數據科學家

在最近舉行的數據科學領袖 Rev 峯會上的小組討論中,三位專家分享了他們有關聘用、留住和培養數據科學人才的建議。

圖片

視頻鏈接:
https://www.dominodatalab.com/resources/field-guide/managing-data-science-teams/?wvideo=klqseuljfz

他們的建議總結如下。

來自數據科學管理者的建議

首先,招募領導者

如果你從初級員工或剛從學術界畢業的人開始,沒有導師指導的話,他們很有可能會感到迷茫和沮喪。ShopRunner 的數據科學高級總監 Michelangelo D’Agostino 建議,首先要安排一個更有經驗的人來帶領團隊。

謹慎甄選管理者

不要只關注技術人才和經驗。小組成員一致認爲,謙遜、好奇心以及傾聽和接受反饋的能力,是擔任高級職位的關鍵特徵。D’Agostino 說:“即將負責的人必須清楚,他們並沒有所有的好主意或者答案。”他建議,讓未來的員工描述他們失敗的情況,聽聽他們將如何避免重蹈覆轍,以此來衡量他們自我反省的能力。

反思數據挑戰

鑑於競爭激烈的招聘環境,繁重的開卷考試可以篩選出合格的求職者,要營造出一種緊張的考試氛圍。Insight Data Science 的首席數據科學家 Patrick Phelps 表示,其實無需這些挑戰就能招到優秀員工。“這真的很難衡量……並且評分需要很長的時間,”他說,“我寧願讓一名優秀的數據科學家和我的團隊在一個房間裏呆上一個小時。”如果確實包含挑戰的話,D’Agostino 建議,讓求職者在辦公室完成一次編碼練習,並像在非正式的代碼審查中進行討論。

數據科學家的招聘和入職計劃

這個招聘和入職計劃模板通過關鍵問題來幫助團隊尋找和培訓新的數據科學家。計劃模板包括吸引頂尖人才、招聘流程、入職、留任等關鍵問題。

通過採取系統的方法,數據科學領導者將最大限度發現並培養一個團隊,這個團隊要大於團隊組成部分的總和。

可以下載這份招聘計劃的 PDF 版本,便於打印。

吸引頂尖人才

  • 你對候選數據科學家的不同價值主張是什麼?列出三個獨一無二的事情,你認爲這些事情能讓你與目標候選人羣產生共鳴。在小組中測試你的演講,獲取反饋。
  • 有哪些 1~3 級風險,可能會讓機會不如競爭機會那般有吸引力?你如何減輕或者超越它們呢?

招聘過程

  • 你的應聘者最重要的三個特徵是什麼?
  • 你對每個人的評估計劃是什麼?

入職

  • 在最初的 30 天、60 天和 90 天內需要完成哪些活動和成果?
  • 你的新員工需要知道的最重要的“部落知識”是什麼?她 / 他將如何學習這些知識?例子包括數據源、項目方法、利益相關者動態、顯著的得失等。

留任和管理

  • 你希望應聘者在一年內發展什麼技能?
  • 一年後,哪些指標將決定該應聘者是否成功?例子包括某些業務指標、社區貢獻、生成的見解數目或項目迭代速度。

留住你的人才

  • 不要過分誇大這個角色。約有半數的數據科學家在他們的崗位上不超過兩年。Domino 的客戶成功經理 Conor Jensen 建議,爲了降低人員流動率,要誠實地告訴應聘者你正在招聘的職位的具體情況。“要非常現實地知曉關於角色的定位,痛苦將會是什麼,你認爲影響會在哪裏,以及時間線是什麼樣的。”他說,“很多時候,我們對作爲數據科學家將要完成的事情感到亢奮,而且我們可以領先一步。”
  • 瞭解團隊成員的動機。 Jensen 建議花點時間去發現每個員工的目標、興趣和個人激勵。然後你可以將它們與獎勵項目配對,並以一種有意義的方式來認可他們的成就。
  • 提供支持。 Phelps 說:“數據科學可能是一門失敗的學科:模型失敗、流程失敗、數據源變得糟糕透頂。”他建議提供積極的支持,並提醒團隊成員,可能需要數年的時間才能看到影響。Jensen 還建議將問題分解成可控的小塊,這樣員工就不會被巨大的項目給嚇破膽。
  • 創造學習機會。 D’Agostino 觀察到,數據科學家經常因爲感到無聊而辭職。如果核心項目不夠前沿,他建議爲團隊成員創造學習新事物的機會,例如,每週一次午餐討論最新的研究成果,或者偶爾舉辦黑客馬拉松來測試新的軟件框架和計算技術。

成功數據科學管理者的習慣

以下是我們在許多成功的數據科學管理者身上觀察到的七個習慣,沒有特定的順序。

  1. 與其他利益相關者建立聯繫。 通過打開與其他團隊的溝通渠道,避免摩擦和交叉。在每個新項目開始之前,考慮讓數據科學家和產品經理在一個房間呆上一個小時,以確保他們達成共識。讓數據科學家不帶筆記本電腦參加會議,可以迫使他們與其他利益相關者溝通。給數據科學家機會向工程師、產品經理和其他人解釋他們的工作,也可以改善溝通。
  2. 跟蹤性能。使用模板來跟蹤你所討論的內容、你所設定的目標,以及你在單獨討論會議中給出的反饋。依靠記憶是行不通的。
  3. 目標是將項目投入到生產中。準備團隊部署他們自己的 API 服務並生成代碼,可以幫助你更快地工作,並且,你還不會被可能無法使用的工程資源所阻塞。
  4. 開始隨叫隨到的輪換。隨着團隊規模的擴大,每週安排一次數據科學家隨叫隨到的輪換,以修復出現故障的模型。這樣有助於更好地編制文檔,並讓那些沒有安排隨叫隨到的人有時間專注於核心項目。
  5. 敢於問一些愚蠢的問題。看似簡單的問題,可以爲發現和解決基本問題打開大門。
  6. 活到老,學到老。 進行大量的閱讀以跟上這個快速發展的領域的步伐。不僅要閱讀技術材料,還要了解管理和組織心理學相關的知識。
  7. 放下,但不至於永遠。 如果你是新任管理者,請考慮三到六個月放下編碼的工作。否則,你可能永遠不會真正接受管理者的角色轉變,而且可能爲團隊提供的服務水平低下。成功進入角色之後,你就可以自由地處理那些非關鍵項目,或者那些沒有人願意做的事情。

知識管理

數據科學家經常對知識管理這一話題感到恐懼。有些人認爲這是對他們從“真正的”工作中分散注意力;其他人並沒有完全理解這意味着什麼。甚至很多人看到這個概念的價值,也會覺得這個過程很痛苦。

但是,Point72 的首席市場情報官 Matthew Granade 和 Domino 數據實驗室產品總監 Mac Steele 表示,知識管理能力將成爲企業競爭優勢的一個關鍵因素。在下面的視頻中,他們兩人闡述了爲什麼知識管理很重要,以及企業應該如何優先考慮知識管理。

圖片

視頻鏈接:
https://www.dominodatalab.com/resources/field-guide/managing-data-science-teams/?wvideo=i7fedb31bd

數據科學團隊的知識管理要點如下。

什麼是知識管理?

知識管理的目標就是捕獲洞察力,這可以定義爲“更好的理解”。因此,洞察力是相對的:它是關於不斷改進之前的想法。從 Einstein 到 Freud,洞察力往往被視爲“孤獨天才”的專利。事實上,大多數洞察力來自於與他人的合作和對現有想法的拓展。

創建這種“複合機器”需要一種獲取知識的方法,一種供用戶遵循的框架,以及通過反饋改進的機制。企業的未來將越來越多地取決於它們在這方面的表現。隨着更多的算法和基礎設施得到廣泛的應用,數據科學人才庫不斷增長,數據共享需求不斷擴大,捕獲和增強獨特洞察力的能力將成爲一個關鍵的差異化因素。

爲何知識管理如此困難?

知識管理的一些挑戰困擾着每個行業:

  • 提前組織知識很困難。分類往往過於死板,因爲你不知道將來什麼纔是重要的。
  • 幾乎沒有參與的動機。正如一位數據科學家所言,“我今年所做的工作是有報酬的,而不是維護我去年所做的工作。”
  • 這是一個典型的集體行動問題。沒有人想成爲第一個在文檔上花費時間的人。當知識被捕獲時,人們很難知道如何將其付諸行動。
  • 系統總是落後於現實。如果知識管理需要額外的時間,並且是在與核心工作不同的系統中進行的,那麼它的質量勢必會受到影響。

其他障礙則是數據科學團隊獨有的:

  • 人們使用不同的工具。當團隊中一些成員使用 R 語言,而另一些成員使用 Python;當一些成員在 GitHub 中存儲代碼,而另一些人在電子郵件中存儲代碼時,知識管理就變得更加困難了。由於人員流動率較高,培訓人員使用相同的系統就變成了一粧難事。
  • 單個項目的組成部分是分散的。製品和洞察力可以通過 Docker 商店、wiki、幻燈片演示等傳播。
  • 如果你有代碼,但這並不意味着你可以重新運行這段代碼。對 600 篇計算機研究論文進行的元分析發現,只有 20% 的代碼可以重新運行;其中,許多第二次嘗試的結果略有不同。

如何提高知識管理水平

有四個步驟可以幫助數據科學領導者改進其企業組織中的知識管理水平:

1. 在一個地方儘可能多地獲取知識。

裏面的東西越多,你與它們之間的聯繫就越多,價值就以這種方式增長。你不希望人們在邊緣工作。一個包含核心工作和知識管理的公共平臺是確保完成工作並將負擔最小化的關鍵。如果你不能捕捉一切,那就從最有價值的模型或知識開始,然後圍繞它構建一個系統。

測試:分別詢問貴司的五位數據科學家:“您認爲這個團隊現在正在做多少個項目?”他們可能會給出不同的答案。

2. 選擇一個允許發現、來源、重用和模塊化的知識管理系統。

發現: 數據科學家耗費大量時間來搜索信息,從而降低了工作效率。團隊必須做出決定是採用管理知識(Yahoo 方法)還是索引知識(Google 方法)。當領域相對穩定時,內容管理就有意義了。當領域是流動的時候,索引和搜索是最好的方案,而且你也不可能事先知道分類法應該是什麼樣子的。

測試:讓新員工來處理某個主題,並計算他們收集正確的製品需要多長時間。如果是幾周或幾個月的話,那就是個危險的信號。

來源: 讓人們專注於知識管理的重要方面。使用一個平臺,讓人們可以綜合他們的工作,而不必跟蹤他們使用的軟件版本。

測試:事先寫下你認爲團隊成員應該花在文檔上的時間百分比。然後問他們實際花了多長時間。這可能會讓你感到大開眼界。

重用: 如果它不能運行,那麼就不會被重用。這不僅需要訪問代碼,還需要訪問數據集的歷史版本。

測試:請新員工重現另一位數據科學六個月前所做的工作,最好是已經離開團隊或組織的人。讓他用最新的數據來更新它。如果這過程需要一週或一個月,那就麻煩了。

分解與模塊化: 確保人們有動機和工具來創建可重用、構建的構件塊。

測試:請兩個從事過類似項目的團隊進行事後分析,並確定重疊的工作。

3. 確定正確的知識單元

複合系統依賴於知識單元。在學術界中,這些都是書籍和論文;而在軟件中,這些都是代碼。在數據科學中,模型是組織的正確選擇,因爲它是數據科學家所做的事情。模型包括數據、代碼、參數和結果。

4. 超越技術進行思考

人員和流程層面的變化也很重要。重新定義人們如何看待自己的工作:他們應該花更少的時間去做事,花更多的時間去整理和學習。在招聘和薪酬方面,要將合作放在首位。最後,雖然知識管理應該被視爲每個人的工作,但一些組織爲管理或促進知識創造了新的角色。

合作

以下三個視頻提供了一系列關於數據科學家與企業內其他利益相關者之間合作的經驗教訓。

促進合作的內部實踐

圖片

視頻鏈接:
https://www.dominodatalab.com/resources/field-guide/managing-data-science-teams/?wvideo=f4vx20cf39

營造合作環境

圖片

視頻鏈接:
https://www.dominodatalab.com/resources/field-guide/managing-data-science-teams/?wvideo=ommsdpxse7

如何影響公司變革

圖片

視頻鏈接:
https://www.dominodatalab.com/resources/field-guide/managing-data-science-teams/?wvideo=zz4ifvz4jr

壯大數據科學團隊

氣候公司(The Climate Corporation)科學副總裁 Erik Andrejko 花了數年的時間關注這一問題,建立並發展多學科數據科學團隊。

在下面的視頻中,Erik 討論瞭如何繼續建設世界級的數據科學團隊。他還討論了數據科學的實踐、組織的擴展以及數據科學項目的關鍵組成部分與最佳實踐。

圖片

視頻鏈接:
https://www.dominodatalab.com/resources/field-guide/managing-data-science-teams/?wvideo=nxv79gqolp

來自財富 500 強的經驗教訓

通過與從敏捷初創公司到財富 500 強等公司合作,我們已經能夠策劃這些組織的用例,並從這些組織中瞭解不斷增長的數據科學團隊所面臨的挑戰和成功。

在這段視頻中,我們分享了其中的一些經驗,包括:數據科學項目的目標、挑戰、執行診斷、管理項目和系統,以及利用數據科學平臺進行擴展。

圖片

視頻鏈接:
https://www.dominodatalab.com/resources/field-guide/managing-data-science-teams/?wvideo=glml8q24a1

後續步驟

本指南涵蓋了管理企業中數據科學團隊的人力資源的各個環節:招聘和入職,扶持團隊走向成功,培養正確的習慣,獲取和管理知識,以及促進合作。現在,是時候讓這些數據科學家需要做點什麼了。瞭解如何在企業重管理數據科學項目。

作者介紹:

Domino Data Lab(Domino 數據實驗室),提供了一個開放、統一的平臺,可以大規模構建、驗證、交付和監控模型。他們幫助客戶接受模型管理,快速交付高影響力的模型,並使數據科學成爲客戶的競爭優勢之一。Domino 是一個數據科學平臺,使數據科學團隊能夠快速開發和部署推動突破性創新和競爭優勢的模型。

原文鏈接:

Enterprise Data Science Field guide > Managing Data Science Teams

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章