不招聘數據科學家的 7 個理由!

作者 | Tyler Folkman

譯者 | 香檳超新星,責編 | 郭芮

頭圖 | CSDN 下載自視覺中國

出品 | CSDN(ID:CSDNnews)

以下爲譯文:

我覺得題目已經說的很清楚了,所以我們直接開門見山吧。

你手上沒有任何數據

在考慮怎麼招聘數據科學家之前,你應該先退一步,先考慮一下你的數據。

數據科學家的職責就是從數據中創造價值。如果你連自己手上到底有沒有數據都不確定,那這就非常能說明一點——招聘數據科學家的時機還不成熟。

如果你知道自己手上有數據,但卻真的不清楚該如何獲取,也不知道數據的可靠性或任何細節,那麼你應該首先回答上面這幾個問題。

如果你的公司對自己的數據資產有着很深的瞭解,那麼僱傭數據科學家就會獲益匪淺。你的理解不一定要達到完美無缺的程度才行,但你應當能夠爲數據科學家指明一些有文檔的數據。

對於一名新入職的數據科學家來說,最糟糕的感覺莫過於,在自己剛剛加入一家公司的時候發現這家公司實際上對自己的數據沒有任何把握。

你手上的數據不合適

我知道你會怎麼想。你讀完第一條,然後笑了——誰會在沒有數據的時候招聘數據科學家呀。

然而,下一個能說明時機還不成熟的標誌是,你有數據,但不是正確的那種。

正確的意思是,數據是關於你想解決的問題的,而且最好是有標記的。我所說的有標記,是指你的數據是否與事件相關。

例如,如果你想讓一個數據科學家進入你的公司來建立一個系統,檢測你網站上的欺詐行爲,你就會需要從你的網站中獲取活動數據,並知道你的某一組數據中哪些活動是欺詐行爲,哪些不是。知道哪些數據點是欺詐,就可以認爲是標記。

現在——你可以不使用標記就解決問題,但如果這是你第一次涉足數據科學,我強烈建議從有標記的數據開始。

如果你的數據還沒有標記,那麼投入一些時間和資金,請人給你的數據打上標記,或者建立一個可以自動打標記的系統。

你對於想要解決的問題不明確

再說回持有合適的數據這一點。想知道你的數據是否合適,你還必須對於想要解決的問題有一個明確的認識。

這一點怎麼強調也不爲過。

當然——有可能你僱到了一個偉大的數據科學家,他或她入職的時候面對的是一個模棱兩可的問題,然後奇蹟發生了。但是不要做這種打算。

明確地知道你想解決的問題,以及你會如何評估結果是否成功,這樣可以把你成功的機會放到最大。如果這個問題通常可以由人類輕鬆解決,那就更好了,因爲這就標誌着很有可能你同樣也可以用數據科學來解決這個問題。

一個很好的例子可能是,你想以70%以上的準確率來檢測發表在你的網站上的一條評論的言論是否得當。

你需要的其實是一名分析師

既然已經走到了這一步,那麼但願你已經有了合適的數據和對問題的明確認知。

再往下的一個最大的問題是,公司以爲自己需要的是數據科學家,但實際上需要的是分析師。一個數據科學家通常可以勝任分析師的工作內容,但如果你需要的是分析師,那麼最好直接請一個分析師。

一般來說,區別在於你是想要預測未來的新事件,還是想要更深刻地理解過去的事件。

舉個例子,如果你希望有人來把你的歷史銷售數據彙總到一個漂亮的表格上,再加上一些總結性的統計數字,那麼你需要的就是一個分析師。

分析師對公司的價值可能是非常大的。事實上,他們往往比數據科學家更有價值,因爲通常情況下,你交給他們解決的問題更清晰,風險也更低。

你還沒有準備好承擔數據科學家的真實成本

很少有人知道,數據科學家們的需求其實很多。一旦你僱用了他們,他們就會想要更多的數據,更大的存儲和更多的算力。往往你還沒反應過來,他們就已經在試圖說服你一臺10萬美元的電腦對你的數據科學項目絕對是至關重要的了。

而且他們說的可能並沒錯。

所以——在決定僱用一名數據科學家之前,請先考慮一下數據科學家的真實成本。你的IT/基礎設施成本肯定是會增加的。

而且,一名數據科學家自身可能不足以產生巨大的價值。爲了能以可接受的速度前進,在團隊中增加更多的工程師和數據科學家可能會成爲一種必要。

你想要的是獨角獸和彩虹

與你的一般項目相比,通常數據科學項目風險會更大。很常見的情況是,連問題是否能夠被解決都是未知數。你很可能僱了一個數據科學家,最後卻在一個難以解決的問題上花費精力。

你需要對一次次的失敗保持平和的心態,並且在時間表上寬鬆一些,這樣才能讓數據科學項目變得更高效。

這並不是說,你不應該期望你的數據科學團隊能帶來真正的價值,而是說你應該知道這種回報路徑不會是很線性的一個過程。如果你的公司還沒有準備好,那麼我建議緩一緩再說。

你不知道該如何招聘數據科學家

最後,如果你不懂該如何招聘數據科學家,那就不應該去做這件事。

如今數據科學已經能代表許多不同類型的工作了,這就導致,如果你不瞭解這個領域,就很難知道自己要找的是什麼類型的數據科學家。

比如說,也許你找到的是真正的學術型數據科學家,坐擁多個博士學位,但代碼能力很差。又或者你找到的是一個更偏向於工程師的人,只是參加過一些數據科學方面的在線課程。

這兩種本身都沒什麼不好,但根據需求的不同,你的公司可能會招到錯誤的人選。因此,在招聘數據科學家之前,請確保自己真的能夠遊刃有餘地識別出一個合適的人選來。

原文:https://learningwithdata.com/posts/tylerfolkman/7-reasons-not-to-hire-a-data-scientist/

本文爲 CSDN 翻譯,轉載請註明來源出處。

【End】

更多精彩推薦
☞登 GitHub 趨勢榜首德國疫情追蹤 App 號稱可保疫情隱私數據無憂,你信嗎?
☞安卓機+數據線,帶你開發部署人臉識別應用

☞踢翻這碗狗糧:程序員花 7 個月敲出 eBay,只因女票喜歡糖果盒
☞我佛了!用KNN實現驗證碼識別,又 Get 到一招
☞如何使用 SQL Server FILESTREAM 存儲非結構化數據?這篇文章告訴你
☞加密價格更新週期:看似雜亂無章,實際內藏玄機
你點的每個“在看”,我都認真當成了喜歡
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章