警惕!12個數據分析的誤區

警惕!12個數據分析的誤區

對於IT來說,誇大其功效的炒作越多,外界對其的誤解也會越大,數據分析當然也不例外。數據分析是當今信息技術最熱門的領域之一,可以爲企業帶來顯著的業務收益,但這些誤解可能將妨礙分析過程的及時、順利交付,並影響業務用戶和最終客戶。

隨着企業創建或擴展其分析策略,這裏有12個他們需要格外注意的關於數據分析的誤解。

誤區1:數據分析需要大量投資

如今,似乎對每一項新技術的投入都必須通過嚴格的財務支出的篩選過程。“它需要多少費用?”——是IT和業務經理在提議啓動項目或部署新工具時需要首先考慮的問題之一。

有些人認爲數據分析本質上是一項代價高昂的工作,因此僅限於擁有大量預算或大量內部資源的企業機構。但是事實並非如此,現在市場上有很多開源工具和其他工具能夠幫助展示數據分析的價值;並且基於雲系統的大數據架構,也會比傳統的數據倉庫便宜得多。你只需要明確內部數據存儲以及要解決的問題,就可以輕鬆的在雲上使用分析來解決業務問題。

此外,數據分析通常用於實現三個結果:提高流程效率、實現收入增長和主動進行風險管理,總的來說,數據分析在任何公司的應用中都帶來了巨大的成本效益。

誤區2:你需要“大數據”才能執行分析

對於許多人來說,大數據和分析的概念是相輔相成的,企業需要在執行分析之前收集大量數據,以便生成業務洞察,改進決策制定等。

當然,大數據分析的優勢也很明確,擁有這些資源的公司利用大數據存儲作爲促進分析工作的一部分,獲得了顯着的競爭優勢。但是大數據卻並不是分析必不可少的搭配。

分析師需要特定的數據,而不是更多的數據。要想更好地支持決策和提高績效,企業必須更多的考慮業務用戶,確定他們需要訪問哪些數據,如何呈現數據,而不是關注更多的數據。95%以上的用戶會尋找和他們工作相關的信息來支持他們進行決策,來提高業務表現,所以企業需要以最簡單的格式向他們提供這些信息,幫助他們快速定位重要信息。

警惕!12個數據分析的誤區
觀遠數據:預置規則和策略的一站式分析平臺

誤區3:分析消除了人類的偏見

自動化系統執行的方式不應該存在偏見,但技術是由人類建立的,因此消除所有偏見幾乎是不可能的。

有些人認爲分析和機器學習消除了人類的偏見,不幸的是,這並沒有實現。算法和分析使用“訓練數據”進行調整,並將重現“訓練數據”所具有的任何特徵,在某些情況下,這會在分析過程中引入良性偏見,但也有可能帶來更嚴重的偏見——因爲“算法這麼說”並不意味着答案是公平的或者有用的。

誤區4:最好的算法意味着絕對的勝利

事實證明,有了足夠的數據,有時算法無關緊要。谷歌的工程師認爲,數據有着不合理有效性 ,簡單的統計模型,加上極大量的數據,比包含大量特徵和總結的“智能優越模型”能輸出更優質的結果。

因此,在某些情況下,只需處理更大量的數據就可以獲得最佳效果。

誤區5:算法是安全的

人們固執地信任統計模型和算法,並且隨着分析程序的組織構建,他們會越來越依賴複雜的模型來支持決策。這或許是因爲用戶並不覺得他們有能力挑戰模型,因此他們必須相信構建它們的“聰明人”。

比如,在過去的50到60年裏,我們反覆聽到“人工智能將在20年內接管人類工作”的言論,現在也還是有人反覆強調這種觀點。在我們可以完全信任機器學習和它們輸出的結果之前,還有很多事情要做。在那之前,我們需要挑戰構建算法和模型的人,讓他們解釋如何得到答案。這並不是說我們不能依賴於結果,而是說我們需要透明度,這樣我們纔可以信任和驗證分析結果。

■ 延伸閱讀:遵循因果性的可解釋AI預測請添加鏈接描述
警惕!12個數據分析的誤區
觀遠數據AI預測引擎:遵循因果性的可解釋AI預測

誤區6:數據科學是一種神祕的“黑色藝術”

近年來,數據科學學科受到了很多關注,有時甚至會與其他學科產生混淆。基本上來說,數據科學涉及了數據查找模式中所有算法的使用。

數據科學似乎很神祕,因爲這些算法能夠分析比人類能夠理解的範圍內更多變量和更大的數據集。但是隨着近年來計算能力和內存的擴大,我們現在能夠快速解決10年前任何技術都無法解決的問題,人們也隨之明白,數據科學是統計推斷技術的自然演變。但一旦你理解了數學,數據科學就沒有了神祕感。

誤區7:需要越多的數據科學家,才能做更多的數據科學工作

如今,數據科學家是所有技術專業人員中最緊缺的。但如果他們重新定位他們正在進行的工作,組織機構可能會減少這些專業人員的數量。

許多數據科學家的時間花費在非增值活動上,比如查找數據集,將數據發送到可以處理的地方,以及轉換和清理數據等。考慮到聘請數據科學家的困難程度,這些低價值的任務並不是企業想要的。

數據科學家需要專注於特徵工程,提取和分析,而不是圍着數據打轉,這樣才能大大提高他們的工作效率和產出。

誤區8:分析需要花費很長時間

如今,快速完成工作——無論是將產品或服務推向市場,還是近乎實時地響應客戶諮詢,對於任何企業來說都是影響核心競爭力的重要因素。

分析聽起來似乎需要很長時間才能執行,與實現速度和敏捷性的目標背道而馳,但這仍然是一個誤區。歸根究底,一切都與人才有關。有了正確的技能組合和敏捷方法論的應用,大型問題也可以在幾天或幾周內得到回答,而不是幾個月。

同時,你還需要一個敏捷輕量並預置大量規則與策略的智能分析平臺!

誤區9:技術是最困難的部分

隨着當今可用技術的不斷增加,選擇合適的工具組合進行部署和集成,可以更好從分析團隊獲得所需的結果,

然而,真正困難的部分是“整合組織結構和運營模式,將人員、流程、技術視角所需的全部內容整合在一起。假如你認爲只有技術才能解決任何商業問題,那麼在此認知之上建立的數據架構,最終會將企業帶入“沼澤地”中,或者是產出任何人都難以理解的信息。

技術無法解決分析問題,正確的流程是:先確定一個業務問題,然後問,“我需要什麼數據來解決這個問題?”這將幫有效幫助您識別企業內數據的差距。

誤區10:數據分析應該是一個單獨的部門

在一些組織中,數據分析被劃入一個單獨的部門,而另一些組織則將數據分析深深地融入了跨職能團隊。

然而事實證明,以所有業務領域的數據爆炸和變化發生的速度,以單獨部門存在的數據分析開始不起作用了。另一方面,隨着企業變得更加以客戶爲中心,應該讓數據分析專家成爲業務部門的核心,而不是將其獨立於作爲業務支持的部門。

當今企業面臨的許多複雜問題都存在於業務部門內,而且這些問題的許多解決方案都隱藏在數據中。數據科學家和技術專家,與這些業務部門密切合作,使用大型數據集和人工智能,將成爲孵化下一代產品、服務和客戶體驗的關鍵。

誤區11:分析工作只適用於博士

很高興我們在分析團隊中擁有了許多受過良好教育的人,但這並不是分析成功的必要條件。

企業傾向於認爲,如果數據分析師沒有博士學位,他們將無法進行最佳的分析。然而現代分析需要各種技能——建立具有不同技能的“分離艙”,包括那些精通新興技術和開源軟件的人、大數據架構師、數據工程師、數據科學家、數據可視化專家等等,纔是最重要的。

誤區12:人工智能會摧毀工作並破壞經濟

歷史上新技術的引入擾亂了許多工作和行業,人們同樣擔心人工智能會消除人們執行某些任務的必要。

雖然AI解決方案比解決某些問題的人要好得多,比如AI可以更快地閱讀,記住更多,並且比任何人都能更好地進行復雜數學關係的計算。但是,AI也無法應對真正全新的變化,這是人類擅長的地方。

可以肯定的是,某些工作已經因AI的興起而消失或減少,與此同時這種趨勢還在增長。儘管如此,我們理解和解決“完全不可預見的情況”的優勢不會被任何目前的AI技術所取代。在可預見的未來,最有效的方法是通過AI系統來增強人類的能力,取代人工的“繁重”。雖然人工智能正導致許多工作崗位發生變化,但是人們會將成爲這一商業生態系統的重要組成部分。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章