乾貨!大數據分析的九種思維

  在數據分析方面,人們經常提到數學技能、統計知識或編程技能,每種技能都很難學習,因此往往令人氣餒。事實上,一些數據分析方法對數學能力沒有那麼高的要求,更重要的是,它們有數據分析的思想。接下來,給您分享一下。

  1.分類分類分析的目標是將一組人(或對象)劃分爲若干類別,或預測他們屬於每個類別的概率。舉個例子吧:“京東的哪位用戶會在618訂購?”這是一個典型的兩類問題:買還是不買。分類分析(基於歷史信息)產生模型,該模型預測新人(或事物)將屬於哪個類別,或屬於類別的概率。

  2.迴歸迴歸任務的目標是根據某個屬性變量給每個人(或對象)一個數字(以衡量他的好壞)。繼續舉個例子:每個用戶在618訂購京東多少錢?注意,迴歸和分類之間的區別在於分類輸出的結果是幾個固定選項之一,並且迴歸的結果是連續數,並且可能的值是無限的。

  3.聚類聚類任務的目標是給一組人(或對象),並在不指定目標的情況下查看哪些人(或事物)更近。例子:是否可以爲一組用戶分成幾種類型的購買記錄?注意聚類與上述分類和迴歸之間的本質區別:分類和迴歸將有一個給定的目標(無論是否下訂單,貸款違約,房價等),並且聚類沒有給定的目標。

  4.相似匹配類似匹配任務的目標是基於已知數據確定哪些人(或事物)與特定(一批)人(或事物)更相似。例子:瞭解一羣去年在雙十一中投入超過1萬元的用戶,哪些用戶與他們相似?

  5.頻繁集發現頻繁發現劇集的目的是找到經常共同發生的人(或事物)。這是着名的“啤酒和尿布”的一個例子。

  6.統計(屬性、行爲、狀態)描述統計描述任務的目標是最好的理解:人們在什麼狀態下做什麼狀態(或事物)。例子:5月份7天內京東各用戶的無條件退貨數量統計描述通常是用戶欺詐檢測。想象一下,用戶每月返回100次以上。會是什麼情況?

  7.聯繫預測聯繫預測的目標是預測應該存在關係的人(或事物)。栗子:你可能知道xxx?你可能想看xxx?

  8.數據壓縮數據壓縮的目的是減小數據集的大小並增加信息密度。栗子:京東想要分析用戶對進口巧克力的偏好,篩選掉所有國內的產品。大數據雖然數據越多越好,數據帶來更多信息,但噪音也會增加。

  9.因果分析顧名思義,因果分析的目標是找出事物之間的關係。比如:廣告的效果是否有所改善,因爲廣告內容是好還是傳遞給更準確的用戶?數據分析非常強大,但當然有必要使用科學的分析方法在特定情況下產生有價值的結果。

  乾貨!大數據分析的九種思維.中琛魔方大數據表示:數據分析非常強大,但當然,在特定情況下,嚴格的選擇假設,使用科學的分析方法來產生有價值的結果。數據說謊的經典例子是安慰劑效應。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章