大數據時代,如何進行數據挖掘與分析

  數據挖掘是一種決策支持過程,它通過高度自動化地分析企業的數據,做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調整市場策略,減少風險,做出正確的決策。

大數據時代,如何進行數據挖掘與分析

  企業當中無效、利用率最低的數據是什麼數據?

  很多質量的檢測項目都是測量“產量”、“合格/不合格”、“通過/不通過”或“符合/不符合”這些弱指標的,這類數據屬於計數型數據,具體而言,都屬於不良數據,這類數據的計量結果通常都計爲1或0。

  不良數據的價值是幫助使用者描述感覺:好或者不好,而不關心數據所指的具體對象。如果產量不好,就需要提供更有力的變量型數據來隔離或者解決其中的問題。計量型數據可以用連續、隨機的數值來統計,例如長度、高度、直徑、壓力、百分比、溫度等等。

  企業針對工業數據常常犯的一個最大的錯誤就是:將大量計量型數據簡單粗暴地轉化爲“通過/不通過”這類計數型數據。從另外一個角度來看,統計結果的可靠性更多的依賴人爲判斷,並沒有具體的現場數據作爲強有力的證據支撐。

  在數據採集變得越來越容易的當今,僅僅收集數據,只是成功的第一步而已。要想將製造數據的價值真正挖掘出來,做到最大化的有用且高效,可從以下三個方面來計劃:

  第一步:明確數據採集的源頭

  需要對內部現有的儀器設備做一個全面的排查,明確哪些數據是手工採集、哪些數據能夠藉助接口自動採集,並做進一步的規劃,明確數據採集的時間頻率、採集的關鍵信息點、控制圖分析類型、控制指標、異常處理等信息。

  第二步:明確數據的可用性

  有的數據用來做實時的現場判斷,有的用來做長期的戰略決策,而有的,其實只是佔用空間而已,沒有實際價值。實時採集到的數據需要通過專業的分析和報警工具,提醒用戶確定是否需要對生產做出調整,同時,確保生產製程的穩定性。用於制訂長期戰略決策的數據,必須從長期的維度來挖掘、分析數據,找到最關鍵的數字趨勢,突出值得關注的信息。而大量無關緊要的數據,最好及時處理、釋放內存空間。

  第三步:數據價值的衡量指標

  對於收集的數據,有哪些衡量指標?這些指標對自上而下和自下而上的決策是否產生影響?它們能否對正確的行爲給予回報和獎勵?

來源:中琛魔方大數據分析平臺官網(www.zcmorefun.com)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章