圖書說明:
檢查保持大數據質量和發現新穎解決方案的問題。您將學習四大V數據,包括準確性,並從各個角度研究問題。討論的解決方案來自工程和數學的各個領域,包括機器學習,統計,形式方法和區塊鏈技術。
大數據的準確性是對機器學習算法和各種技術(如卡爾曼濾波器,SPRT,CUSUM,模糊邏輯和區塊鏈)的介紹,展示了它們如何用於解決準確性領域的問題。使用示例,技術背後的數學用易於理解的語言解釋。
確定實際應用程序中大數據的真實性涉及使用各種工具來分析可用信息。本書深入研究了一些可以使用的技術。Twitter等微博網站在公共生活中發揮了重要作用,包括在總統選舉期間。本書使用在特定主題上發佈的微博示例來演示如何檢查和建立準確性。在檢測微博網站上的隱藏攻擊以影響公衆輿論的背景下描述了一些技術。
你將學到什麼
- 瞭解有關數據準確性及其後果的問題
- 使用易於理解的語言和示例,開發所需的數學基礎,以幫助最小化問題的影響
- 使用各種工具和技術,如機器學習算法,區塊鏈和卡爾曼濾波器來解決準確性問題
本書適用於誰
軟件開發人員和從業人員,執業工程師,好奇的經理,研究生和研究學者