原创 氣候數據只能預測降雨麼?那你就錯了!

“轉自:燈塔大數據;微信:DTbigdata” ———————————————————————————————————————————————————————————— 天氣狀況與人類息息相關,不管你身處在地球的哪個角落,都無法忽視天氣和

原创 隨筆 | 讓您操碎心的ElasticSearch,原來還可以這樣加固安全

GDI Foundation的安全研究人員Victor Gevers 在2016年12月27日發現,一些不採取任何安全防護措施的MongoDB用戶的數據被黑客攻擊,數據庫內容被加密,受害者必須支付贖金才能找回自己的數據。隨後,這一事件不斷

原创 通向ES的高速公路

一、背景 隨着互聯網的發展和Elasticsearch(以下簡稱ES)技術的成熟,越來越多的企業、政府單位將產生或者獲得大量的數據,用ES進行全文搜索和分析。 維基百科使用Elasticsearch來進行全文搜索並高亮顯示關鍵詞,以及提供

原创 2016中國大數據市場研究報告

本研究報告主要針對大數據市場進行研究。首先理清大數據的定義及本質。而後,就大數據市場是處於概念期還是實戰期做出判斷分析,包括企業用戶的實踐情況,實踐方向,實踐障礙。最後,就大數據市場的發展潛力進行分析。 主要觀點 1)大數據是傳統數據

原创 開啓敏捷小程序的新時代

說到小程序可能大家最先想到的是微信小程序,因爲它不僅解決了用戶安裝過多應用的憂慮,而且實現了應用的“觸手可及,用完即走”的理念。可今天小編說的此程序非彼程序。 何爲(FEA)小程序? 作爲FEA的忠實粉,有必要解釋下:(FEA)小程序作爲

原创 數據分析繁華的背後,都隱藏着怎樣的哀傷

大數據技術的核心是什麼? 面對這個問題,相信大家都會回答是大數據分析系統。 大數據分析系統從海量類型多樣、增長快速、內容真實的數據背後挖掘、分析,從中找出可以幫助決策的價值信息,未知的單方/雙方/多方關係,並結合用戶需求有針對性地進行調整

原创 用機器學習構建模型,進行信用卡反欺詐預測

本文通過利用信用卡的歷史交易數據進行機器學習,構建信用卡反欺詐預測模型,提前發現客戶信用卡被盜刷的事件。 1. 數據的下載和數據介紹 數據的下載地址爲 https://www.kaggle.com/dalpozz/creditcardfr

原创 可視化設計器的正確打開方式

FEA可視化設計器越來越強大了 強大到你真的有點不認識它了! 你不信? 跟我來看看 一、背景和樣式全面改版 ————————————————————————————————————————————————————————— 背景更好看

原创 Spark2.x與ElasticSearch的完美結合

ElasticSearch(簡稱ES)是一個基於Lucene的搜索服務器。它提供了一個分佈式多用戶能力的全文搜索引擎,基於RestFul web接口。ElasticSearch是用Java開發的,並作爲Apache許可條款下的開放源碼發佈

原创 聽說有人看3D版的《戰狼2》掀翻爆米花,那看加入3D圖的可視化會怎麼樣?

最近大火的電影 非《戰狼2》莫屬 8月2日票房已達到16.08億 上映才7天! (戰狼2海報) 百度、搜狗、新榜的排行基本在top10以內 除了精彩的故事情節之外 3D效果也是十分的提氣 提氣到什麼程度呢 看網友的評價 “開場那個胳膊飛

原创 用SPK技術分析,泰坦尼克號沉船之後哪些人活下來了

本文采用Kaggle中比較知名的數據集Titanic Machine Learning from Disaster作爲分析數據源,該數據集被評爲五大最適合數據分析練手項目之一。 分析目的是根據訓練集預測部分乘客在沉船事件中是否會存活? 數

原创 什麼?多個體多維度分析效率能從3天壓縮到30分鐘?

在進行機器學習的時候,我們需要對單個體進行多維度分析,比如說在日誌審計系統,我們需要對每一個操作賬戶進行操作次數統計,總操作次數統計,方差,極值,中值,突變度等計算。有時,也要計算非工作時間的訪問,方差,極值,中值,突變度等數據。 過去

原创 因爲有它,Spark集羣的交互操作變得更簡單

Spark 2.X開發的一個動機是讓它可以觸及更廣泛的受衆,特別是缺乏編程技能但可能非常熟悉SQL的數據分析師或業務分析師。因此,Spark 2.X現在比以往更易使用。 在以前的Spark 1.x版本中,主要使用RDD(彈性分佈式數據集)

原创 基於Spark ML 聚類分析實戰的KMeans

聚類分析是一個無監督學習 (Unsupervised Learning) 過程, 一般是用來對數據對象按照其特徵屬性進行分組,經常被應用在客戶分羣,欺詐檢測,圖像分析等領域。K-means 應該是最有名並且最經常使用的聚類算法了,其原理比

原创 當局者“密”,密鑰者清

目前,面對國防、醫療保健以及金融行業的數據安全問題,越來越多的應用程序開始應用於數據的處理。其實,任何一個組織都難以保證重要的數據不會被窺探,而對於公有云來說,這個問題更爲嚴重。 傳統的加密方案關注的是數據存儲安全。即我要給其他人發個加密