原创 工業4.0時代,機器人發展現狀及技術趨勢揭示

近年,隨着勞動力成本不斷上漲,工業領域“機器換人”現象普遍,工業機器人市場與產業也因此逐漸發展起來。由於中國城鎮單位就業人員平均工資已經從10年前的18200元飆漲至56399元,高成本勞動力施壓下,利用工業機器人轉型智能製造成爲發展趨

原创 數據科學家們正在使用的十種程序語言和工具

意圖打開數據科學的大門但卻不知怎麼開始?那就看一看我們整理出的10種在數據科學家和數據分析師眼中這些熱門的語言和工具。 R語言 R語言是數據科學家和分析師們常用的兩種頂級工具中的一種。1995年 Ross Ihaka 和 Rober

原创 大數據在醫療領域的應用

大數據的定義及特徵 大數據顧名思義就是數量極其龐大的數據資料。大數據的意義在於提供“大見解”:從不同來源收集信息,然後分析信息,以揭示用其他方法發現不了的趨勢。早期,IBM定義了大數據的5v特性:大量性( Volume), 多樣性(Va

原创 滴滴智慧交通建設三大目標

兩會人工智能首次被寫入政府工作報告, 科技部部長萬鋼表示,中國人工智能創新發展規劃即將出臺,同時國內外巨頭在相關領域的佈局案例不勝枚舉。受數據、信息化、需求、政策的聯合推動,人工智能已到風口,成爲新一輪科技革命的重要代表。但只有把人工智

原创 大數據解密:《人民的名義》是怎麼火起來的?

最近這幾天,坐地鐵上下班的時候,總能看到有人捧着手機,癡迷於《人民的名義》的劇情中。看到此番景象,筆者(大數據應用行業從業者),出於職業本能,不禁想要透過現象看本質,迫切想要知道《人民的名義》怎麼這麼火? 隨即着手於大數據監測,並對結果進

原创 大數據教程(一)—— Hadoop集羣壞境搭建配置

前言 關於時下最熱的技術潮流,無疑大數據是首當其中最熱的一個技術點,關於大數據的概念和方法論鋪天蓋地的到處宣揚,但其實很多公司或者技術人員也不能詳細的講解其真正的含義或者就沒找到能被落地實施的可行性方案,更有很多數據相關的項目比如弄幾張報

原创 Hadoop沒有消亡,它是大數據的未來

有人認爲 Hadoop 正在失敗,但硅谷數據管理公司 Hortonworks 的總經理 Vamsi K. Chemitiganti 並不這麼看,爲了反駁此前一篇文章《爲什麼 Hadoop 正在消亡?(Why Hadoop is Faili

原创 7個你現在就該學習Python的理由

Python 是一門更注重可讀性和效率的語言,尤其是相較於 Java,PHP 以及 C++ 這樣的語言,它的這兩個優勢讓其在開發者中大受歡迎。 誠然,它有點老了,但仍是80後啊 —— 至少沒有 Cobol 或者 Fortran 那麼老。而

原创 大數據教程(四)—— Hadoop集羣VSFTP和SecureCRT安裝配置

大數據教程(一) Hadoop集羣壞境搭建配置大數據教程(二) Hadoop集羣壞境CentOS安裝大數據教程(三) Hadoop集羣分佈式壞境搭建前言 經過前三篇文章的介紹,已經通過VMware安裝了Hadoop集羣環境,當然,我相信安

原创 驚豔全球數據行業的16個數據可視化例子

數據是非常強大的。當然,如果你能真正理解它想告訴你的內容,那它的強大之處就更能體現出來了。    通過觀察數字和統計數據的轉換以獲得清晰的結論並不是一件容易的事。必須用一個合乎邏輯的、易於理解的方式來呈現數據。 談談數據可視化 人類的大腦

原创 乾貨丨23個適合Java開發者的大數據工具和框架

目前,編程人員面對的最大挑戰就是複雜性,硬件越來越複雜,OS越來越複雜,編程語言和API越來越複雜,我們構建的應用也越來越複雜。根據外媒的一項調查報告,以下列出了Java程序員在過去12個月內一直使用的一些工具或框架,或許會對你有意義。

原创 10款超好用的開源大數據分析工具

現如今,整個互聯網已經進入大數據時代,“大數據”一詞的重點現也已經不僅在於數據規模的定義,它更代表着信息技術發展進入了一個新的里程,代表着爆炸性的數據信息給傳統的計算技術和信息技術帶來的技術挑戰和困難,代表着大數據處理所需的新的技術和方法

原创 大數據教程(二)—— Hadoop集羣壞境CentOS安裝

大數據教程(一) Hadoop集羣壞境搭建配置前言 前面我們主要分析了搭建Hadoop集羣所需要準備的內容和一些提前規劃好的項,本篇我們主要來分析如何安裝CentOS操作系統,以及一些基礎的設置,閒言少敘,我們進入本篇的正題。 技術準備

原创 分佈式計算開源框架Hadoop入門實踐(二)

其實參看Hadoop官方文檔已經能夠很容易配置分佈式框架運行環境了,不過這裏既然寫了就再多寫一點,同時有一些細節需要注意的也說明一下,其實也就是這些細節會讓人摸索半天。Hadoop可以單機跑,也可以配置集羣跑,單機跑就不需要多說了,只需要

原创 分佈式計算開源框架Hadoop入門實踐

在SIP項目設計的過程中,對於它龐大的日誌在開始時就考慮使用任務分解的多線程處理模式來分析統計,在我從前寫的文章《Tiger Concurrent Practice —日誌分析並行分解設計與實現》中有所提到。但是由於統計的內容暫時還是十分