原创 DKhadoop安裝包下載與監控參數說明

DKhadoop安裝包下載與監控參數說明前階段用了差不多兩週的時間把DKhadoop的運行環境搭建以及安裝的各個操作都介紹了一遍。關於DKhadoop安裝包下載也只是順帶說了一下,但好像大快搜索的服務器在更新,新的下載頁面還不好用!有好些朋

原创 什麼是自然語言處理技術

自然語言處理(NLP)是計算機科學,人工智能,語言學關注計算機和人類(自然)語言之間的相互作用的領域。自然語言處理是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理

原创 hadoop需要哪些技術支持

hadoop是一個開源軟件框架,可安裝在一個商用機器集羣中,使機器可彼此通信並協同工作,以高度分佈式的方式共同存儲和處理大量數據。最初,Hadoop 包含以下兩個主要組件:Hadoop Distributed File System (HD

原创 大數據分佈式存儲的部署模式:分離式or超融合

大數據分佈式存儲的部署模式:分離式or超融合數據中心內部系統的核心要求是“穩定可靠”,一是指系統在運行過程中有能力提供連續可靠的服務,長時間無故障運行;二是指當故障發生之後,有能力快速定位,及時排查,故障範圍不蔓延。分離式部署的方式,使得系

原创 大快搜索大數據可視化平臺監控功能深度解析

大快搜索大數據可視化平臺監控功能深度解析 在上一篇的文章中已經明確說過DKM作爲大快發行版DKhadoop的管理平臺,它的四大功能分別是:管理功能,監控功能,診斷功能和集成功能。管理功能已經給大家列舉了一些做了說明,今天就DKM平臺的監控功

原创 什麼是大數據

一、什麼是大數據進入本世紀以來,尤其是2010年之後,隨着互聯網特別是移動互聯網的發展,數據的增長呈爆炸趨勢,已經很難估計全世界的電子設備中存儲的數據到底有多少,描述數據系統的數據量的計量單位從MB(1MB大約等於一百萬字節)、GB(102

原创 零基礎學習hadoop開發先明白這層關係

零基礎學習hadoop開發先明白這層關係大數據hadoop無疑是當前互聯網領域受關注熱度最高的詞之一,大數據技術的應用正在潛移默化中對我們的生活和工作產生巨大的改變。這種改變給我們的感覺是“水到渠成”,更爲讓人驚歎的是大數據已經僅僅是互聯網

原创 hadoop入門學習教程--DKHadoop完整安裝步驟

hadoop入門學習教程--DKHadoop完整安裝步驟使用hadoop版本是DKH標準三節點發行版,DKHadoop版本的易用性比較好,環境部署要簡單的多,參考此篇安裝前請先下載DKHadoop版本,網盤鏈接:https://pan.ba

原创 大數據框架hadoop服務角色介紹

大數據框架hadoop服務角色介紹翻了一下最近一段時間寫的分享,DKHadoop發行版本下載、安裝、運行環境部署等相關內容幾乎都已經寫了一遍了。雖然有的地方可能寫的不是很詳細,個人理解水平有限還請見諒吧!我記得在寫DKHadoop運行環境部

原创 標題:DKhadoop大數據處理平臺監控數據介紹

標題:DKhadoop大數據處理平臺監控數據介紹2018年國內大數據公司50強榜單排名已經公佈了出來,大快以黑馬之姿闖入50強,並摘得多項桂冠。Hanlp自然語言處理技術也榮膺了“2018中國數據星技術”獎。對這份榜單感興趣的可以找一下看看

原创 大快搜索數據爬蟲技術實例安裝教學篇

Hadoop作爲搭建大數據處理平臺的重要“基石”,關於它的分析和講解的文章已經有很多了。Hadoop本身是一分佈式的系統,因此在安裝的時候,需要多每一個節點進行組建的安裝。並且由於是開源軟件,其安裝過程相對比較複雜。這也是很多人在搭建had

原创 web開發安全框架中的Apache Shiro的應用

web開發安全框架中的Apache Shiro的應用前階段就hadoop的分享了一些內容,希望對新手入門的朋友有點幫助吧!對於hadoop新手入門的,還是比較推薦大快搜索的DKHadoop發行版,三節點標準版還是值得擁有的(三節點的標準版是

原创 大快搜索數據爬蟲技術實例安裝教學篇

大快搜索數據爬蟲技術實例安裝教學篇 爬蟲安裝前準備工作:大快大數據平臺安裝完成、zookeeper、redis、elasticsearch、mysql等組件安裝啓動成功。 1、修改爬蟲安裝配置文件(最好在線下修改好後再上傳平臺) 2、修改c

原创 什麼是大數據技術架構

大數據的應用開發過於偏向底層,具有學習難度大,涉及技術面廣的問題,這制約了大數據的普及。現在需要一種技術,把大數據開發中一些通用的,重複使用的基礎代碼、算法封裝爲類庫,降低大數據的學習門檻,降低開發難度,提高大數據項目的開發效率。大數據在工

原创 學習Hadoop大數據基礎框架

什麼是大數據?進入本世紀以來,尤其是2010年之後,隨着互聯網特別是移動互聯網的發展,數據的增長呈爆炸趨勢,已經很難估計全世界的電子設備中存儲的數據到底有多少,描述數據系統的數據量的計量單位從MB(1MB大約等於一百萬字節)、GB(1024