原创 HashMap的5種遍歷方式

package com.data.linear.map; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.uti

原创 數據採集的大致流程(離線和實時)

一:離線數據的採集流程 1、我們的數據從哪裏來? 互聯網行業:網站、app、微信小程序、系統(交易系統。。) 傳統行業:電信,人們的上網、打電話、發短信等等數據 數據源:網站、app、微信小程序 都要往我們的後臺去發送請求,獲取數據,執行

原创 ElasticSearch和Solr的區別

Elasticsearch簡介 Elasticsearch是一個實時的分佈式搜索和分析引擎。它可以幫助你用前所未有的速度去處理大規模數據。 它可以用於全文搜索,結構化搜索以及分析,當然你也可以將這三者進行組合。 Elasticsearch

原创 eclipse如何改全局的utf8

1、windows->Preferences...打開"首選項"對話框,左側導航樹,導航到general->Workspace,右側Text file encoding,選擇Other,改變爲UTF-8,以後新建立工程其屬性對話框中的Te

原创 Nginx

 一:單機Nginx的安裝 1.上傳nginx安裝包 2.解壓nginx     tar -zxvf nginx-1.12.2.tar.gz -C /usr/local/src/ 3.進入到nginx的源碼目錄     cd /usr/

原创 get和post的使用場景

原文鏈接:https://blog.csdn.net/shuidinaozhongyan/article/details/72597794 GET和POST兩種方法都是將數據送到服務器。HTTP

原创 MongDB重啓出現問題

1:首先要明白一點:/var/run/mongodb/mongod.pid exists  這個錯誤的出現不會因爲此文件的刪除而解決掉,因爲權限不足, 我們無法完全刪除掉這個文件。所以我們首先要解決權限的問題。這一點我們可以在mongod

原创 MongoDB數據庫的基本操作

Linux系統安裝mongDB數據庫的yum源 1、vi /etc/yum.conf *****修改keepcache=0爲keepcache=1 #配置mongo的yum源 vi /etc/yum.repos.d/mongodb-or

原创 @Autowired註解注入失敗,提示could not autowire的解決辦法

此原因出現的主要原因是因爲我們的spring檢驗級別的問題,我們可以通過降低檢驗的安全級別就可以解決這一問題。 File —> Settings—>Editor—>Inspections—>Spring————》將最右邊的Serveri

原创 Linux下安裝JDK 及 OpenJDK的卸載

今日發現我Linux系統中安裝的JDK是1.8的版本,但是在查詢時候竟然是1.7的版本,因爲我目前從事大數據方向的開發,這對於當前很多流行的技術不是很友好,故解決此問題,也讓各位同仁不必再爲此煩惱。 1、查詢JDK版本 [root@hdp

原创 Flume HA的配置

在此處我們爲了防止單點故障,把flume配置成HA的高可用 1、首先準備3臺機器,分別是hdp-01、hdp-02、hdp-03,其中hdp-01爲source機器,而hdp-02、hdp-03爲Flume高可用集羣。 2、我們先設置hd

原创 Linux三種網絡

Linux的三種網絡 一、三種網絡連接的區別: (1)、Vmnet0:橋接模式 (2)、Vmnet1:僅主機模式 (3)、Vmnet8:NET模式:默認是沒有IP地址的,需要自己設置。 手動設置IP地址:vi /etc/syscon

原创 Spark Streaming

1.Spark Streaming是一個基於Spark Core之上的實時計算框架,可以從很多數據源消費數據並對數據進行處理, 在Spark Streaing中有一個最基本的抽象叫DStream(代理),本質上就是一系列連續的RDD,DS

原创 Spark SQL

1、Spark SQL 是 Spark 套件中的一個模塊,他將數據的計算任務通過 SQL 的形式轉換成了 RDD 的計算,類似於 Hive 通過 SQL 的形式將數據的計算任務傳換成了MapReduce。 2、Spark SQL 的特點: