原创 2.ElasticSearch基礎部分

ElasticSearch基礎部分1. 通過Filebeat把日誌傳入到Elasticsearch1.1. [測試數據`apache-daily-access.log`獲取;提取碼`nin8`](https://pan.baidu

原创 3. ElasticSearch分詞器和聚合,數據的豐富和去重

ElasticSearch分詞器和聚合,數據的豐富和去重1. analyzer1.1. 什麼是analysis?1.2. 如何定義一個定製的分析器1.3. 中文分詞器2. Aggregations2.1. [Bucket aggr

原创 1. Elastic Stack開篇

Elastic Stack開篇1. Elasticsearch簡介2. [【Elastic 中國社區官方博客】](https://blog.csdn.net/UbuntuTouch)3. Elasticsearch DSL語法:增

原创 13. spark學習之旅之streaming(七)

文章目錄1. spark streaming概述2. DStream概述3. spark streaming 實現實時WordCount統計3.1. 架構圖3.2. 源代碼3.3. Window模式源代碼(應用場景,每小時的流量統

原创 19. 衛健委官網醫院查詢爬蟲+驗證碼識別(雲打碼)綜合案例

1. 主類Spider import os import random import requests import xlrd from lxml import etree from pymongo import MongoCl

原创 02.shell編程總結

Shell是用戶與內核進行交互操作的一種接口,目前最流行的Shell稱爲bash Shell Shell也是一門編程語言<解釋型的編程語言>,即shell腳本<就是在用linux的shell命令編程>。一個系統可以存在多個she

原创 1.git分支開發規範

Git分支開發規範1. 初衷2. 分支管理2.1. 分支命名2.2. 常見任務3. [本地分支和遠程分支建立追蹤關係的三種方式](https://blog.csdn.net/qq_42780289/article/details/

原创 7. Flink on yarn模式部署以及flink和hive的集成

文章目錄1. Flink Yarn 模式高可用性配置(自己通過源碼編譯的Flink)2. Hive2.1. Hive簡介2.2. Hive的數據存儲2.3. [Hive基本架構](https://blog.csdn.net/u01

原创 01. Linux常用命令

pwd: 查看當前工作目錄的全路徑 date +%Y-%m-%d 查看當前系統的時間 date +%Y-%m-%d --date="-1 day" date +%Y-%m-%d --date="-1 month"

原创 11.spark學習之旅之hive(五)

文章目錄1. hive概述1.1. 簡介1.2. 爲什麼要使用hive1.3. hive的特點1.4. [架構](https://blog.csdn.net/u013595419/article/details/79632928)

原创 2.IDEA中sbt創建Flink項目及build.sbt配置

文章目錄1. Flink教程1.1. [諸葛子房的博客基礎篇](https://www.cnblogs.com/zgzf/p/10794473.html)1.2. [諸葛子房的博客(新)](https://blog.csdn.ne

原创 13.mongodb之python爬蟲

mongodb 文檔行數據庫總結1. [Centos7安裝mongodb鏈接](https://www.cnblogs.com/flying1819/articles/9035408.html)2. mongodb常用命令3. m

原创 10. Python之正則表達式

01. 匹配單個字符 Python正則表達式中的re.S . 匹配任意1個字符(除了\n)如若想要匹配\n 需要使用re.S [ ] 匹配[ ]中列舉的字符 \d 匹配數字,即0-9 \D 匹配非數字,即不是數字 \s 匹配空白,

原创 10. spark學習之旅之sbt(四)

文章目錄1. [依賴jar包的查找地址 Maven Repository倉庫](https://mvnrepository.com/)2. scala中的項目管理工具sbt2.1.軟件安裝和配置2.2. [sbt官網案例](ht

原创 8. spark學習之旅(二)

文章目錄1. 彈性分佈式數據集RDD1.1. 什麼是RDD1.2. RDD的屬性1.3. 通過RDD的轉換方式對RDD詳細解釋1.4. 如何創建RDD1.5. Transformation和Action詳解1.6. 常用的算子詳細