原创 Python學習筆記-ElasticSearch操作

安裝:pip install -U elasticsearch  (Successfully installed elasticsearch-7.0.3) ElasticSearch版本:elasticsearch-7.3.0 Pytho

原创 Docker學習筆記-Zookeeper集羣搭建

Linux版本:Ubuntu 16.04.2 LTS Docker版本:Docker version 17.09.0-ce, build afdb6d4 Docker Compose版本:docker-compose version 1.

原创 Docker學習筆記-Kafka集羣搭建

Linux版本:Ubuntu 16.04.2 LTS Docker版本:Docker version 17.09.0-ce, build afdb6d4 Docker Compose版本:docker-compose version 1.

原创 Docker學習筆記-Redis集羣搭建

Linux版本:Ubuntu 16.04.2 LTS Docker版本:Docker version 17.09.0-ce, build afdb6d4 Docker Compose版本:docker-compose version 1.

原创 學習筆記-行政區劃匹配缺失補全

簡單實現,存在缺陷 具體代碼如下 # -*- coding:utf-8 -*- import os import sys import enum from maximum_matching_2 import MaximumMatchi

原创 Python學習筆記-文本最大匹配分詞

# -*- coding:utf-8 -*- import os import sys default_encoding = 'utf-8' if sys.getdefaultencoding() != default_encodi

原创 Python學習筆記-遍歷URL鏈接文件多線程下載

  功能代碼記錄: # -*- coding:utf-8 -*- import os import sys import time import urllib import Queue import random import req

原创 爬蟲學習筆記-部分網站記錄

 Twitter # -*- coding:utf-8 -*- import os import sys import json import time import datetime import xlsxwriter from

原创 Redis學習筆記-RedisCluster安裝部署和使用

1、Ruby安裝 $tar -xzvf ruby-2.2.4.tar.gz $./configure $make $make install   2、Redis安裝 $tar -zxvf redis-3.2.3.tar.gz $make

原创 JStorm學習筆記-基於Kafka、ElasticSearch、HBase簡單實例

相關依賴如下: <hadoop.version>2.7.2</hadoop.version> <hbase.version>1.2.3</hbase.version> <kafka.version>0.10.0.0</kafka.ver

原创 ES-Hadoop學習筆記-Storm交互

elasticsearch-hadoop提供ElasticSearch與Apache Storm的集成支持。從ElasticSearch讀取的數據是以Storm裏Tuple的形式進行操作處理。 依賴版本信息: <dependency><g

原创 Tez學習筆記-初識

Apache Tez是一個針對Hadoop數據處理應用程序的新分佈式執行框架。Tez是Apache最新的支持DAG作業的開源計算框架,它可以將多個有依賴的作業轉換爲一個作業從而大幅提升DAG作業的性能。Tez並不直接面向最終用戶——事實上

原创 Tez學習筆記-UI安裝部署

相關版本 tez使用版本:tez-0.8.4.tar.gz tomcat使用版本:tomcat-8.0.36.tar.gz hadoop使用版本:hadoop-2.7.2.tar.gz 修改HADOOP配置文件yarn-site.xml,

原创 MongoDB學習筆記-數據導入Excel文件

使用mongoexport工具 bin/mongoexport --host 192.168.10.10:27017 --username test --password test --db test --collection user

原创 ElasticSearch學習筆記-JavaAPI操作記錄

客戶端連接代碼: ElasticSearch版本:2.3.x private void initClient() { Settings settings = Settings.builder().put("cluster.name