原创 hadoop(僞分佈)+hive採坑集合

今天工作量少,準備玩一下hive,,誰知。。。。一搭一個坑啊 閒話少說 進入正題~ 配置系統環境的問題就不說了 copy一下就行  系統爲centos7 64 export HADOOP_HOME=/apps/hadoop export

原创 M-R過程個人間接

最近看大數據的視頻,學的不多不足之處還請批評指正: hadoop map-reduce階段   map階段的感覺是把元數據整理成key-value型的k-v對,然後調用 Reducer<Text, IntWritable,Text,Int

原创 ES倒排索引理解

引文 https://blog.csdn.net/zsd_31/article/details/79979818 大白話說就是 搜索數據庫的時候 要select * from B 這時候我們知道表名去找數據 但是網絡中 我們想搜索的東西可

原创 Idea Debug about elasticsearch

最近在做ES的aggregation,順便說一下收穫。 一:版本問題 dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-

原创 初識elasticsearch 及JAVA API的過濾、管道聚合的使用

       簡而言之 elasticsearch是一種數據庫,用倒排索引的方式,代替了正向索引的方式,更加的利於搜索,在之前已經提及過倒敘索引就不在贅述了。        這裏簡單介紹一下最近學到的搜索,聚合的java API    

原创 Kafka 小細節

在定義cosumer的時候會定義組的概念  把consumer分成幾個組   在同一個消費者組裏,同一時間消息只能有一個消費者在kafka消費消息 consumer是與partition進行連接的,消費以partition爲單元  要消

原创 JVM 學習一:JAVA內存區域及內存溢出異常

老生常談 最近快要寫完畢業論文了 來學習一波JVM 開始正題: Java內存區域主要值得是運行時數據區---> 1、程序計數器、 2、java虛擬機棧、 3、本地方法棧 4、堆 5、方法區 6、運行時常量池。 下面我們會按照這個循序進行介

原创 MAC+nexus2.x+maven配置本地私服

經過了一天博客的閱讀,手動的在Mac上搭建了基於nexus的私服  哈哈哈  以後可以當別人的Maven倉庫啦~,接下來介紹一下搭建的過程。。。。。 1、官網下載nexus2.x  爲什麼不下載3.x呢,自我認爲2.x對configura

原创 二叉樹鏡像、構建、

生成鏡像的樹 private static BinaryTreeNode MirrorOfBinaryTree(BinaryTreeNode A) { // TODO Auto-generated method stub BinaryTr

原创 關於JWT token

結合https://blog.csdn.net/qq_37636695/article/details/79265711談一下如何在java中使用JWT 上述文章說明了在sso簡單來說,單點登錄SSO(Single SignOn)說得簡單

原创 面試準備之集合接口及底層及特點描述

基本上找到的上層就是Collection、Map、Dictionary啦~, 首先說一下Collection和Map的區別,Collection是鏈表數組類型的集合List、Set,只包含一種數據結構,而Map是鍵值對類型的集合,包含着A

原创 阿里巴巴菜鳥包裹java面試總結

jvm的基本原理,分爲幾塊 https://www.cnblogs.com/dingyingsi/p/3760447.html 事務有幾個等級 https://blog.csdn.net/liwenxia626/article/detai

原创 java算法之二叉樹排序

對於樹(ADT)形結構,元素的排序不是重點,如果需要排序,一般使用鏈表、棧、隊列等數據結構。算法中常用二叉樹,對於二叉樹排序這裏先不介紹,給個傳送門https://zhuanlan.zhihu.com/p/25623301。在這裏講一下二

原创 面試準備一之HashMap

看了很多面經都講了HashMap 今天自己也來講一講 在JDK1.8之前 HashMap還是很本分的堅持着數組+鏈表的結構,然並卵 好景不長,JDK1.8後如果鏈表中的數據超過8個,則會插入到紅黑樹種來存取(個人感覺,因爲讀取速度肯定是紅

原创 ES 用作文字過濾系統

這兩天來實習,遇到了ESUtil.java 於是想弄明白些---------廢話不多說 劃重點:1.面向文檔型數據庫,簡單來說就是爲了實現搜索、過濾、排序等功能對一堆文字、數據建立索引,但不會存儲他們。這是一種不需要面對數據的思考方式(沒