原创 Hdfs
1介紹 設計思想是分而治之,將大文件、大批量文件,分佈式存放在大量服務器上,以便於採取分而治之的方式對海量數據進行運算分析。 在大數據系統中的應用是爲各類分佈式運算框架提供數據存儲服務。 2.特性 hdfs中的文件在物理上是分塊存儲(bl
原创 Redis--(一)
1.nosql介紹 not only sql。特點是以下: 不支持sql語法、存儲結構和傳統關係型數據庫中的關係表完全不同,nosql存儲的數據都是kv形式、每種nosql數據庫都有自己的api和語法以及擅長的業務場景。 種類有:mong
原创 Zookeeper(二)
1.一致性同步的時間延遲:是實時的。zookeeper中數據的更新和讀取是基於paxos一致性算法。 2.zookeeper的數據結構: 目錄樹,每個節點叫做znode,並且有唯一的一個路徑標識,每個節點可以攜帶一份二進制數據,不
原创 Hadoop(二)--aliyun下安裝hadoop集羣2.x
0.服務器節點規劃 hdp01 nn dn nm snn rm hdp02 dn nm hdp03 dn nm 1.修改主機名 vi /etc/sysconfig/network 在NETWORKING_IPV6=no PEERNTP
原创 網絡編程模型 nio
1.簡介 nio 是new io的簡稱,1.4之後提供。特性:爲所有的原始類型提供緩存支持(Buffer),字符集編碼解碼解決方案,channel一個原始的i/o抽象,支持鎖和內存映射文件的文件訪問接口,提供多路(non-blcoking
原创 redis--(二)
1.String數據類型(常作爲緩存使用) 一個key能存儲512MB數據,String類型是線程安全的,可以存儲任何數據,比如jpg圖片或者序列化對象 set key value / get key 設置值/獲取值 getrang
原创 Hadoop(一)
1.介紹 HADOOP是apache旗下的一套開源軟件平臺 HADOOP提供的功能:利用服務器集羣,根據用戶的自定義業務邏輯,對海量數據進行分佈式處理 HADOOP的核心組件有 : HDFS(分佈式文件系統) YARN(運算資源調
原创 消息隊列(一)
消息隊列常用於有生產者和消費者兩類角色的多線程同步場景,BlockingQueue是java.util.concurrent下的主要用來控制線程同步的工具。主要方法有:put、take一對阻塞存取;add、poll一對非阻塞存取。 插入: