原创 hadoop系列: hive篇II

hive與關係型數據庫 hive函數 hive優化: 表設計, mr作業 part1: hive對比關係型數據庫 hive: 基於Hadoop的一個數據倉庫工具,將結構化的數據文件映射成一張表,並提供類sql語句的查詢功能, 使用

原创 版本控制工具: git (代碼上傳,下載)

如何使用git 命令行 idea中使用git圖形化插件 part1:  git 歷史簡介 什麼是git  ?                    由linux社區開發的,  一種分佈式的,  版本控制系統 什麼是版本控制系統 ?   

原创 ubuntu: 由unity轉gnome3安裝出錯及解決

最近感覺ubuntu unity桌面體驗不夠好, 開機啓動慢, 運行時還聽流暢, 一休眠後喚醒又需要好一陣時間, 加之, 在linux公社中看到了gnome3的推薦文章, 說linux之父tovals也使用了gnome3, 於是開始更

原创 hadoop系列:map-reduce實現(map端join, reduce端join)

map-reduce實現hive的join全外連接查詢 (大表 +小表 ) 假設有訂單表orders, 用戶表customers,   存在大表+小表的關係, 則可以使用sql的優化: 使用map端join 現在的問題是, 如何使用ma

原创 hadoop系列: map-reduce(job提交過程,遠程調試)

mapreduce 的job遠程調試 mapreduce的job提交、運行過程 part1:  mapreduce 的遠程調試 繼續上一篇博客的 map-reduce實現map端join, 部署到集羣后如何調試? 第一步:server端配

原创 java增強: ssm框架整合

整合思路: 各組件的關聯 配置整合 ssm使用: jsp + jstl + servlet = mysql 的crud ( 用戶信息分頁管理 ) part1: 整合ssm 第一步: 使用idea 新建module: java web

原创 java增強: spring框架

基本概念:起源,優點 基本使用 整合mybatis框架 Spring:  是一個開源的輕量級容器框架(包含並管理應用對象的配置和生命週期,javabean的創建方式可配置爲prototype 或singleton ) 提倡的編程思想是:控

原创 java增強:反射機制,內省機制

反射機制概念 發射的使用場景 內省機制的使用 part1 :反射機制(  jdk提供的一套api,  用於動態創建對象 ) part2:  反射的使用----兩個對象間屬性值的複製 (淺copy:  複製一個對象,會調用構造函數) 一

原创 Java增強:靜態代理與動態代理

什麼是代理模式 ? 有幾種代理模式,代碼實現 代理模式 和  裝飾模式的區別 part1: 代理模式的概念   代理模式: 不改變源碼的情況下,實現對目標對象的功能擴展,對代理的對象施加控制,並不提供對象本身的增強功能(裝飾模式爲所裝飾

原创 java增強: jvm內存模型

jvm存儲模型:堆,棧,方法區.... jvm各區域內存:調配控制 jvm內存的動態分配,回收, (對象的創建,垃圾回收gc) jvm性能監測工具: jconsole, jvisualvm, jmap   (gc監測工具:j

原创 java增強: mybatis框架

mybatis簡介 如何使用: 入門級 進階教程 MyBatis ,持久層框架, 以XML 或註解的方式, 將接口和 Java 的 POJO(Plain Old Java Objects,普通的 Java對象)映射成數據庫中的記錄。 p

原创 hadoop系列: 日誌收集工具flume

多路複用: 一個  source                     ----->多個 (channel----sink)  故障切換:  一個(source ---channel) ---->一個sink組(多個sink ) 常用s

原创 java多線程面試題: 模擬消費問題

問題1:  蜜蜂與熊---  (生產,容器, 消費 ) 問題2:  和尚與饅頭--(消費, 管理者) 蜜蜂與熊: 蜜蜂100只,每隻生產力度1,往罐子加蜜,滿50停止生產; 熊有2個,等罐子滿20就吃光所有蜜,請模擬出現的場景? (   

原创 java數據結構: 統計5億數字去重後的個數(byte數組標記數字)

面試題: 內存爲300M, 設計一個算法, 計算5億 int類型數去重後, 還有多少個數? /** * //傳入5億個: int 型數據: 計算去重後的 , 數字個數 ===》 * 限制要求 : 內存僅 300M * *

原创 hadoop系列: 分佈式日誌分析工具kafka

要點: 什麼是kafka, 使用場景有哪些 kafka優缺點 如何使用kafka( shell接口,  java api ) point1:   簡介 1, Kafka是一個分佈式發佈-訂閱消息系統 最初由LinkedIn公司開發,之後成