原创 hdfs-site.xml默認配置及意思

默認配置在src/hdfs/hdfs-default.xml 裏面包含了大部分配置 <?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xs

原创 排序技術_各種算法原理 圖解 代碼實現

排序技術有很多種,下面簡單介紹一下幾種。 一  插入排序 1.1  直接插入排序 基本思想:每次將一個待排序額記錄按其關鍵碼的大小插入到一個已經排好序的有序序列中,直到全部記錄排好序。 圖解: 代碼實現:

原创 echart 餅圖選擇事件

var ecConfig = require('echarts/config'); myChart.on(ecConfig.EVENT.PIE_SELECTED, function(param){ var selected = p

原创 XX面試反饋

Feedback:Pros: He knows basic concept of MapReduce framework.Cons: His coding is bad. There are many errors in his code

原创 hive中UDF、UDAF和UDTF使用

Hive進行UDF開發十分簡單,此處所說UDF爲Temporary的function,所以需要hive版本在0.4.0以上纔可以。 一、背景:Hive是基於Hadoop中的MapReduce,提供HQL查詢的數據倉庫。Hive是一個很開放

原创 XX電話面試

XXX的電話面試: 1、solr源碼知道多少 2、concurrentHashMap實現原理 3、java堆內存還分? 4、java垃圾回收機制,回

原创 echart初探

<html> <head> <meta charset="utf-8"> <title>ECharts</title> <!--Step:1 Import a module loader, such as esl.js or requir

原创 堆排序原理圖解

數據結構中的堆和操作系統中的堆、堆棧(棧)是沒有關係的,大家不要像我一樣有誤解。 數據結構中的堆分兩種:大(頂)堆和小(頂)堆,簡單來說就是               〇                              

原创 Hive中小表與大表關聯(join)的性能分析

經常看到一些Hive優化的建議中說當小表與大表做關聯時,把小表寫在前面,這樣可以使Hive的關聯速度更快,提到的原因都是說因爲小表可以先放到內存中,然後大表的每條記錄再去內存中檢測,最終完成關聯查詢。這樣的原因看似合理,但是仔細推敲,又站

原创 再看ThreadLocal

1.線程能共享數據 線程內部要用到線程外的一個變量 package com.lgc; import java.util.HashMap; import java.util.Map; import java.util.Random;

原创 Hadoop 多表 join:map side join 範例

xt value, Context context) 076                 throws IOException, InterruptedException { 077   078             kv

原创 MapReduce之Join操作(map-side Join)

 本文講述如何在map端完成join操作。之前我們提到了reduce-join,這種方法的靈活性不錯,也是理所當然地能夠想到的方法;但這種方法存在的一個最大的問題是性能。大量的中間數據需要從map節點通過網絡發送到reduce節點,因而

原创 Hive中實現group concat功能(不用udf)

Hive中實現group concat功能(不用udf)   Sql代碼   hive> desc t;   OK   id      string   str     string   Time taken: 0.249 seconds

原创 Jquery插件

(function($){ function MyzTree(){} class MyzTree{} MyzTree.defaults={} private defaults MyzTree.method={} private

原创 js裏面有中文亂碼

<%@ page language="java" import="java.util.*" pageEncoding="utf-8"%> <meta