原创 Rhadoop中修改Reduce輸出分割符

mjiang@jiangmingyan:~/hadoop_work/hadoop-1.0.3/src/mapred/org/apache/hadoop/mapred$ ls -i *Format* 7996170 FileInputFor

原创 hive細節測試

select weekofyear('2013-02-02'), weekofyear('2013-02-03'),weekofyear('2013-02-04') from udfdate; 5 5 6 週六 週日 週一

原创 ccms bug記錄1

20130202 週期表結果中有重複記錄:查到是t_latitude_period_exuid的重複記錄: 重新跑: insert overwrite  table t_latitude_period_exuid partition(s

原创 hive 細節

如果reduce個數過少(配置文件設置,而非自動生成),可能會出現錯誤:013-01-16 18:04:49,311 FATAL org.apache.hadoop.mapred.Child: Error running child :

原创 ubuntu使用總結

桌面快捷鍵總結

原创 R使用問題

package 'plyr' could not be loaded  好像時默認安裝的lib權限不夠導致,改變lib的路徑權限即可

原创 ccms未解決錯誤

Starting Job = job_201301281440_18226, Tracking URL = http://master:50030/

原创 machine learning in action

k-Nearest NeighborsPros: High accuracy, insensitive to outliers, no assumptions about dataCons: Computationally expensi

原创 ccms 工作記錄

一共有job數爲:86 週期可以重複計算 bug1:  where month(send_time)=month('{STAT_DATE}')-1  當month爲1時,會得出結果爲0. 所以要改爲:  where month(send

原创 Rstudio畫圖問題

Error in RStudioGD() : Shadow graphics device error: r error 4 (R code execution error) 原來時安裝的時候: ./configure  

原创 linux系統分區調整失敗後補救

當時安裝ubuntu系統時,給/home的分區太大了,想縮小/home分區, dd cp -a 只要不格式化 分區一致就OK cp -a /home/mjiang後,修改chown就OK 一波剛平,一波又起。 新掛載的sdc又出

原创 ubuntu安裝軟件列表與系統配置

開發軟件: hadoop hive sqoop thrift eclipse  rstudio 日常軟件: scrot 系統配置: 終端提示顏色:force_color_prompt=yes 只有在每個用戶下生效,沒有統一生效的方法 e

原创 峯度(Kurtosis)和偏度(Skewness)

3.1.6  峯度(Kurtosis)和偏度(Skewness) 峯度是描述總體中所有取值分佈形態陡緩程度的統計量。這個統計量需要與正態分佈相比較,峯度爲0表示該總體數據分佈與正態分佈的陡緩程度相同;峯度大於0表示該總體數據分佈與正態

原创 linux應用便捷學習

alias yed='java -jar /usr/local/yed-3.9.2/yed.jar' 不同用戶名下cp用scp

原创 R安裝問題

configure: error: No F77 compiler found apt-get install gfortran C++ preprocessor "/lib/cpp" fails sanity check apt-ge