原创 Moving Data from HDFS to Hive Using an External Table

原文鏈接:http://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.3.0/bk_dataintegration/content/moving_data_from_hdfs_to_hive_

原创 AVRO文件結構分析

AVRO文件結構分析 [email protected] 研究了AVRO的規範,比較形象的圖形表達了文件中內容佈局,僅做參考。詳細說明在圖形下方。  使用AVRO標準系列化生成二進制的文件,該文件總體上由文件頭(Header

原创 tomcat原理以及處理HTTP請求的過程

一、TOMCAT 1 - Tomcat Server的組成部分 1.1 - Server A Server element represents the entire Catalina servlet container. (S

原创 CronTrigger

CronTriggers往往比SimpleTrigger更有用,如果您需要基於日曆的概念,而非SimpleTrigger完全指定的時間間隔,復發的發射工作的時間表。 CronTrigger,你可以指定觸發的時間表如“每星期五中午”,或“

原创 讓你提升命令行效率的 Bash 快捷鍵 [完整版]

原文鏈接:https://linuxtoy.org/archives/bash-shortcuts.html 生活在 Bash shell中,熟記以下快捷鍵,將極大的提高你的命令行操作效率。 編輯命令 Ctrl + a :移到命令行

原创 Linux的五個查找命令

原文地址:http://www.ruanyifeng.com/blog/2009/10/5_ways_to_search_for_files_using_the_terminal.html 作者: 阮一峯 日期: 2009年10

原创 版本問題的坑

半夜手賤,調整了下集羣配置,發現yarn掛了,nodemanager一直起不來,查了下log是個null pointer,沒看出來撒,結果google到這玩意。 https://issues.apache.org/jira/browse

原创 Hive Tips

原文鏈接:http://blog.hesey.net/2012/04/hive-tips.html 在Hive中,某些小技巧可以讓我們的Job執行得更快,有時一點小小的改動就可以讓性能得到大幅提升,這一點其實跟SQL差不多。 首先

原创 Linux 的啓動流程

原鏈接:http://www.ruanyifeng.com/blog/2013/08/linux_boot_process.html 作者: 阮一峯 日期: 2013年8月17日 半年前,我寫了《計算機是如何啓動的?》,探

原创 CDH集羣調優:內存、Vcores和DRF

原文URL:http://blog.selfup.cn/1631.html#comment-403 吐槽 最近“閒”來無事,通過CM把vcores使用情況調出來看了一眼,發現不論集羣中有多少個任務在跑,已分配的VCores始終不會超

原创 一次奇怪的調優

最近這兩天發現CDH集羣的host頻繁swapping,極大影響了集羣的性能,導致日常的oozie任務中斷。 發現有個設置被改,被改回默認值60了,好奇怪。。。 Setting the vm.swappiness Linux Ker

原创 oozie下使用hive UDF的慘痛教訓

問題現象: oozie中跑的一個workflow,hql腳本的導出結果和預期不一致,出錯。 漫長的DUBUG之路: 1.首先想到的是通過在Hue中來跑同一個hql腳本,查找問題。通過在oozie的log中找到解析完的hql,跑了下,結果發

原创 How to access local directory with script executed in oozie?

原答案地址:http://stackoverflow.com/questions/20527098/how-to-access-local-directory-with-script-executed-in-oozie Q:

原创 Flume NG簡介及配置 1.5.2

原文鏈接:http://www.cnblogs.com/wjoyxt/p/4484957.html 常用的分佈式日誌收集系統: Apache Flume、 Facebook Scribe、 Apache Chukwa  1、Flum

原创 wireshark抓包圖解 TCP三次握手/四次揮手詳解

原地址:http://www.seanyxie.com/wireshark%E6%8A%93%E5%8C%85%E5%9B%BE%E8%A7%A3-tcp%E4%B8%89%E6%AC%A1%E6%8F%A1%E6%89%8B%E5%9