原创 hive計算網頁停留時長
hive表結構如下: create table pv_user_info( session_id string, user_id string, url string, starttime bigint ); 主要就是這幾個字段有
原创 shell日期循環
1. vi test.sh 2. #!/bin/sh startdate=`date -d "$1" +%Y-%m-%d` enddate=`date -d "$2" +%Y-%m-%d` while [[ $startdate <
原创 MongoDB count distinct group by JavaAPI查詢
import java.net.UnknownHostException; import com.mongodb.BasicDBList; import com.mongodb.BasicDBObject; import com.mong
原创 抓取騰訊新聞評論
package com.orange.qqnews; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStream; imp
原创 Hive表數據導入到Hbase
修改hive的配置文件hive-site.xml,增加: <property> <name>hive.aux.jars.path</name> <value>file:///home/hadoop/hive-0.9.
原创 spring配置文件詳解--真的蠻詳細
轉自: http://book.51cto.com/art/201004/193743.htm 此處詳細的爲我們講解了spring2.5的實現原理,感覺非常有用 spring配置文件是用於指導Sp
原创 獲取免費天氣(Java抓取百度天氣)
因爲要用到天氣信息,在網上找了免費的api,不是有調用限制就是返回的結果不滿意,看了百度的比較合適,決定用爬蟲抓下來在百度上搜索"北京天氣",將瀏覽器的地址複製,作爲請求地址添加jar包 <!-- jsoup --> <depen
原创 spring集成quartz
最近用spring集成了quartz做定時任務感覺還不錯,比Linux中的crontab靠譜多了,所以記錄下來,留個筆記 集羣:http://blog.csdn.net/itjavaer/article/details/77948574