原创 hive計算網頁停留時長

hive表結構如下:   create table pv_user_info( session_id string, user_id string, url string, starttime bigint ); 主要就是這幾個字段有

原创 shell日期循環

1. vi test.sh 2. #!/bin/sh startdate=`date -d "$1" +%Y-%m-%d` enddate=`date -d "$2" +%Y-%m-%d` while [[ $startdate <

原创 MongoDB count distinct group by JavaAPI查詢

import java.net.UnknownHostException; import com.mongodb.BasicDBList; import com.mongodb.BasicDBObject; import com.mong

原创 抓取騰訊新聞評論

package com.orange.qqnews; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStream; imp

原创 Hive表數據導入到Hbase

修改hive的配置文件hive-site.xml,增加:   <property> <name>hive.aux.jars.path</name> <value>file:///home/hadoop/hive-0.9.

原创 spring配置文件詳解--真的蠻詳細

轉自: http://book.51cto.com/art/201004/193743.htm 此處詳細的爲我們講解了spring2.5的實現原理,感覺非常有用              spring配置文件是用於指導Sp

原创 獲取免費天氣(Java抓取百度天氣)

因爲要用到天氣信息,在網上找了免費的api,不是有調用限制就是返回的結果不滿意,看了百度的比較合適,決定用爬蟲抓下來在百度上搜索"北京天氣",將瀏覽器的地址複製,作爲請求地址添加jar包 <!-- jsoup --> <depen

原创 spring集成quartz

最近用spring集成了quartz做定時任務感覺還不錯,比Linux中的crontab靠譜多了,所以記錄下來,留個筆記 集羣:http://blog.csdn.net/itjavaer/article/details/77948574