原创 簡易小爬蟲項目

最近疏於學習,乾脆就把去年跟同學做的職潮人小程序中的爬取職位這部分的代碼拿出來,加以改進瞎搞一波吧。 代碼Github地址: https://github.com/zhouhuanghua/project 之前的可以爬取拉勾BOSS智聯還

原创 使用POI導入導出大數據量的Excel

昨天,產品提了一個緊急需求,讓把十一月份已發貨的商品數據導出來,寫好SQL發給DBA執行之後,得到了三十多個100W數據的Excel文件。有一個屬性是以JSON格式存在表中一個字段裏面的,需要加工Excel文件將其單獨取出來(如圖的第四列

原创 好玩的編譯時註解處理工具——APT

大家對Java中的註解(Annotation)應該都不陌生吧,JDK1.5就引進來了,它本質上只是一種元數據,和配置文件一樣。利用反射在運行時解析處理能夠實現各種靈活強大的功能,比如Spring就將其作用發揮得淋漓盡致。至於用法,這裏就不

原创 Java使用Jsoup和Selenium抓取西瓜小視頻

最近在家裏無聊每天刷頭條,看到一個很可愛的小姐姐,突然蹦出一個主意,就是想把它這些視頻全部搞下來存到本地。網上搜了一下,發現這些視頻其實是來自西瓜視頻,根據用戶名搜索就找到了。剛好會一點爬蟲,這下就好辦了。 跟Python的reques

原创 Java8新特性

Java 8 (又稱爲 jdk 1.8) 是 Java 語言開發的一個主要版本。 Oracle 公司於 2014 年 3 月 18 日發佈 Java 8 ,它支持函數式編程,新的 JavaScript 引擎,新的日期 API,新的Stre