原创 爲Heritrix定製自己的QueueAssignmentPolicy

Heritrix使用了Berkeley DB來構建鏈接隊列。這些隊列被置放於BdbMultipleWorkQueues中時,總是先給予一個Key,然後將那些Key值相同的鏈接放在一起, 成爲一個隊列,也就是一個Queue。在Heritri

原创 擴展和定製Heritrix之Extractor

轉至:http://www.07net01.com/zhishi/474980.html 10.3 擴展和定製Heritrix 在前面兩節中,向讀者介紹了Heritrix的啓動、創建任務、抓取網頁、組件結構。但是,讀者應該也可以明顯的看

原创 開源爬蟲: Heritrix 1.14.4 安裝/使用

http://blog.csdn.net/ljj657137723/article/details/45484793 Heritrix 是一個由 java 開發的、開源的網絡爬蟲,用戶可以使用它來從網上抓取想要的資源。其最出色之處在於它良

原创 在CentOS 7 64位系統上安裝wps

1、安裝依賴包 yum install libpng12 2、安裝字體 目前WPS for Linux公式顯示需要相應的Symbol字體(比如sy

原创 HashMap 和 HashTable 源碼學習和麪試總結

Java集合概述HashMap介紹HashMap源碼學習關於HashMap的幾個經典問題HashTable介紹和源碼學習HashMap 和 HashTable 比較先上圖 Set和List接口是Collection接口的子接口,分別代

原创 Dubbo框架入門介紹

  背景    隨着互聯網的發展,網站應用的規模不斷擴大,常規的垂直應用架構已無法應對,分佈式服務架構以及流動計算架構勢在必行,亟需一個治理系統確保架構有條不紊的演進。            單一應用架構   當網站流量很小時,只需一

原创 heritrix多線程 加速(定製Queue-assignment-policy兩個問題)

10.3.2 定製Queue-assignment-policy兩個問題 首先提出兩個問題: l 什麼是Queue-assignment-policy l 爲什麼要改變Queue-assignment-policy 在10.2節中,向讀者

原创 jenkins安裝部署全過程

基本配置: 1、Linux安裝配置jdk環境 1.1、上傳到 Linux 服務器;例如: 上傳至: cd /usr/local 1.2、解壓: rpm -ivh jdk-8u111-linux-x64.rpm 1.3、環境變量配置 cd

原创 HashTable和HashMap的區別詳解

一、HashMap簡介       HashMap是基於哈希表實現的,每一個元素是一個key-value對,其內部通過單鏈表解決衝突問題,容量不足(超過了閥值)時,同樣會自動增長。       HashMap是非線程安全的,只是用於單

原创 GitLab使用總結

代碼管理一直用svn,Git的分支管理認爲是最好的,嘗試用用。 一.GitLab簡介 GitLab 是一個用於倉庫管理系統的開源項目。使用Git作爲代碼管理工具,並在此基礎上搭建起來的web服務。 可通

原创 Java 位運算(移位、位與、或、異或、非)

Java提供的位運算符有:左移( << )、右移( >> ) 、無符號右移( >>> ) 、位與( & ) 、位或( | )、位非( ~ )、位異或( ^ ),除了位非( ~ )是一元操作符外,其它的都是二元操作符。 1、左移( << 

原创 Linux下常用文件解壓(包括RMP、DEB的解壓方法)

  1.以.a爲擴展名的文件: #tar xv file.a   2.以.z爲擴展名的文件: #uncompress file.Z   3.以.gz爲擴展名的文件: #gunzip file.gz   4.以.bz2爲擴展名

原创 java操作Excel

現在想要導出一組數據爲Excel文件,那麼可以這樣:(首先需要jxl.jar包,我的是jxl-2.6.jar) /**       * 導出報修單       * @param mapping       * @param

原创 spring+springMVC中使用@Transcational方式管理事務的必須要配的東西。

spring中管理事務的配置方式除了@Transcational還有使用aop等,本文介紹@Transcational方式,但是推薦使用aop方式。因爲如果有多個事務管理器的話,你在註解中還需要註明使用哪個事務管理器@Transactio

原创 如何將Java Web項目轉換爲Java項目?

如上篇文章“Eclipse web項目引用其它項目時的部署問題”中提到的,有時候我們希望其它項目引用此項目時,發佈後的是jar包,而不是war包,那麼應該怎麼轉換呢? 在項目名稱上單擊鼠標右鍵》Properties》Project Fa