原创 xpath使用

瀏覽器的console中使用$x("xxxx"),其中xxx爲元素的xpath路徑。 點贊 收藏 分享 文章舉報 shyaideguo 發佈了7 篇原創文章 · 獲贊 2 ·

原创 ElasticSearch 在string類型的字段上做排序出錯的解決方案

問題 有個簡單的需求:列出圖書信息,並按照圖書標題的字典順序排列。 原來認爲會很簡單:   Java代碼   builder.addSort(SortBuilders.fieldSort("title").order(Sor

原创 elasticsearch配置文件詳解

elasticsearch的config文件夾裏面有兩個配置文件:elasticsearch.yml和logging.yml,第一個是es的基本配置文件,第二個是日誌配置文件,es也是使用log4j來記錄日誌的,所以logging.ym

原创 解決JS跨域跳轉頁面問題解決方案

開發過程中有時會遇到腳本轉到其他網站的需求,首先的思路都會想到window.open方法,但卻忽略了瀏覽器阻止的問題。 下面是針對3種場景的解決方案 1.使用window.open    首先要搞清楚瀏覽器阻攔的前提是什麼?只有跨

原创 布隆過濾器 (Bloom Filter) 詳解

布隆過濾器 (Bloom Filter)是由Burton Howard Bloom於1970年提出,它是一種space efficient的概率型數據結構,用於判斷一個元素是否在集合中。在垃圾郵件過濾的黑白名單方法、爬蟲(Crawler

原创 10個Java編碼中微妙的最佳實踐

這是10個最佳實踐的列表,比你平時在Josh Bloch的《effective java》中看到的規則更加精妙。和Josh Bloch列出的非常容易學習的、和日常情況息息相關的實踐相比,這個列表中提到了一些關於設計API/SPI的實踐

原创 讓開發自動化: 用 Eclipse 插件提高代碼質量

開發軟件時,我的主要目標之一是:要麼防止將缺陷引入代碼庫,要麼限制缺陷的生存期;換言之,要儘早找到缺陷。很顯然,越是瞭解如何編寫更好的代碼以及如何有效測試軟件,就越能及早地捕捉到缺陷。我也很想要一張能發現潛在缺陷的安全之網。 在本系列

原创 Python寫爬蟲抓站的一些技巧

1.最基本的抓站 import urllib2 content = urllib2.urlopen('http://XXXX').read() -2.使用代理服務器 這在某些情況下比較有用,比如IP被封了,或者比如IP訪問的次數受

原创 Spring MVC靜態文件處理

如何你的DispatcherServlet攔截"*.do"這樣的有後綴的URL,就不存在訪問不到靜態資源的問題。 如果你的DispatcherServlet攔截"/",爲了實現REST風格,攔截了所有的請求,那麼同時對*.js,*.jp

原创 To Hadoop or Not to Hadoop?

Hadoop is often positioned as the one framework your business needs to solve nearly all your problems. Mention “Big Da

原创 反向代理谷歌

server {     listen          80;     server_name     localhost;     location / {         proxy_pass          http://www

原创 Yahoo WEB前端優化34條原則

Yahoo給出的包括Yslow規則(22條)的34條詳細說明 ,通過這此規則對自己頁面進行一次全面的分析優化,可以提高你網站的加載速度。1.Minimize HTTP Requests 減少HTTP請求圖片、CSS、script、flas

原创 網站如何防盜鏈的8種方法

如果你是網站的開發者或維護者,就不得不重視盜鏈的問題了。如果你剛剛開發完一個沒有防盜鏈的帶有文件下載功能的網站,掛上internet,然後上傳幾個時下非常熱門的軟件或電影並在網站內公佈下載地址,讓MSN上的所有好友都來體驗一下你的傑作。

原创 js擴展方法

js沒有delete方法,但是js有截取和拼接的方法,我們可以通過已有的方法實現js的刪除方法 Array.prototype.del = function(n) {      if (n < 0){               re

原创 深入分析 Java 中的中文編碼問題

幾種常見的編碼格式 爲什麼要編碼 不知道大家有沒有想過一個問題,那就是爲什麼要編碼?我們能不能不編碼?要回答這個問題必須要回到計算機是如何表示我們人類能夠理解的符號的,這些符號也就是我們人類使用的語言。由於人類的語言有太多,因而表示