原创 Java算法學習-----------------歸併排序算法

將數組中的相鄰元素兩兩配對,用歸併算法進行排序,構成n/2組長度爲2的排好序的子數組段,然後再將其排成長度爲4的子數組段,如此繼續下去直到整個數組排好序。 按照此思想,消除遞歸後的歸併排序算法(僞代碼)如下: public class M

原创 1、Http概述

1.1 Web客戶端和服務器  HTTP 客戶端和 HTTP 服務器共同構成了萬維網的基本組件,客戶端向服務器發送 HTTP 請求, 服務器會在 HTTP 響應中回送所請求的數據。  示意圖: 1.2 媒體類型 因

原创 Java算法學習-------插入排序算法(整數數組類型,可比較數組類型,可比較線性表類型)

(1)算法描述與分析 (2)算法具體實現 import java.util.*; public class Sort { public static void insertionSort(int[] a) { int i,

原创 [Python]網絡爬蟲(11):亮劍!爬蟲框架小抓抓Scrapy閃亮登場!

轉自:http://blog.csdn.net/pleasecallmewhy/article/details/19354723 前面十章爬蟲筆記陸陸續續記錄了一些簡單的Python爬蟲知識, 用來解決簡單的貼吧下載,績點運算自然不

原创 Java小知識點學習--------數組和位運算小知識點

位運算符:          >>>無符號右移運算符,無符號右移的規則和右移的規則相同,只是在填充時,不管原來是正數還是負數都用0來補充。   數組:          arr1=arr2;  此時兩個數組變量都會同時指向相同的數組,即

原创 Java序列化與反序列化

java中將對象編碼爲字節流稱之爲序列化,反之將字節流重建成對象稱之爲反序列化。  序列化主要用途:(1)把對象的字節序列永久地保存到文件中; (2)在網絡上傳送對象的字節序列; 當兩個進程在進行遠程通信時,彼此可以發送各種

原创 [Python]網絡爬蟲(二):利用urllib2通過指定的URL抓取網頁內容

版本號:Python2.7.5,Python3改動較大,各位另尋教程。 所謂網頁抓取,就是把URL地址中指定的網絡資源從網絡流中讀取出來,保存到本地。  類似於使用程序模擬IE瀏覽器的功能,把URL作爲HTTP請求的內容發送到服務器端

原创 [Python]網絡爬蟲(五):urllib2的使用細節與抓站技巧

轉自:http://blog.csdn.net/pleasecallmewhy/article/details/8925978 前面說到了urllib2的簡單入門,下面整理了一部分urllib2的使用細節。 1.Proxy 的設

原创 Java中的對象和引用

《Java編程思想》中有一段關於對象的說法:   “按照通俗的說法,每個對象都是某個類(class)的一個實例(instance),這裏,‘類’就是‘類型’的同義詞。”   簡單來說,對象就是類的實例。舉個栗子:“人類”包括了所有的

原创 [Python]網絡爬蟲(七):Python中的正則表達式教程

轉自:http://blog.csdn.net/pleasecallmewhy/article/details/8929576 接下來準備用糗百做一個爬蟲的小例子。 但是在這之前,先詳細的整理一下Python中的正則表達式的相關內容。

原创 01、靜態工廠方法替代構造器

考慮用靜態工廠方法替代構造器  考慮使用靜態工廠方法來替代構造器的原因: 靜態工廠方法有名稱:普通的構造器中,參數並不能很好地描述返回對象的特點,代碼的閱讀性不好。   考慮下面的程序: Random random = new Ra

原创 [Python]網絡爬蟲(三):異常的處理和HTTP狀態碼的分類

轉自:http://blog.csdn.net/pleasecallmewhy/article/details/8923725 先來說一說HTTP的異常處理問題。 當urlopen不能夠處理一個response時,產生urlError

原创 [Python]網絡爬蟲(一):抓取網頁的含義和URL基本構成

轉自:http://blog.csdn.net/pleasecallmewhy/article/details/8922826 一、網絡爬蟲的定義 網絡爬蟲,即Web Spider,是一個很形象的名字。 把互聯網比喻成一個蜘蛛網,

原创 [Python]網絡爬蟲(九):百度貼吧的網絡爬蟲(v0.4)源碼及解析

轉自:http://blog.csdn.net/pleasecallmewhy/article/details/8934726 更新:感謝評論中朋友的提醒,百度貼吧現在已經改成utf-8編碼了吧,需要把代碼中的decode('gbk'

原创 [Python]網絡爬蟲(十):一個爬蟲的誕生全過程(以山東大學績點運算爲例)

轉自:http://blog.csdn.net/pleasecallmewhy/article/details/9305229 先來說一下我們學校的網站: http://jwxt.sdu.edu.cn:7777/zhxt_bks/z