原创 pycurl做https鏈接,免於校驗的設置
[quote]curl_handle.setopt(pycurl.SSL_VERIFYHOST,0)curl_handle.setopt(pycurl
原创 Java中漢字範圍
java內部使用unicode編碼,漢字的Unicode編碼範圍爲\u4E00-\u9FA5 \uF900-\uFA2D,如果不在這個範圍內就不是漢字
原创 利用PIL做簡單的圖片數字識別
#coding:gbk'''Created on 2009-7-7@author: yuhai'''import StringIOimport Image,osimport editdistdic={}def readimg(imgpat
原创 撥號網路重播策略的選擇
1.如果能獲得相應的IP地址,就不要重播2.如果不能獲得IP,只能重播3.永遠不要主動close撥號連接
原创 使用PIL和StringIO做圖片resize
StringIO就是把內存裏的數據封裝成文件句柄import os, sysimport Imageimport StringIOsize = 128
原创 python 網頁抓取(使用代理服務器),解析一例
#coding:utf-8'''Created on 2009-7-15@author: Administrator'''import urllib2import newhttplibimport lxml.html as x def
原创 python抓取
準備工作可以使用Python2.5,推薦使用2.4,因爲需要兼顧wkfs的接口。安裝easy_install,pycurl,lxml;建議使用fire
原创 python 網頁抓取經驗
一定要設置好user-agnet 和accept#coding:utf-8'''Created on 2009-7-15@author: Admini
原创 Tkinter圖形界面設計
#coding=gbkfrom Tkinter import *import pycurlimport sys, re, md5, os, time, commandsimport pycurlimport cStringIO as _S
原创 設計python版的爬蟲
準備工作安裝Python2.5安裝easy_install,pycurl,lxml;建議使用firefox瀏覽器,可以方便的使用各種調試插件。基本知識
原创 python中的正則表達式應用
f=open('wuqu.html','r') content=f.read() m=re.findall('<tr>[\w|\W]*?</tr>', content) print len(m) if m is No
原创 eclipse profile tool
http://www.eclipse.org/tptp/home/downloads/4.5.0/documents/quicktour/quick_
原创 MapRunnable設計一例
package org.apache.nutch.fetcher;import java.io.IOException;import java.util.HashSet;import java.util.Iterator;import o
原创 jsp 使用jdbc一例
<%@ page contentType="text/xml;charset=gbk"%><%@ page import="java.io.*" %><%@ page import="java.util.*" %><%@ page imp
原创 python url編碼
urllib2.quote(u'北京'.encode('utf-8'))