原创 pycurl做https鏈接,免於校驗的設置

[quote]curl_handle.setopt(pycurl.SSL_VERIFYHOST,0)curl_handle.setopt(pycurl

原创 Java中漢字範圍

java內部使用unicode編碼,漢字的Unicode編碼範圍爲\u4E00-\u9FA5 \uF900-\uFA2D,如果不在這個範圍內就不是漢字

原创 利用PIL做簡單的圖片數字識別

#coding:gbk'''Created on 2009-7-7@author: yuhai'''import StringIOimport Image,osimport editdistdic={}def readimg(imgpat

原创 撥號網路重播策略的選擇

1.如果能獲得相應的IP地址,就不要重播2.如果不能獲得IP,只能重播3.永遠不要主動close撥號連接

原创 使用PIL和StringIO做圖片resize

StringIO就是把內存裏的數據封裝成文件句柄import os, sysimport Imageimport StringIOsize = 128

原创 python 網頁抓取(使用代理服務器),解析一例

#coding:utf-8'''Created on 2009-7-15@author: Administrator'''import urllib2import newhttplibimport lxml.html as x def

原创 python抓取

準備工作可以使用Python2.5,推薦使用2.4,因爲需要兼顧wkfs的接口。安裝easy_install,pycurl,lxml;建議使用fire

原创 python 網頁抓取經驗

一定要設置好user-agnet 和accept#coding:utf-8'''Created on 2009-7-15@author: Admini

原创 Tkinter圖形界面設計

#coding=gbkfrom Tkinter import *import pycurlimport sys, re, md5, os, time, commandsimport pycurlimport cStringIO as _S

原创 設計python版的爬蟲

準備工作安裝Python2.5安裝easy_install,pycurl,lxml;建議使用firefox瀏覽器,可以方便的使用各種調試插件。基本知識

原创 python中的正則表達式應用

f=open('wuqu.html','r') content=f.read() m=re.findall('<tr>[\w|\W]*?</tr>', content) print len(m) if m is No

原创 eclipse profile tool

http://www.eclipse.org/tptp/home/downloads/4.5.0/documents/quicktour/quick_

原创 MapRunnable設計一例

package org.apache.nutch.fetcher;import java.io.IOException;import java.util.HashSet;import java.util.Iterator;import o

原创 jsp 使用jdbc一例

<%@ page contentType="text/xml;charset=gbk"%><%@ page import="java.io.*" %><%@ page import="java.util.*" %><%@ page imp

原创 python url編碼

urllib2.quote(u'北京'.encode('utf-8'))