python裏的get_page函數

原創

2019-07-10 10:00

import urllib2
def get_page(url):
    return urllib2.urlopen(url).read()
 
def get_next_target(page):
    start_link = page.find('<a href=')
    if start_link == -1:
        return None, 0
    start_quote = page.find('"', start_link)
    end_quote = page.find('"', start_quote + 1)
    url = page[start_quote + 1:end_quote]
    return url, end_quote
 
def print_all_links(page):
    while True:
        url, endpos = get_next_target(page)
        if url:
            print url
            page = page[endpos:]
        else:
            break

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

七、Python 函數

Python 函數 1、函數的瞭解 1)函數是組織好的，可重複使用的，用來實現單一，或相關聯功能的代碼段 2)函數能提高應用的模塊性，和代碼的重複利用 3)Python提供了許多內建函數，比如print()

2020-07-05 21:38:35

pycharm問題：module ‘pip’ has no attribute ‘main’

更新pip之後，Pycharm安裝package出現報錯：module ‘pip’ has no attribute ‘main’ 找到安裝目錄下 helpers/packaging_tool.py文件，找到如下代碼： def d

不迷信_只迷人

2020-07-03 00:48:59

Python 列表刪除相同的元素

今天遇到個問題，需要刪除一個列表刪除多個相同的值，比如 list = [1, 2, 3, a, 4, 5, a, 7, a] 想到的第一個辦法就是去重後使用list的remove方法：但是使用這個方法後發現list的順序變化了 lis

2020-07-01 15:45:49

Dict中取一個隨機值

今天碰見一個需求，從一個dict裏面取一個隨機值出來：本來開始想使用item的方法，但是取不出來後來使用了下面的思路先得到一個list，包含這個dict的所有keys 然後通過random隨機取一個keys 再通過keys去get

2020-07-01 15:45:49

Requests中POST 請求參數中data和json的區別

最近在使用Python中Request庫的時候，很多小朋友問post請求中data和json的區別：假如我們請求的body是json方式，請求的數據爲payload payload = {'key1': 'value1', 'key2

2020-07-01 15:45:49

Python - 不固定參數函數的定義，四種參數傳遞方法總結

1.不固定參數函數的定義： def foo(*args): print args foo(1,2) 返回：(1,2) 2.def fo

2020-06-27 21:42:17

Python - map, reduce 練習

map(func,seq), 將序列seq中的元素取出來，依次放到Func函數，將結果以列表形式返回，支持多參數e.g a = [1,2,3,4] def add(x): return x+3 listmap = map(ad

2020-06-27 21:42:17

pip下載使用國內鏡像，解決下載慢超時問題

pip 是 Python 管理第三方庫的工具，非常常用。pip 會從 pypi 倉庫中下載第三方庫文件。由於 pypi 處於國外，所以下載經常報超時。每次看到一片紅色，真是隨時懷疑自己的人品。 ReadTimeoutError:

2020-06-26 11:15:42

Python 中的匿名函數

匿名也就是沒有名字，函數爲什麼要匿名呢？有沒有感覺每次爲函數取名都是件很悲劇的事情，想取個像樣點的函數名很摳腦殼。如果某個函數我們只需要使用一次的時候，還需要取名是不是就更悲劇了？ Python 與 JavaScript 支持

2020-06-26 11:15:42

Python出錯重試：retrying

在編寫Python代碼進行自動化測試、網絡爬蟲或者其他與網絡相關的動作的時候，由於網絡影響會容易失敗，而這種失敗並不是我們需要去處理的。那麼這種時候最好的辦法就是失敗後重試幾次，以避免網絡的間斷性影響。如果我們正常編寫代碼的話，

2020-06-26 11:15:28

python 調整圖片大小源代碼

在平時的使用過程中，經常會使用到有關於python調整圖片的需求，所以現將源代碼po出，將來有需要會直接找到 import Image import os path = os.getcwd() rate = 3.06 for file

2020-06-25 23:23:06

Python 打開文件讀取每行數據 + 標註點圖片驗證

import os import Image import ImageDraw path = os.getcwd() print path f = open("1.csv","r") lines = f.readlines() for l

2020-06-25 23:23:06

win10安裝tensflow

pip install pyinstaller -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

2020-06-25 08:26:24

python 學習筆記--使用模塊,類

#使用模塊 ##使用sys 1.代碼 #!/usr/bin/env python3 # -*- coding: utf-8 -*- ' a test module ' __author__ = 'Bernicechl' im

2020-06-25 08:26:24

anaconda&idea

轉載 import 已安裝的包失敗 https://www.cnblogs.com/ttzzyy/p/10391557.html https://blog.csdn.net/yimingsilence/article/details/7

2020-06-25 08:26:24

24小時熱門文章

最新文章

最新評論文章