python学习——爬虫request异常代码

原創

尹天仇沙雕

2020-06-16 08:32

一、网上摘录的https://blog.csdn.net/xunkhun/article/details/79349621

def getHTMLText(url):
    try:
        r = requests.get(url)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "产生异常"

r.raise_for_status()会跑出异常，没有异常则是None。抓取一切异常

二、自己用的，也是抄袭这位博文（https://blog.csdn.net/polyhedronx/article/details/81589196）

def get_text_from_url(url):
    # 从链接中获取网页文本
    try:
        response = requests.get(url, headers=headers, timeout=30)
        if response.status_code == 200:
            return response.text
        else:
            print('get page failed.', response.status_code)
            return None
    except (ConnectionError, TimeoutError) as e:
        print('crawling failed', url, e)
        return None

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Python：几种websocket的链接方式

轉載：https://blog.csdn.net/Darkman_EX/article/details/82592118 第一種, 使用create_connection鏈接，需要pip install websocket-client

2020-07-07 07:37:15

Python 基础内容

Python 基礎文章目錄Python 基礎整數浮點數字符串布爾值空值變量常量/除法字符編碼整數可以處理任意大小的數，包括負整數十六進制數用0x前綴表示浮點數科學計數法表示時10可以用e來表示如： 1.23e9 12

Drops__of__Jupiter

2020-07-06 06:45:55

Python 基础内容2

Python 基礎內容2 文章目錄Python 基礎內容2list 和 tuplelist列表[]tuple元組()條件判斷dictset不可變對象 list 和 tuple list列表[] list是長度可變的有序集合，可隨時

Drops__of__Jupiter

2020-07-06 06:45:55

【Pyhton】Error expected an indented block

這種錯誤意思是指：應爲縮進塊 1、for循環、while循環、if、elif、else後面的冒號後一定要加上內容，python對此要求很嚴格 for i in range(n): 千萬不能這樣寫 2、縮進塊不對也會出現錯誤 for

2020-07-05 15:03:19

【Python】合并有序数组两种方法

數組是程序設計語言的通用稱呼，在python裏，列表就是我們常說的數組（以下列表 = 數組）目錄 1、用指針合併兩個有序數組（兩個都是有序的） 2、用sort函數合併兩個有序數組 1、用指針合併兩個有序數組（兩個都是有序的）先看下面兩

2020-07-05 15:03:19

python中用字符串来调用函数

參考： http://blog.sina.com.cn/s/blog_76e94d210100w1bl.html https://taizilongxu.gitbooks.io/stackoverflow-about-python/c

2020-07-02 22:03:24

30行Python代码爬取英雄联盟全英雄全皮肤

30行Python代碼爬取英雄聯盟全英雄全皮膚碎碎念英雄聯盟遊戲裏擁有數百個個性英雄，然後每個英雄都有多個皮膚。作爲一個收集控就非常想收齊全部皮膚----的圖片。家境貧寒一言難盡看官點個讚唄！前期分析英雄皮膚的圖鑑信息可以

2020-07-02 17:10:54

numpy.savetxt() 报错 Mismatch between array dtype (‘object‘) and format specifier (‘%.18e‘)的解决方法

將數組存儲爲文件： import numpy as np a = np.array([[1,2,3],[1,2]]) np.savetxt('xxx.txt',a) 報錯： TypeError: Mismatch betwe

2020-07-02 12:44:05

数据结构与算法_渡劫5_链表

文章目錄一、概念二、線性表1. 定義2. 線性表的抽象數據類型3. 線性表的順序存儲結構的騷操作4. 順序表的鏈式存儲結構三、單鏈表的相關操作1. 單鏈表的元素查找2. 單鏈表的元素插入3. 單鏈表的元素刪除4. 單鏈表的整表刪除

2020-07-02 04:04:53

在Anaconda上安装Tensorflow，并在jupyter上使用——两种方式

此鏈接是安裝Tensorflow的詳細步驟，https://blog.csdn.net/weixin_42182599/article/details/104794856 但是在jupyter中怎麼使用Tensorflow呢，如果

小曾同学.com

2020-07-02 03:24:39

方法推荐——解决Python安装库问题

今天給大家安利一個下載Python庫特別好用的一個網站，這個網站是我同學小閔推薦給我的，相當的好用。網址：http://pypi.douban.com/simple/（豆瓣的一個鏡像）問題描述：當我們在安裝Python所需要的

小曾同学.com

2020-07-02 03:24:38

tensorflow2.0版本的安装，并指定python=3.7

之前只是嘗試用3.5，3.6的python版本，這次來嘗試使用python3.7版本可以參考python=3.6 安裝,鏈接如下：https://blog.csdn.net/weixin_42182599/article/det

小曾同学.com

2020-07-02 03:24:37

Python学习笔记（五）——全局变量、变量、global、nonlocal

在Python中定義變量時，不需要指定變量的數據類型，系統會根據等號右邊的值，自動判斷出數據類型。變量包括：全局變量局部變量 1. 全局變量全局變量是在函數外部定義的變量，所有函數內部都可以使用這個變量。當程序執行

小曾同学.com

2020-07-02 03:24:37

Python学习笔记（三）——数据类型

Python的數據類型可以分爲：數字類型 bool----布爾(真假)（True 1，False 0） int-----整數 float—浮點數(小數) 非數字類型字符串—str 列表-----list 元組----

小曾同学.com

2020-07-02 03:24:37

Python学习笔记（四）——自定义函数、多值参数、缺省参数、函数递归、元组和字典的拆包

1 函數函數是組織好的，可重複使用的，用來實現單一，或相關聯功能的代碼段。函數能提高應用的模塊性，和代碼的重複利用率。定義一個函數的格式： def 函數名(): 函數體 ()中用於存放傳入的參數

小曾同学.com

2020-07-02 03:24:37

24小時熱門文章

最新文章

最新評論文章