原创 Windows 10 Office文件圖標異常處理(Word | Excel | Powerpoint圖標白色、右鍵新建找不到文件)

1.我們經常會遇到office重新安裝完成後,或者換了版本後,前期做好的excel、ppt、word文件可以正常打開,但圖標顯示爲白色或者異常(備註:如果不能正常打開,則是office程序沒有關聯到,只需要選中需打開文件,右鍵 更

原创 Django根據數據庫表反向生成models

1. 創建Django項目 # 創建工程 django-admin.py startproject movie # 創建app python manage.py startapp App # 在settings.py裏面添加App

原创 django解決跨域請求的問題

django解決跨域請求的問題 1.安裝django-cors-headers pip3 install django-cors-headers 2.配置settings.py文件 INSTALLED_APPS = [ 'c

原创 ubuntu 18.04 Nginx源碼安裝

Nginx源碼安裝 一, 首先需安裝nginx依賴庫 1.安裝gcc g++的依賴庫 apt-get install build-essential apt-get install libtool 2.安裝pcre依賴庫 sudo

原创 使用Selenium添加訪問cookie, 實現淘寶自動登錄

淘寶在不登錄的情況下, 許多信息沒有顯示, 而在登錄滑塊驗證時, selenium模擬會被檢測出來, 所以我們利用手機掃碼登錄, 保存cookies並實現之後登錄訪問. 登錄並保存cookie import json from sel

原创 python 更換pip安裝源

pip源, 默認從國外源安裝, 安裝速度比較慢. 現在我們指定國內源安裝源: 阿里源、豆瓣源. Ubuntu源, (1)指令配置源 pip3 install xlrd -i https://pypi.tuna.tsinghu

原创 一個實現scrapy框架部分功能的爬蟲(實現了,下載限流器,隨機ip代理, 下載去重等功能)

這是一個具備可擴展功能的爬蟲!!! import os import requests from fake_useragent import UserAgent from retrying import retry import h

原创 [爬蟲]爬取貓眼電影票房信息(信息字體加密)

貓眼電影裏面的實時票房, 票房佔比等信息是字體加密的, 所以要爬取這些信息需要解決字體加密這個問題. 下面介紹一種解密字體的辦法. 在橙色方塊標註的地方我們可以看出字體是加密的, 我們就以這部分字體爲例進行解析. 首先我面要找到加密

原创 Numpy包函數的使用(史上最全)

1.NumPy   NumPy是高性能科學計算和數據分析的基礎包。部分功能如下: ndarray, 具有矢量算術運算和複雜廣播能力的快速且節省空間的多維數組。 用於對整組數據進行快速運算的標準數學函數(無需編寫循環)。 用於讀寫磁

原创 經典SQL語句大全

SQL語句參考,包含Access、MySQL 以及 SQL Server 基礎 創建數據庫 CREATE DATABASE database-name 刪除數據庫 drop database dbname 備份sql serv

原创 解析js代碼實現爬取頁面所有的ip地址[面試題]

該網頁只有在刷新時, 才能顯示後面的頁面, 且頁面會打開新的頁面, 跳轉時需要的cookies, 由第一個頁面的cookies動態生成. 下面是具體代碼: import requests import re import lxml.h

原创 Flask 操作數據庫

查詢相關語句: @stu.route('/selectstu/') def select_stu(): # 查詢年齡小於16歲的學生的信息 # 第一種查詢的方式 stus = Student.query.fi

原创 python運行出現 ModuleNotFoundError: No module named 'xxx'問題

運行代碼時出現如下錯誤: thread_資源競爭.py E test setup failed file D:\python\Spider\spider複習\Python多線程\thread_資源競爭.py, line 10 de

原创 用mongodb數據庫, 對爬取的頁面進行監控(mongo_cache)和數據保存

由於在爬蟲時, 可因爲各種原因導致爬蟲在爬取頁面的時候從中間斷開連接, 當再次爬取的時候不知道從什麼地方開始, 這裏利用mongodb封裝一個類, 用來監控哪些網頁已經爬取過, 哪些沒有爬取, 爲以後監控提供方便. 創建一個mongo

原创 selenium模擬 + 鼠標滾動爬取魔方公寓租房評論信息

因爲魔方公寓的評論信息是在一個單獨的div中, 需要模擬鼠標滾動才能拿到評論信息, 並且每次只能拿到在頁面顯示的內容, 頁面沒有顯示的取出來的是空. 因此只能在每次滾動後取值保存. 代碼: import time import win