原创 DockerFlie中設置crontab定時任務,以及new crontab file is missing newline before EOF, can't install.錯誤的解決方法

DockerFlie中設置crontab定時任務 new crontab file is missing newline before EOF, can't install.錯誤的解決方法 問題描述:(系統ubuntu) 想要在docke

原创 簡單的h5表白代碼

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8" /> <title>無聊</title> <style type="text/css"

原创 詳談Python的高級特性、函數式編程、高階函數

1、什麼是Python的高級特性? 這個問題對於許多正在學習Python的小夥伴來說可能會很疑惑?很多人知道這個名詞,但不知道這玩意到底是什麼。其實,Python作爲一門高級語言它有許多的內置函數,運用這些函數可以很方便的完成一些功能,而

原创 xpath如何選擇不包含特定子節點的節點?

xpath如何選擇不包含特定子節點的節點? 今天在抓取一個新聞頁時,遇到了一個小麻煩,正文部分結構大致如下: <div class="content"> <p>hello word</p> <p>A <em>ffsdf<

原创 關於Flask框架中啓動Scrapy爬蟲框架時的幾種問題的解決

最近開發的爬蟲調度系統是由Flask框架提供接口,在Flask中啓動Scrapy項目,開發期間遇到了幾個問題,網上找找,自己也琢磨了好久,終於順利解決。問題如下: 一、Scrapy、crawl指令找不到 問題描述: 先看一下我的項目結構

原创 Python+Appium實現控制app

在這之前需要做好以下幾個步驟: 1.java開發環境JDK 2.android SDK(platform/platform tools/tools/build tools) 3.python下載安裝(pip) 4.appium下載安裝(服

原创 scrapy-redis 更改隊列和分佈式爬蟲

爲初學者方便對分佈式爬蟲的學習,總結了一下自己的理解和網上的知識點 初學者的幾個疑問點: 1.什麼是分佈式爬蟲? 請參考:https://blog.csdn.net/zhusongziye/article/details/80457487

原创 關於scrapy框架中遇到需要登錄時的解決辦法

最近在工作中頻繁遇到需要登錄後才能抓取的數據,但也不是沒有解決辦法,以往解決辦法如下: A.  現在瀏覽器裏登錄,然後把登錄後的cookie粘貼到代碼中去請求,這樣就相當與利用cookie"僞造"了一個分身,從而跳過登錄驗證。 這樣往往可

原创 xpath中根據指定文本內容定位標籤

#scrapy框架中 response.xpath('//div/span[contains(text(), "指定文本內容")]').extract() #其它 browser.find_element_by_xpath('//bu

原创 tesserocr.cpp(514): fatal error C1083: 無法打開包括文件: “leptonica/allhead——windows下tesserocr的安裝

windows下tesserocr的安裝 在使用pip安裝tesserocr時,會遇到如標題一樣的問題,原因是安裝了Anaconda,應使用Anaconda的包管理工具conda進行安裝。 解決方法: 在電腦上裝有Anaconda的情況下

原创 正則表達式之貪婪匹配與非貪婪匹配

在前面正則表達式匹配規則裏,提到了 .* . :匹配除 "\n" 之外的任何單個字符。要匹配包括 '\n' 在內的任何字符,請使用像 '[.\n]' 的模式 * :匹配0個或多個 使用 .* 的話就可以匹配任意長度的任意字符,但是有時候在

原创 Python爬蟲筆記————抓取 貓眼電影排行榜Top100

注:初學爬蟲,本節僅使用requests庫和使用正則作爲解析工具  最近學習爬蟲,找個比較簡單的網頁練習了一下,作爲初入爬蟲的小白,不足之處還請大家多多指教。 一、分析url 首先,打開目標站點https://maoyan.com/b

原创 關於猴子選大王(約瑟夫)問題

摘至本人有道雲筆記《關於猴子選大王(約瑟夫)問題》 有m個猴子圍成一圈,按順時針編號,分別爲1到m。現打算從中選出一個大王。經過協商,決定選大王的規則如下:從第一個開始順時針報數,報到n的猴子出圈,緊接着從下一個又從1順時針循環報數,..

原创 關於散列表(字典)

摘至本人有道雲筆記《關於散列表(字典)》   a={"張三":"1"} 散列表的速度很塊,當輸入key時可以很快地返回value,這只需要很短的時間,相當於一個映射,將輸入的key映射成value值。 可用於很快的查找出數據。比如,將數據

原创 關於二分查找

摘至本人有道雲筆記《關於二分查找》   首先假設有個有序序列b b = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18] 1,取高位和低位的下標作爲查找的範