原创 python網絡爬蟲與信息採取之解析網頁(三)---- BeautifulSoup庫的導航樹實例

上篇我們講到了通過標籤的名稱和屬性來查找標籤的findAll(),本篇將講解如何通過標籤在文檔中的位置進行查找------導航樹 一篇文章,可以將其標籤分爲子標籤,父標籤和兄弟標籤。而導航樹的功能就是先在文檔中找到一個位置,根據網頁源代碼

原创 python資源下載與各種庫的安裝

俗話說的好,“磨刀不誤砍柴工”。要想學好網絡爬蟲,一個良好的環境配置是離不開的。下面,我將介紹一下python的安裝以及後面將用到的各種庫的安裝 一.python的下載與安裝 python分爲2.x版本和3.x版本,基本上差不多,只是有一

原创 python 網絡爬蟲與信息採取之異常處理

本篇文章轉自Ryan Mitchell 寫的python:網絡數據採集 網絡是十分複雜的。網頁數據格式不友好,網站服務器宕機,目標數據的標籤找不到,都是很麻煩的事情。網絡數據採集最痛苦的遭遇之一,就是爬蟲運行的時候你洗洗睡了,夢

原创 實驗吧CTF題目之疑惑的漢字(1876)

題目鏈接:http://www.shiyanbar.com/ctf/1876 對於這種題,唯一的方法就是積累;見得多了也就不覺得奇怪了; 題目給出了密文,分析密文發現這些漢字沒有什麼特殊的含義;那就從他的結構來分析;你會發現他們特別符合當

原创 git clone時認證失敗後不能重新輸入的解決方案

0x00 問題描述 今天用git克隆碼雲上的一個項目時,手滑輸錯了密碼,導致認證失敗。再次嘗試沒有了輸入賬戶密碼的選項,直接使用上次保存的數據,導致一直驗證失敗,如圖所示。 0x01 問題分析 產生該問題的原因是系統設置的賬號密

原创 網絡安全概述

0x01 背景概述 網絡安全是近幾年國家重點提出的一個策略和未來發展方向。因此從今天起,我將學習沈鑫剡老師編寫的《網絡安全》一書,結合William Stallings寫的《計算機安全》,進行總結記錄,並分享到該博客上。 0x