原创 數據分析學習

簡單概念 維度:一組數據的組織形式 一維數據:由對等關係的有序或無序方式構成,採用線性方式組織(列表和集合). 列表和數組的比較 相同點:都是一組數據的有序結構 不同點:數據類型(列表數據類型可不相同,數組必須相同)   二維數據:由多個

原创 python網絡數據採集

1,採集時,及時的處理採集過程中的異常.

原创 項目pycharm能運行,在終端卻無法運行

項目pycharm能運行,在終端卻無法運行報 ModuleNotFoundError: No module named '****' 錯誤。運行的文件夾又不在根目錄下, 在python 代碼中加入```sys.path.append(os

原创 win10 斷線 自動撥號 bat 腳本

@echo off :start ping -n 2 114.114.114.114 | find "TTL=" >nul if errorlevel 1 ( echo 離線 rasdial 寬帶連接 0551***0672 6***

原创 模擬鼠標操作

Python selenium —— 模擬鼠標鍵盤操作(ActionChains) Sep 8, 2016 原文鏈接 https://huilansame.github.io/huilansame.github.io/archive

原创 squid 單進程 高併發解決方案

問題描述:squid單進程導致,當多個同時處理多個請求,導致響應超時。據網友測試單個squid的最大併發數量在6k左右. 解決方案:在同一個服務上運行多個squid的實例。 https://wiki.squid-cache.org/Mul

原创 phantomjs selenium python 提示錯誤

Unable to load Atom 'find_elements' from file ':/ghostdriver/./third_party/webdriver-atoms/find_elements.js 需到官網安裝完整版

原创 mongodb 添加用戶名密碼驗證

mongo localhost -u username -p pwd --authenticationDatabase admin --authenticationMechanism SCRAM-SHA-1 db.create

原创 python virtualenv虛擬環境使用

python 項目常常依賴衆多好用的第三方庫(這也是我使用python編程的重要原因),但是多項目間依賴版本的管理又是讓人崩潰的一件事。所以獨立的運行環境,應運而生   virtualenv  安裝  pip install virtu

原创 公網ip路由設置端口轉發

端口轉發地址的默認網關與轉發目的地址需在同一網段  例如轉發到192.168.0.37:4646   默認網關必須和192.168.0.37在同一網段

原创 爬取58同城的二手房信息

給定任意一個58同城的詳情二手房信息.會遞歸爬取房源下的推薦信息,直到被封(使用代理ip即可避免) github地址:https://github.com/zhucaidong/house_anqing 抓取結果:

原创 linux vim 文本編輯器

簡介:超級文本編輯器 模式: 插入模式 命令行模式 底部命令模式 底部命令模式:在命令行模式  輸入特定字符  顯示行數  : set number 

原创 新博客地址 http://blog.vole.store

博客地址

原创 python 包和模塊

包:.py文件所存放的目錄。 模塊:每個.py文件都是一個模塊。 每一個包目錄下面都會有一個__init__.py的文件,這個文件是必須存在的,否則,Python就把這個目錄當成普通目錄,而不是一個包。__init__.py可以是空文件

原创 抓取搜狗微信百度新聞網易新聞

github地址:  https://github.com/zhucaidong/newsApi