原创 數據分析學習
簡單概念 維度:一組數據的組織形式 一維數據:由對等關係的有序或無序方式構成,採用線性方式組織(列表和集合). 列表和數組的比較 相同點:都是一組數據的有序結構 不同點:數據類型(列表數據類型可不相同,數組必須相同) 二維數據:由多個
原创 python網絡數據採集
1,採集時,及時的處理採集過程中的異常.
原创 項目pycharm能運行,在終端卻無法運行
項目pycharm能運行,在終端卻無法運行報 ModuleNotFoundError: No module named '****' 錯誤。運行的文件夾又不在根目錄下, 在python 代碼中加入```sys.path.append(os
原创 win10 斷線 自動撥號 bat 腳本
@echo off :start ping -n 2 114.114.114.114 | find "TTL=" >nul if errorlevel 1 ( echo 離線 rasdial 寬帶連接 0551***0672 6***
原创 模擬鼠標操作
Python selenium —— 模擬鼠標鍵盤操作(ActionChains) Sep 8, 2016 原文鏈接 https://huilansame.github.io/huilansame.github.io/archive
原创 squid 單進程 高併發解決方案
問題描述:squid單進程導致,當多個同時處理多個請求,導致響應超時。據網友測試單個squid的最大併發數量在6k左右. 解決方案:在同一個服務上運行多個squid的實例。 https://wiki.squid-cache.org/Mul
原创 phantomjs selenium python 提示錯誤
Unable to load Atom 'find_elements' from file ':/ghostdriver/./third_party/webdriver-atoms/find_elements.js 需到官網安裝完整版
原创 mongodb 添加用戶名密碼驗證
mongo localhost -u username -p pwd --authenticationDatabase admin --authenticationMechanism SCRAM-SHA-1 db.create
原创 python virtualenv虛擬環境使用
python 項目常常依賴衆多好用的第三方庫(這也是我使用python編程的重要原因),但是多項目間依賴版本的管理又是讓人崩潰的一件事。所以獨立的運行環境,應運而生 virtualenv 安裝 pip install virtu
原创 公網ip路由設置端口轉發
端口轉發地址的默認網關與轉發目的地址需在同一網段 例如轉發到192.168.0.37:4646 默認網關必須和192.168.0.37在同一網段
原创 爬取58同城的二手房信息
給定任意一個58同城的詳情二手房信息.會遞歸爬取房源下的推薦信息,直到被封(使用代理ip即可避免) github地址:https://github.com/zhucaidong/house_anqing 抓取結果:
原创 linux vim 文本編輯器
簡介:超級文本編輯器 模式: 插入模式 命令行模式 底部命令模式 底部命令模式:在命令行模式 輸入特定字符 顯示行數 : set number
原创 python 包和模塊
包:.py文件所存放的目錄。 模塊:每個.py文件都是一個模塊。 每一個包目錄下面都會有一個__init__.py的文件,這個文件是必須存在的,否則,Python就把這個目錄當成普通目錄,而不是一個包。__init__.py可以是空文件
原创 抓取搜狗微信百度新聞網易新聞
github地址: https://github.com/zhucaidong/newsApi