原创 mongoDB數據庫簡易總結及思考

1、mongo授權 詳細授權請參見如下文本 授權完畢之後請修改mongodb.conf中auth = true,退出重新進入,則創建的用戶必須使用密碼纔可以登錄了 其中mongodb.conf可以配置日誌生成的路徑,是否外部主機可以訪問等

原创 python 閉包

閉包 定義:在一個外函數中定義了一個內函數,內函數裏運用了外函數的臨時變量,並且外函數的返回值是內函數的引用,這樣就構成了一個閉包 優勢: 內外函數共享變量,節省內存 外函數在調用結束時,會把被內函數調用的變量綁定到內函數上,不會直接釋放

原创 python 迭代器與生成器

一、迭代器 簡介: 迭代是Python最強大的功能之一,是訪問集合元素的一種方式。 迭代器是一個可以記住遍歷的位置的對象。 迭代器對象從集合的第一個元素開始訪問,直到所有的元素被訪問完結束。迭代器只能往前不會後退。 迭代器有兩個基本的方法

原创 tornado+elasticsearch web API

1、簡介  最近使用tornado實現了一個對接ES庫的API接口,tornado的優勢在此不做講解 下面分享一下核心代碼,方便後面使用 tornado講解推薦博客 2、code import time import tornado i

原创 requests proxy使用

最近在通過代理連接ES數據庫時,一直報錯 requests.packages.urllib3.exceptions.ProxySchemeUnknown: Not supported proxy scheme socks5 from e

原创 python實現發送郵件功能

簡介:需要調用smtplib庫,登錄QQ郵箱,進入 設置 頁面,選擇賬戶選項,將下圖設置成這樣,需要發送短信,將短信驗證成功的;如果想使用163作爲發送郵箱,設置方式同QQ郵箱           序列碼記錄下載,設置發送郵箱密碼的時候要

原创 Django配置uwsgi

1、安裝uwsgi      # pip install uwsgi 2、創建uwsgi.ini,當然此處只看後綴,文件名可以隨便起 ite_uwsgi.ini file [uwsgi] # Django-related settin

原创 Flask實現異步非阻塞

1、簡介         給大家先說明一下,什麼是異步非阻塞。         異步非阻塞:說白了就是server端開啓進程,client端同時向server發起多個請求,server端在處理請求的時候,不用等一個請求處理完了,再處理另外

原创 ES單條數據錄入操作

錄入數據時先在庫裏進行查詢,如果數據存在的話,進行更新數據;如果庫裏面此條數據不存在的話,進行插入數據 以下是封裝的完整代碼可以參考 from elasticsearch import Elasticsearch url = 'htt

原创 request爬蟲文件方式

import requests headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, l

原创 python鏈家爬蟲

1、爬蟲code # coding=utf-8 import requests import re import pymysql def get_info(url): response = requests.get(url)

原创 12306自動搶票軟件

一、說明 12306目前反爬蟲手段做的越來越牛逼了,一旦檢測到,直接就封號了或者很容易導致登錄失敗,必須更換代理服務器才能登錄,所以做測試的時候一定要小心,要先把代理IP池搞好,再做測試。 二、代理IP池 1、獲取代理IP途徑,獲取代理I

原创 python爬蟲新浪微博

一、新浪微博全棧爬蟲 先不扯皮,直接上獲取數據效果圖 爬蟲策略:遞歸獲取每個用戶的粉絲用戶id,想要獲取多少用戶id,則可以獲取多少;利用獲取的用戶id再獲取每個用戶的所有數據    例如爬黑貓警長GIAO的一條微博所有評論 爬蟲策略: