台部落Ai_践行者

from selenium import webdriver import pickle import requests from lxml import etree from fake_useragent import UserAge

2020-06-09 08:08:39

>>> import re > >>> s ='wo我愛sjl上學吧hfks' >>> res = re.findall(r'([\u2E80-\u9FFF]+)', s) >>> res ['我愛', '上學吧']

2020-06-09 08:08:39

1.docker運行關閉後的實現數據持久化：用容器數據卷保存 2.容器之間共享信息：用容器數據卷保存 3.卷中的更改可以直接生效 4.數據卷中的更改不會包含在image的更新中 5.數據卷中的生產週期一直持續到沒有容器使用他爲止 6.容器

2019-05-04 06:27:02

新建並啓動容器：docker run [ 啓動方式] image 交互啓動方式(返回對話窗口或命令行終端)：docker run -it --name 新起的容器名字 IMAGE_ID 以tomcat爲例子：指定端口：前臺方式：doc

2019-05-04 06:27:02

docker images -a：列出鏡像的所有層； docker images -q:列出鏡像的imageID; docker images -qa:列出鏡像的所有層的imageID;(可以用於批處理刪除)； docker images

2019-05-04 06:27:02

簡介在使用 scrapy 爬取 IT桔子公司信息，用來進行分析，瞭解 IT 創業公司的一切情況，之前使用 scrapy 寫了一個默認線程是10的單個實例，爲了防止被 ban IP 設置了下載的速度，3萬多個公司信息爬了1天多才完成，現在

2019-04-29 03:12:03

spider如下： # -*- coding: utf-8 -*- import scrapy class LianjiaSpider(scrapy.Spider): name = 'lianjia' allowed

2019-04-11 19:43:55

spider文件如下： # -*- coding: utf-8 -*- import scrapy import re class GoodsclassnameUrlSpider(scrapy.Spider): name =

2019-04-11 19:43:45

import json from multiprocessing import Pool import requests from requests.exceptions import RequestException import r

2019-04-11 19:43:45

import re import csv from fake_useragent import UserAgent from urllib.request import Request,urlopen # 4種產品,16個地區,td的

2019-04-11 19:43:45

spider如下： # -*- coding: utf-8 -*- import scrapy from scrapy.linkextractors import LinkExtractor from scrapy.spiders im

2019-04-11 19:43:44

import scrapy import re from Gaoxiao.items import GaoxiaoItem class GaoxiaoSpider(scrapy.Spider): name = 'gaoxiao

2019-04-10 19:34:03

中括號的匹配需要在中括號前面加雙斜槓\\

2019-03-27 19:36:56

DEPTH_PRIORITY 默認： 0 範圍： scrapy.spidermiddlewares.depth.DepthMiddleware 用於根據深度調整請求優先級的整數：如果爲零（默認），則不從深度進行優先級調整正值將降低優先

2019-03-25 19:44:09

import requests import re import time from multiprocessing import Pool headers = { 'User-Agent': 'Mozilla/5.0 (Wi

2019-03-22 19:41:59