Python 自动截图-搜集企业外部风险资料

原創

2020-07-05 22:35

最近在东亚天津分行对公业务部实习，实习生做一些无用的工作。在对企业贷款前风评的时候外部公众信息的搜集也是其中一环。对于贷款企业首先需要绘制其股权图，然后根据企业法人董事，及受益人（25%股权以上）的关联企业进行外部公众信息收集。
用python写了自动截图的软件
这样我就可以做更核心的一些事务了😟

百度搜索一开始我在想怎么点击翻页，其实有更加简便的规则，详细参考

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import os
import time
def get_image(url, pic_name):
#设置chrome为headless（无界面）开启模式
    options = webdriver.ChromeOptions()
    options.add_argument("--headless")
    driver = webdriver.Chrome(chrome_options=options)
#控制浏览器写入并转到链接
    driver.get(url)
    time.sleep(3)
    picture_name = driver.title
#用js获取页面的宽高
    width = driver.execute_script("return document.documentElement.scrollWidth")
    height = driver.execute_script("return document.documentElement.scrollHeight")
    print(width,height)
#将浏览器的宽高设置成刚刚获取的宽高
    driver.set_window_size(width, height)
    time.sleep(3)
#截图并关掉浏览器
    driver.save_screenshot('d:\\BEATJ\\'+picture_name+pic_name)
    url = 'https://www.baidu.com/s?wd='+ke_word+'&pn=10'
    pic_name = r'2.png'
    driver.get(url)
    time.sleep(3)
    picture_name = driver.title
    width = driver.execute_script("return document.documentElement.scrollWidth")
    height = driver.execute_script("return document.documentElement.scrollHeight")
    print(width,height)
    driver.set_window_size(width, height)
    time.sleep(3)
    driver.save_screenshot('d:\\BEATJ\\' + picture_name + pic_name)
    driver.close()
#你输入的参数
at=[' 洗钱 恐怖分子融资 贿赂',' 贪污 挪用 盗用',' 制裁 禁运 逃税',' 走私 贩毒 人口贩卖','奴役 强迫劳动 剥削']
for line in open("keyword.txt","r",encoding='UTF-8').readlines():
    line1=line.replace('\n','')
    line=line1
    for att in at:
        ke_word=line+' '+att
        url = 'https://www.baidu.com/s?wd='+ke_word+'&pn=00'
        pic_name = r'1.png'
        get_image(url, pic_name)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Python 自动截图-搜集企业外部风险资料

Spring Cloud 部署时如何使用 Kubernetes 作为注册中心和配置中心

YOJ 102嚴神的數列

Python金融-市場利率分析學習筆記

YOJ 101 嚴神的遊戲

ICPC NEAU 2020 支付

YOJ208 嚴神的機器人 III

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結