Python 自动截图-搜集企业外部风险资料

最近在东亚天津分行对公业务部实习,实习生做一些无用的工作。在对企业贷款前风评的时候外部公众信息的搜集也是其中一环。对于贷款企业首先需要绘制其股权图,然后根据企业法人董事,及受益人(25%股权以上)的关联企业进行外部公众信息收集。
用python写了自动截图的软件
这样我就可以做更核心的一些事务了😟

百度搜索一开始我在想怎么点击翻页,其实有更加简便的规则,详细参考

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import os
import time
def get_image(url, pic_name):
#设置chrome为headless(无界面)开启模式
    options = webdriver.ChromeOptions()
    options.add_argument("--headless")
    driver = webdriver.Chrome(chrome_options=options)
#控制浏览器写入并转到链接
    driver.get(url)
    time.sleep(3)
    picture_name = driver.title
#用js获取页面的宽高
    width = driver.execute_script("return document.documentElement.scrollWidth")
    height = driver.execute_script("return document.documentElement.scrollHeight")
    print(width,height)
#将浏览器的宽高设置成刚刚获取的宽高
    driver.set_window_size(width, height)
    time.sleep(3)
#截图并关掉浏览器
    driver.save_screenshot('d:\\BEATJ\\'+picture_name+pic_name)
    url = 'https://www.baidu.com/s?wd='+ke_word+'&pn=10'
    pic_name = r'2.png'
    driver.get(url)
    time.sleep(3)
    picture_name = driver.title
    width = driver.execute_script("return document.documentElement.scrollWidth")
    height = driver.execute_script("return document.documentElement.scrollHeight")
    print(width,height)
    driver.set_window_size(width, height)
    time.sleep(3)
    driver.save_screenshot('d:\\BEATJ\\' + picture_name + pic_name)
    driver.close()
#你输入的参数
at=[' 洗钱 恐怖分子融资 贿赂',' 贪污 挪用 盗用',' 制裁 禁运 逃税',' 走私 贩毒 人口贩卖','奴役 强迫劳动 剥削']
for line in open("keyword.txt","r",encoding='UTF-8').readlines():
    line1=line.replace('\n','')
    line=line1
    for att in at:
        ke_word=line+' '+att
        url = 'https://www.baidu.com/s?wd='+ke_word+'&pn=00'
        pic_name = r'1.png'
        get_image(url, pic_name)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章