最近在东亚天津分行对公业务部实习,实习生做一些无用的工作。在对企业贷款前风评的时候外部公众信息的搜集也是其中一环。对于贷款企业首先需要绘制其股权图,然后根据企业法人董事,及受益人(25%股权以上)的关联企业进行外部公众信息收集。
用python写了自动截图的软件
这样我就可以做更核心的一些事务了😟
百度搜索一开始我在想怎么点击翻页,其实有更加简便的规则,详细参考
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import os
import time
def get_image(url, pic_name):
#设置chrome为headless(无界面)开启模式
options = webdriver.ChromeOptions()
options.add_argument("--headless")
driver = webdriver.Chrome(chrome_options=options)
#控制浏览器写入并转到链接
driver.get(url)
time.sleep(3)
picture_name = driver.title
#用js获取页面的宽高
width = driver.execute_script("return document.documentElement.scrollWidth")
height = driver.execute_script("return document.documentElement.scrollHeight")
print(width,height)
#将浏览器的宽高设置成刚刚获取的宽高
driver.set_window_size(width, height)
time.sleep(3)
#截图并关掉浏览器
driver.save_screenshot('d:\\BEATJ\\'+picture_name+pic_name)
url = 'https://www.baidu.com/s?wd='+ke_word+'&pn=10'
pic_name = r'2.png'
driver.get(url)
time.sleep(3)
picture_name = driver.title
width = driver.execute_script("return document.documentElement.scrollWidth")
height = driver.execute_script("return document.documentElement.scrollHeight")
print(width,height)
driver.set_window_size(width, height)
time.sleep(3)
driver.save_screenshot('d:\\BEATJ\\' + picture_name + pic_name)
driver.close()
#你输入的参数
at=[' 洗钱 恐怖分子融资 贿赂',' 贪污 挪用 盗用',' 制裁 禁运 逃税',' 走私 贩毒 人口贩卖','奴役 强迫劳动 剥削']
for line in open("keyword.txt","r",encoding='UTF-8').readlines():
line1=line.replace('\n','')
line=line1
for att in at:
ke_word=line+' '+att
url = 'https://www.baidu.com/s?wd='+ke_word+'&pn=00'
pic_name = r'1.png'
get_image(url, pic_name)