原创 巧用win32print來控制windows系統打印機並推送打印任務

  小爬最近的一個需求是:將windows系統下的打印任務批量有序給到網絡打印機。 用戶先從公司的OA(B/S模式)系統下 打印指定內容的表單以及表單中的附件內容。這個問題可以這樣分解: 1、抓包,得到OA對應的任務接口,然後利用pytho

原创 關於selenium使用driver.minimize_window()失敗問題

  最近小爬在用chromedriver.exe結合python selenium這條技術棧做web自動化時發現,driver.maximize_window()可以正常使用,但是driver.minimize_window()卻遭遇意外失

原创 Python驅動SAP GUI完成自動化(三)

  小爬之前已經就“Python驅動SAP GUI完成自動化”問題寫過幾篇文章,其核心都是恰當運用sap GUI Scripting API中元素的屬性和方法,來操縱SAP session的元素。下面來看看兩個新場景下的新問題。 常見場景一

原创 Python驅動SAP GUI完成自動化(選擇佈局+動態獲取節點值) Python結合SAP GUI Script操作sap的簡易教程

  小爬在之前的文章中(Python結合SAP GUI Script操作sap的簡易教程) 討論過如何利用工具Scripting Tracker錄製python操縱SAP GUI的py腳本。軟件的錄製和生成的代碼界面如下:        

原创 python中如何將貨幣數字轉化成漢字大寫金額

  近日,小爬的工作中,需要將貨幣數字金額(如:123234.56)轉化成漢字大寫的形式。網絡上看了一圈他人博客上的自定義函數,稍微都存有瑕疵,不符合漢語習慣: 1、比如,“六分”不能被轉化爲“零角六分”,“.00"轉爲了”零角零分“燈,着

原创 requests庫結合selenium庫共同完成web自動化和爬蟲工作

    我們日常工作中,單純的HTTP請求,程序員都傾向於使用萬能的python Requests庫。但大多數場景下,我們的需求頁面不是純靜態網頁,網頁加載過程中伴隨有大量的JS文件參與頁面的整個渲染過程,且頁面的每一步操作可能都能找到異步

原创 利用python第三方庫提取PDF文件的表格內容

小爬最近接到一個棘手任務:需要提取手機話費電子發票PDF文件中的數據。接到這個任務的第一時間,小爬決定蒐集各個地區各個時間段的電子發票文件,看看其中的差異點。粗略統計下來,PDF文件的表格框架是統一的,但是數據部分則有較大差異: .   

原创 pyinstaller打包exe文件閃退的解決辦法

  pyinstaller是python下目前能打包py文件爲windows下的exe文件的一個非常友好易用的庫!但是,小爬每次用pyinstaller打包時也總是遇到一些難題,有時網上搜了一圈,也沒看到合適的答案。小爬因此決定把我的問題和

原创 pandas數據分析小知識點(一)

  最近工作上,小爬經常需要用python做一些關於excel數據分析的事情,顯然,從性能和拓展性的角度出發,使用pandas、numpy是比vba更好的選擇。因爲pandas能提供諸如SQL的很多查找、過濾功能,性能要比用excel Vl

原创 使用windows api函數捕獲SAP session的左下角消息句柄

  背景:SAP session的左下角消息非常有用,我們在做SAP的自動化腳本時可以設法讀到這個消息的內容,作爲程序後續動作的判斷條件。如下圖:          比如小爬之前給財務的同事製作了一個批量導出SAP各類報表的腳本工具:基於公

原创 python tkinter動態追加按鈕等控件可能遇到的問題

  小爬最近給同事製作一個小爬蟲:具體要求: 1、每天自動定時觸發; 2、模擬用戶自動登陸; 3、自動爬取對應API接口數據; 4、對爬取結果進行邏輯判斷,對符合條件的數據進行規則化列示; 5、列示的行項目支持超鏈接,如果用用戶已經通過瀏覽

原创 使用Python完成SAP客戶端的打開和系統登陸

  最近小爬一直思忖着如何將以前寫的一些半自動化程序轉爲全自動化,這其中就涉及到SAP的打開和登錄過程。我們都知道,SAP原生的“腳本錄製和回放”功能是在用戶進入到某一個SAP”用戶指定系統“後纔可以啓用:   也就是說,從這裏開始,您可以

原创 pyinstaller打包py腳本Warning:lib not found等相關問題

  小爬從使用Pyinstaller打包py爲exe文件以來,一直都會碰到Warning:lib not found等相關問題,諸如:   雖然大多數時候,您像我一樣忽略這些warning,打包後的exe也能運行。網上有一堆的方法,有建議

原创 利用pandas、Ipython來簡化數據分析過程

  最近小爬我爲了提升數據分析這塊兒的技能,學習了pandas庫作者Wes Mckinney的數據分析經典書籍《利用Python進行數據分析》,受益良多!裏面涉及到Python語言基礎、還有編程利器Ipython、Jupyter noteb

原创 python多進程multiprocessing模塊中Queue的妙用

  最近的部門RPA項目中,小爬爲了提升爬蟲性能,使用了Python中的多進程(multiprocessing)技術,裏面需要用到進程鎖Lock,用到進程池Pool,同時利用map方法一次構造多個process。Multiprocessin