台部落kakaok

// 用於存儲已點擊的節點 var clickedNodes = {}; viz.registerOnEvent('clickNode', (e) => { let nodeId = e.node.id;

2024-05-09 13:55:00

APP採集過程中有些請求是需要加密處理的，之前的方式是通過frida-inject的方式處理的，但是這需要連接手機，好在本次處理的APP加密邏輯不是很複雜，加密邏輯都在java層，於是便將裏面的java層的加密邏輯單獨摘出來，想單獨的做成

2023-08-19 13:56:11

採集APP數據的時候發現需要對參數進行加密，爲了簡單就沒有做算法還原，就想嘗試用RPC的方式直接調用最先開始用frida-net，這個方案有個問題是必須用USB連接手機，方案也能跑通先下載frida-net git clone ht

2023-08-12 14:00:34

charles開啓後手機端也按照要求配置了代理，發現在手機端訪問的時候用chrome瀏覽器無法打開chls.pro.ssl地址，電腦是win10 ，默認是開啓了防火牆在手機訪問的時候總是打不開chls.pro.ssl，這時將防火牆

2022-12-08 13:56:15

當用jadx加載多個dex文件的時候爆出 jadx.plugins.input.dex.DexException: Bad checksum， app脫殼後有4個dex文件，解決此問題的方法是取消掉驗證在jadx安裝目錄執行如下命名

2022-11-08 13:55:44

之前在Selenium裏執行js方法很簡單，現在切換到playwright上，發現原來執行js的方式不起作用了,在MSEDGE裏執行 Selenium裏執行JS driver.execute_script('''function st

2022-08-26 14:01:40

對於scrpay亂碼的數據，剛開始在settings.py中配置了FEED_EXPORT_ENCODING = 'utf-8'，發現還是不起作用，於是想到了中間件，在請求返回的時候，對返回的內容進行轉碼處理 def process_re

2022-08-18 13:55:46

本地機器上最近又安裝了一個mongodb5的版本，之前有一個mongodb3.4的版本，5版本安裝後會默認以服務的方式啓動，而且是自啓動，所以導致再啓動3.4版本的時候始終無法連接上而且還會爆出 Failed to execute "li

2022-06-22 14:19:15

最近在處理關鍵詞匹配文章的項目，比如給定“Ukip Vimpat applies” 查詢指定的title中含有至少2個詞的內容 # 查看分詞情況 POST _analyze { "analyzer": "standard", "t

2022-04-20 13:55:22

昨天下午發現在入數據的時候總是報這個異常，日誌裏一大堆，很明顯是長度超了，但是查看了DDL，text類型後來通過直接把數據存入mysql,發現沒什麼問題，那問題出在哪裏呢？再次查看代碼，因爲存儲的是html源碼，後面通過htm

2022-04-07 13:55:35

在做數據備份或導出數據的時候經常需要查詢mysql的導出命令，特此記錄下 1：導出表數據到sql文件備份數據 mysqldump -h 127.0.0.1 -uroot -p topickws t_e_keywords_goog

2022-04-01 13:55:29

火車頭的官方現在已支持python寫插件，最開始按照官方文檔安裝了一個python3.8.8,調用插件總是報錯，後面諮詢客服說是版本太高，後面刪除後python重新安裝了一個python3.6,重新測試發現完美解決貼一個寫好的插件 #

2022-03-17 13:55:42

最近需要清洗一批數據，涉及到好幾個流程，以前的方式是所有數據處理完一步後再進行下一步，這種方式也能很好的完成需求。最近發現了一個python的PipeLine庫 fastcore 裏面有個pipeline模塊，正好滿足我的需求 fro

2022-03-08 13:55:43

python裏替換經常用replace函數，最近發現在清洗數據的時候用到replace有一些問題，後來發現是自己使用不當比如 "a and a materials" 要把 'a' 'and' 清洗掉，用replace處理後變成"nd mt

2022-03-08 13:55:43

之前一直在尋找比較內容差異的庫，原來python標準庫裏自帶有difflib庫這就比較有意思了，對於數據採集來說比較兩次請求參數的變化就很有用了，可以知道哪些是變化的，方便定位比較 import difflib def diff_hea

2022-02-18 13:55:50