原创 python實現字符串匹配算法BF,BF改,KMP

包含:BF,BF改進版本,KMP BF:暴力搜索 BF改:當判斷匹配失敗的字符串是不是與首字母相同 若不同,繼續BF算法; 若相同,直接將首字母移到當前位置 KMP:通過前綴與後綴發現待匹配字符串本身的特性,匹配失敗時一次性移動多個字符以

原创 python 二叉樹遞歸時明明已經得到了結果,但是返回None

得到二叉樹的最小值時,原來的代碼是: def get_min_node(node: AVLTreeNode): temp_node = node if temp_node.left is not None:

原创 平衡二叉樹(AVL)python實現

AVL樹是一種特殊的二叉搜索樹 (BST樹),數據極端情況下, 二叉搜索樹會退化成爲單鏈表,但是AVL樹通過旋轉操作規避了這個問題。 查找平均複雜度:O(logn) # AVL樹不適於刪除的情況 class AVLTreeNode(ob

原创 python使用hash256加密驗證字符串

這篇博客使用hash256加密一個固定的字符串,同一個字符串有固定的hash256,因此可以通過驗證hash值,判斷字符串是否發生變化 import hashlib def get_hash256(data: str): # 對da

原创 與COVID-19有關的論文文本分析

文章目錄數據源數據預處理1. json數據提取2.文本轉小寫3.詞形還原4.分詞5.剔除停用詞6.詞頻統計數據分析1.TF-IDF——文本相似度2.LDA 建模——主題提取3.Word2vec模型——主題詞相似度計算4.LSI建模

原创 使用英文做LDA建模

data.txt文本是做了預處理等操作生成的數據,每一行代表一條數據: in conjunction with the release of the the allen institute for ai partnered with t

原创 使用pickle模塊打包停用詞表,加快處理文本數據的速度

參考博客:https://blog.csdn.net/brucewong0516/article/details/79055480 本地有一個停用詞表eng_stop_words.txt文本,現在使用pickle打包: def save

原创 自動爬取中國大學mooc的pdf文檔

由於中國大學mooc裏課程的pdf文檔不方便下載,因此這裏敲一個能自動下載課程裏所有pdf的代碼: 窗體代碼: from tkinter import * from tkinter.filedialog import askdirect

原创 無界面chrome + selenium爬蟲

目錄 Chromedriver 配置 爬蟲編寫 Chromedriver 配置 1.輸入chrome://version/ ,查看chrome版本,如圖:78.0.3904.97 2.到網址http://chromedriver.sto

原创 Geatpy框架使用基於NSGA-II算法的多染色體多目標進化算法案例(moea_psy_NSGA2_templet)

在Geatpy的官方文檔中並沒有多目標+多染色體進化算法的demo,在我實際寫代碼時也出現了一些問題。本篇博客補充一個調用moea_psy_NSGA2_templet的demo: 目標函數: max f1 = x1 * x2 + x3

原创 考研數學自整理,彌補知識漏洞(強化、衝刺)

本次分享的是博主在考研時整理的最後一份數學知識,也是上考場前對知識最後的強化。因爲博主是二戰上岸(第一年考數三,第二年考數一),雖然這份筆記總結的內容不多,但這裏濃縮了2020前歷年數三、數的一真題與模擬題易錯的考點和難點。 網盤鏈接:h

原创 考研數學一基礎技巧題彙總

本篇博客裏博主總結了歷年真題、模擬題中容易忽視的基礎與技巧: 輕裝上陣很重要!希望大家熟練掌握以下每個知識點。 本篇博客側重於基礎部分,同時還有一些不常考,但考題很簡單的知識點. 但是考研數學題的思路往往是難點,甚至有一些非常不

原创 考研政治——選擇題判斷原則

博主個人感覺政治的選擇題答案真的不用背誦,而且付出與收穫完全是絕對失衡的。大家做選擇題時如果明確知道答案最好,但若不確定,這裏博主分享一些個人總結的做題經驗或可以說是篩選原則。 練習時單選題儘量不要錯,多選題保持在7個以

原创 考研政治——學習心得

政治教材萬不可使用往年資料,因爲週年紀念對考試影響非常大,有的知識點往年是重點,今年就不是了。 文章目錄選擇題大題 選擇題 練習時: 單選1分鐘1個,多選2分鐘1個。 單選題儘量不要錯,多選題保持在7個以內。 複習

原创 Scrapy爬蟲抓取ZOL手機詳情

前不久需要一批手機數據做測試,所以就爬取了ZOL上關於手機的各項參數,現在把代碼分享出來,希望大家能夠多提改進意見。 ZOL手機信息 想要抓取ZOL關於手機的信息需要三個步驟: 手機商城列表頁 —》單個手機詳情頁 ----》當前手