原创 python——NLP關鍵詞提取

關鍵詞提取顧名思義就是將一個文檔中的內容用幾個關鍵詞描述出來,這樣這幾個關鍵詞就可以提供這個文檔的大部分信息,從而提高信息獲取效率。 關鍵詞提取方法同樣分爲有監督和無監督兩類,有監督的方法比如構造一個關鍵詞表,然後計算文檔和每個次的匹配程度

原创 python機器學習——BP(反向傳播)神經網絡算法

背景與原理: BP神經網絡通常指基於誤差反向傳播算法的多層神經網絡,BP算法由信號的前向傳播和反向傳播兩個過程組成,在前向傳播的過程中,輸入從輸入層進入網絡,經過隱含層逐層傳遞到達輸出層輸出,如果輸出結果與預期不符那麼轉至誤差反向傳播過程,

原创 python機器學習——隨機森林算法

背景與原理: 首先我們需要知道集成學習的概念,所謂集成學習,就是使用一系列學習器進行學習,並且通過某種規則把這些學習器的學習結果整合起來從而獲得比單個學習器學習效果更好的機器學習方法。這樣的方法可以用於解決單個學習器的過擬合、性能瓶頸等問題

原创 python機器學習——樸素貝葉斯算法

背景與原理: 樸素貝葉斯算法是機器學習領域最經典的算法之一,仍然是用來解決分類問題的。 那麼對於分類問題,我們的模型始終是:用$m$組數據,每條數據形如$(x_{1},...,x_{n},y)$,表示數據共有$n$個特徵維度,而$y$表示該

原创 python機器學習——決策樹算法

背景與原理: 決策樹算法是在各種已知情況發生概率的基礎上通過構成決策樹來求某一事件發生概率的算法,由於這個過程畫成圖解之後很像一棵樹形結構,因此我們把這個算法稱爲決策樹。 而在機器學習中,決策樹是一種預測模型,代表對象屬性和對象值之間的一種

原创 python機器學習——kmeans聚類算法

背景與原理: 聚類問題與分類問題有一定的區別,分類問題是對每個訓練數據,我給定了類別的標籤,現在想要訓練一個模型使得對於測試數據能輸出正確的類別標籤,更多見於監督學習;而聚類問題則是我們給出了一組數據,我們並沒有預先的標籤,而是由機器考察這

原创 python機器學習——SVM支持向量機

背景與原理: 支持向量機是一種用來解決分類問題的算法,其原理大致可理解爲:對於所有$n$維的數據點,我們希望能夠找到一個$n$維的直線(平面,超平面),使得在這個超平面一側的點屬於同一類,另一側的點屬於另一類。而我們在尋找這個超平面的時候,

原创 python機器學習——PCA降維算法

背景與原理: PCA(主成分分析)是將一個數據的特徵數量減少的同時儘可能保留最多信息的方法。所謂降維,就是在說對於一個$n$維數據集,其可以看做一個$n$維空間中的點集(或者向量集),而我們要把這個向量集投影到一個$k<n$維空間中,這樣當

原创 python機器學習——KNN(K近鄰算法)

背景與原理: KNN算法其實是邏輯最簡單的分類算法——我們認爲一個數據的類型是由與其最接近的數據決定的,而“接近”實際上就是我們度量兩個數據點之間的距離,如果我們把一組數據看做一個向量$(x_{1},...,x_{n},y)$,其中$y$代

原创 python機器學習——邏輯迴歸方法

理論背景: 線性迴歸可以實現對連續結果的預測,但是現實生活中我們常見的另一種問題是分類問題,尤其是二分類問題,在這種情況下使用線性迴歸就不太合適了,我們實際上需要計算出的是一個在$[0,1]$之間的概率來告訴我們某樣本屬於某一類的概率,因此

原创 python機器學習——線性迴歸方法

基本原理: 線性迴歸是機器學習建模中最爲簡單的模型,也是計算起來最爲直觀的模型 所謂線性迴歸,我們要建立的是這樣的模型:對一組數據,每組數據形如$(x_{1},...,x_{n},y)$,我們希望構造一個線性函數$h_{\theta}(X)

原创 北大2022編譯原理實踐(C/C++)

這是今年新推出的實踐方案,由往年的sysy->IR1->IR2->RISC V變成了sysy->Koopa->RISC V,通過增量的方式讓整個實踐過程更容易上手 所以先在這裏簡要記錄一下整個實踐過程 首先我們要始終跟隨文檔https://

原创 小球與盒子的問題

這類問題的基本模型是:你有$n$個小球,$m$個盒子,現在想把這$n$個小球放進$m$個盒子中,問有多少种放的方法 但是隻給出這樣的條件並不足夠,我們必須加上一些限制,否則結果是不確定的 一般加的有三個限制,即小球是否有區別、盒子是否有區別

原创 bzoj 3106

好久沒寫oi系列的題解了 要不是爲了大作業我纔不會回來學這些奇怪的東西呢 本題對抗搜索就好啦 首先要分析一點,就是由於我們的黑棋每次走兩步,白棋只走一步而且是白棋先走,所以除非白棋第一步喫掉黑棋,否則黑棋必勝 接下來就是計算黑棋如何取勝的問

原创 數論有關定理及其證明

裴蜀定理: 內容:若$gcd(a,b)=d$,則一定存在$m,n\in Z$,使$ma+nb=d$且$d$爲$ma+nb$的最小正值(狹義) 證明: 令$d=gcd(a,b)$,則對任意$m,n\in Z$,有$d|am+bn$ 設$am+