原创 文本預處理:TF-IDF

前一篇博客已經講了向量化,那麼向量化之後一般都伴隨着TF-IDF的處理,這篇博客就TF-IDF做一個解釋。 1 向量化特徵的不足 還是上一篇博客中的例子,如果我們直接將統計詞頻後的9{9}9維向量作爲文本分類的輸入,會發現一些問題

原创 IntelliJ IDEA 加載文件出現中文字符亂碼的解決方法

關於IDEA亂碼的問題,網上大多數解決方法都是聚焦在IDEA這個IDE的編碼/解碼問題上,例如https://jingyan.baidu.com/article/0964eca26845b28285f536c8.html 其實還有另外一種

原创 安裝Node.js體會

一、nvm、node、npm    1、nvm:nodejs版本管理工具,可以管理很多node版本和npm版本    2、nodejs:項目開發時用到的代碼庫    3、npm:隨nodejs的安裝一併安裝,屬於包管理工具,npm管理no

原创 leetcode解題:數組&鏈表

與鏈表有關的操作和算法題往往考的不是思維能力,代碼能力纔是面試官關注的。 206. 反轉鏈表 反轉一個單鏈表。 輸入: 1->2->3->4->5->NULL 輸出: 5->4->3->2->1->NULL PS:這個題目考的

原创 leetcode解題:買賣股票的最佳時機系列

題目按照從易到難的順序解決。 121. 買賣股票的最佳時機 給定一個數組,它的第 i 個元素是一支給定股票第 i 天的價格。 如果你最多隻允許完成一筆交易(即買入和賣出一支股票),設計一個算法來計算你所能獲取的最大利潤。 注意你不能在

原创 leetcode解題:遞歸&分治(上)

遞歸 遞歸起源: 從前有座山 山裏有個廟 廟裏有個老和尚講故事 講的故事是什麼呢? 從前有座山 … 《盜夢空間》裏的夢也是遞歸的例子,強烈建議觀看這部電影。 代碼例子: 計算n!{n!}n! n!=1∗2∗3∗...∗n{n!=1

原创 leetcode解題:遞歸&分治(下)

這篇博客講具體題目 50. Pow(x, n) 實現 pow(x, n) ,即計算 x 的 n 次冪函數。 示例: 輸入: 2.00000, 10 輸出: 1024.00000 ===========================

原创 leetcode解題:動態規劃(上)

首先講一點:動態規劃(Dynamic Programming)的名字有些言過其實,“Programming{Programming}Programming”的意思不是“編程”,這裏指的是“遞推”的意思,沒有高瞻遠矚的意思,也沒有計劃未

原创 leetcode解題:動態規劃(下)

更新中。。。。 動態規劃(Dynamic Programming)四要點: 遞推 狀態的定義:opt[n], dp[n], fib[n]{opt[n],\ dp[n], \ fib[n]}opt[n], dp[n], fib[n]

原创 SVM入門系列

SVM入門(一)至(三) SVM的八股簡介和白話解說,涉及經驗風險和結構風險等知識; 線性分類器、分類間隔(函數間隔、幾何間隔) SVM入門(四)線性分類器的求解 問題的描述 SVM入門(五)線性分類器的求解 目標函數和約束

原创 leetcode解題:字符切片

字符切片: 字符串[開始索引:結束索引:步長] 切取字符串爲開始索引到結束索引-1內的字符串 步長不指定時,步長爲1 字符串[開始索引:結束索引] 切片操作示例 應用一: leetcode 7. 整數反轉 給出一個 32 位的有符

原创 leetcode解題-滑動窗口

滑動窗口思路: 解決部分數組問題時,設置兩個索引下標i,j{i,j}i,j,i{i}i爲左邊界,j{j}j爲右邊界,逐漸遍歷整個數組,i{i}i和j{j}j組成的子數組形成長度變化的滑動窗口,直至i{i}i遍歷完整個數組。 應用一:

原创 編程體會:有效的流程很關鍵

寫程序的時候,正確合適的工作流程能夠確保高效地完成工作目標,這篇文章將主要介紹從頭到尾解決編程問題的策略,與各位在編程之路上共勉。應用這一結構化的流程能儘可能地縮減令人沮喪地調試過程,在更少的時間裏寫成更清晰更正確的代碼。 一步步

原创 圖解詞嵌入、語言模型、Word2Vec

嵌入(embedding)是機器學習中最迷人的想法之一。 如果你曾經使用Siri、Google Assistant、Alexa、Google翻譯,甚至智能手機鍵盤進行下一詞預測,那麼你很有可能從這個已經成爲自然語言處理模型核心的想法中

原创 文本預處理:詞袋模型與向量化

一般對文本預處理或者叫做特徵提取,首先是要分詞,分詞之後就是向量化,也就是訓練詞向量(其實就是將詞和詞頻對應起來,做成矩陣向量的形式)。下面我們要講的就是向量化。 1 詞袋模型 講向量化之前,先講一下詞袋模型(Bag of Words