原创 強化學習7日打卡營—心得體會

之前看論文的時候發現很多文章都會用到強化學習,平時也只是零零碎碎地瞭解學習到一些,沒有對強化學習有個系統的認識。 從瞭解最初的RL基礎知識,到環境搭建,到動手實踐,調模型,在這7天雖然很短但收穫滿滿,快速高效入門RL。 最後呢,很感謝這次

原创 LeetCode——搜索二維矩陣 II(C語言)

編寫一個高效的算法來搜索 m x n 矩陣 matrix 中的一個目標值 target。該矩陣具有以下特性: 每行的元素從左到右升序排列。 每列的元素從上到下升序排列。 示例: 現有矩陣 matrix 如下: [ [1, 4,

原创 | 0x20的意思

在寫C語言上機題時遇到一行代碼是 word[i] |= 0x20; |      是“按位與”的意思 |=    就是按位與後賦值 0x20   是十六進制,轉換爲十進制是32,即ASCII碼爲32的空格 完整的函數如下:  bo

原创 LeetCode——求衆數(C語言)

https://blog.csdn.net/be_gin_ner/article/details/86602802 給定一個大小爲 n 的數組,找到其中的衆數。衆數是指在數組中出現次數大於 ⌊ n/2 ⌋ 的元素。 你可以假設數組是非空的

原创 解決Python3.7不能安裝tensorflow低於1.13的問題

可以參考 https://www.jianshu.com/p/1a3e194886b4 【2019.2.27更新】Tensorflow1.13版本已經正式發佈,Python3.7可以直接安裝Tensorflow。     第一步:在pyt

原创 LeetCode——合併兩個有序數組(C語言)

給定兩個有序整數數組 nums1 和 nums2,將 nums2 合併到 nums1 中,使得 num1 成爲一個有序數組。 說明: 初始化 nums1 和 nums2 的元素數量分別爲 m 和 n。 你可以假設 nums1 有足夠的空間

原创 計算機英語專業詞彙

記錄在閱讀相關文獻時遇到的單詞,並增加助記,持續更新...... A   助記 Active-matrix 主動矩陣   Advanced application 高級應用   Access time 存取時間   Add-ons

原创 win10版本下pytorch安裝失敗,解決方法

https://blog.csdn.net/a19990412/article/details/82752224

原创 文本聚類實戰——用K-means對豆瓣圖書數據聚類

讀取豆瓣讀書數據(包含了書名、類別、簡介等)https://github.com/nlpinaction/learning-nlp/tree/master/chapter-9/cluster/data import pandas as

原创 實戰提取文本關鍵詞——LDA

LDA(Latent Dirichlet Allocation,隱含狄利克雷分佈) 理論基礎:貝葉斯理論 LDA算法假設文檔中主題的先驗分佈和主題中詞的先驗分佈都服從狄利克雷分佈。 對已有數據集統計 → 每篇文檔中主題的多項式分佈和每個主

原创 實戰提取文本關鍵詞——TF-IDF

訓練一個關鍵詞提取算法需要以下步驟: 加載已有的文檔數據集 加載停用詞表 對數據集中的文檔進行分詞 根據停用詞表,過濾干擾詞 根據訓練集訓練算法 import math import numpy as np import jieba i

原创 命名實體識別實戰——地名識別

採用基於條件隨機場的方法來完成地名識別任務 CRF++:一款基於C++高效實現CRF的工具。 安裝過程  (gcc 3.0 or higher) Windows:官網http://taku910.github.io/crfpp/下載二

原创 命名實體識別實戰——日期識別

主要目的:識別出每個文本中可能的日期信息,並將其轉換爲統一的格式輸出。例如“我要今天住到明天”(假設今天爲2017年10月1 號),那麼通過日期解析後,應該輸出爲“2017-10-01”和“2017-10-02”. 主要引入以下庫

原创 Python自然語言處理——第七章 從文本提取信息

7.1 信息提取 1.使用句子分割器對文檔的原始文本分割成句  2.使用分詞器將每個句子進一步細分成詞  3.對每個句子進行詞性標註 7.2 分塊 分塊:用於實體識別的基本技術 名詞短語分塊/NP-分塊(NP-chunking) NP-

原创 牛客——單詞識別(C語言)

題目描述 輸入一個英文句子,把句子中的單詞(不區分大小寫)按出現次數按從多到少把單詞和次數在屏幕上輸出來,要求能識別英文句號和逗號,即是說單詞由空格、句號和逗號隔開。 輸入描述: 輸入有若干行,總計不超過1000個字符。 輸出描述: