原创 深度學習-*-Keras+TextCNN文本分類 基於Thucnews數據集

Thucnews數據集 由於本地機器資源有限,所以僅拿出4W數據來做訓練和測試 我把thucnews數據存到了本地mongo數據集上 如下所示(請忽略label 和lable 的字母拼寫錯誤…) 項目目錄結構 其中classi

原创 tensorflow-*-from tensorflow import keras 與 from tensorflow.python import keras

how to use keras in tf 在版本tensorflow2.0+中有很多方式引入keras import tensorflow as tf from tensorflow import keras # from t

原创 NLP-*-Glove詞向量原理

Glove詞向量 引入 學習詞向量有兩種方法:局部和全局 全局的代表有 LSA PLSA等 局部的代表有 Word2Vec 他們都有各自的缺陷,全局的沒有利用好詞之間的類比信息,局部的方法沒有利用詞全局的統計信息 Glove詞向量

原创 機器學習-*-特徵工程簡述

簡要說明一些特徵工程方面用到的知識,關於一些原理沒有深入講解和研究,主要是對知識有一個系統性理解,當實際工作中遇到相應問題時可快速解決和分析 特徵歸一化 爲什麼需要特徵歸一化 爲了消除數據特徵之間的量綱影響,我們需要對特徵進行歸一

原创 Bug記錄-*-IDEA2019.2.4 Maven jar包引入問題

尼瑪 用idea自帶的maven 可以下載一些jar 包括 spark、postgresql 用了自己安裝的maven-3.6.0 下載不了 其餘的jar包 一直覺得是maven的版本問題,奶奶的 原來是IDEA的Maven

原创 刷題-*-3年有感-*-刷題github項目地址

刷題 頭一回正兒八經的刷leetcode,目前在力扣中文開始刷 自己定的路線是: 數組->棧->鏈表->樹->字符串->動態規劃->查找->排序->圖 困難程度控制在 困難以下,只看一些較爲經典的困難題 3年有感 自從3年前畢業找

原创 數據結構與算法-*-暴力求解、分治法和線性方法對比(最大子數組)

對於最大子數組問題,這裏寫了三種方法進行求解,並給出對比圖形進行對比,發現在我本機上大概數據規模在120以上,分治法開始優於暴力求解方法;線性方法不必說,很強勢 #!/usr/bin/python # -*- coding:utf

原创 機器學習-*-聚類評價指標

直接上代碼,參考論文《文本聚類分析效果評價及文本表示研究》 #!/usr/bin/python # -*- coding:utf-8 -*- """ @Name cluster_metrics @Description 聚類評

原创 深度學習-*-TextCNN對頭條文章進行分類

數據集–頭條文章 根據晚上搜集的數據資源-github地址:頭條數據集 處理該數據集的策略是 分詞,抽詞等,主要是通過原爬取者抽取的關鍵字和我從標題中抽取的關鍵字結合作爲分類的特徵詞。 模型 參考的是網上的教程: import te

原创 深度學習-*-tensorflow入門(一)

1 Tensorflow入門 1.1 計算圖 Tensor:張量,在本教程中,代表的就是多維向量。 Flow:“流”,代表的是計算模型。 TensorFlow 是一個通過計算圖的形式來表述計算的編程系統。TensorFlow中的每一個

原创 數據結構-*-二叉樹基本結構與遍歷算法

二叉樹 首先看節點的定義 package per.lihao.tree; /** * @author : LiHao * @date : 2018/12/4 9:59 */ public class TreeNode {

原创 機器學習-*-決策樹

決策樹 決策樹的學習一般需要3個步驟來實現: 特徵選擇 決策樹的生成 決策樹剪枝 在每一點所用的方法不同,得到的決策樹算法就會不同。比如: 特徵選擇方面:ID3選擇信息增益作爲準則(criterion) ,C4.5用信息增益率作

原创 數據結構-*-快速排序

package per.lihao.sort.complexsort; import per.lihao.sort.SortSequence; import per.lihao.sort.simplesort.BubbleSort;

原创 數據結構-*-歸併排序

package per.lihao.sort.complexsort; import per.lihao.sort.SortSequence; import per.lihao.sort.simplesort.BubbleSort;

原创 數據結構-*-堆排序

堆排序 堆排序是一種交換排序,他的思想是建立一個滿足規則TTT的完全二叉樹,其中TTT: T:{1:父節點的值不小於左右子節點∣∣2:父節點的值不大於左右子節點}每個節點都成立T:\{1:父節點的值不小於左右子節點||2:父節點的值不