原创 DQL語言的學習——常見函數

調用:select 函數名(實參) [from 表]; 關注點: 1. 函數名 2. 函數功能 分類: 1. 單行函數:處理數據 2. 分組函數:做統計使用,又稱爲統計函數、聚合函數、組函數 一、單行函數 1、字符函數

原创 Word2016加載MathType

本文以word2016 64位爲例,32位同理。 Step 1 找到MathType安裝目錄中Office Support>64目錄下紅色方框標註的文件,將其複製到office2016的安裝目錄下的Office16>STARTUP

原创 Python存儲中文數據到MySQL,對錶進行操作

解決辦法一共包括兩個步驟。 步驟1. 創建數據表 利用Python創建表格時,需要指定charset='utf8mb4' db = pymysql.connect(host='localhost', user='root', pa

原创 配置以及監測:用GPU來跑Keras

前提條件: 你的系統有GPU(Nvidia.因爲AMD還沒有工作) 您已經安裝了tensorflow的GPU版本 您已安裝CUDA 並且配置好環境變量。 檢測是否配置成功 第一步 from tensorflow.python.

原创 Keras實現單詞級的one-hot編碼

這是對英文文本進行處理 # 導入相關文本處理包 In [1]: from keras.preprocessing.text import Tokenizer # 兩個句子示例 In [2]: samples = ['The ca

原创 (六)Tensorflow學習——卷積神經網絡

深度學習框架-Tensorflow案例實戰視頻課程 導入相關包 import numpy as np import tensorflow as tf from tensorflow.examples.tutorials.mn

原创 (三)利用Wikipedia中文語料訓練詞向量word2vec——word2vec模型測試

通過前兩篇文章,我們得到了word2vec模型: (一)利用Wikipedia中文語料訓練詞向量word2vec——獲取Wikipedia簡體中文語料庫 (二)利用Wikipedia中文語料訓練詞向量word2vec——分詞、訓練

原创 (三)Tensorflow學習——mnist數據集簡介

導入相關包 import numpy as np import tensorflow as tf import matplotlib.pyplot as plt # tensorflow自帶的一些數據集 from tensorf

原创 (二)Tensorflow學習——構造線性迴歸模型

實驗在jupyter notebook上運行。 一、導入相關包 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt %matplot

原创 (二)利用Wikipedia中文語料訓練詞向量word2vec——分詞、訓練word2vec

在前一節,(一)利用Wikipedia中文語料訓練詞向量word2vec——獲取Wikipedia簡體中文語料庫 我們學習到了如何下載Wiki中文語料庫,並且學會了如何將繁體轉換爲簡體。在這一節中,我們將學習如何訓練word2ve

原创 (五)Tensorflow學習——神經網絡模型架構

以mnist數據集爲例,建立雙隱層神經網絡模型。 導入相關包 import numpy as np import tensorflow as tf from tensorflow.examples.tutorials.mnist

原创 訓練Doc2Vec

將文本數據表示成list of list的形式: 對每一條文本進行分詞操作,可能的話,去除停用詞,加上自定義詞等: 將分詞後的文本轉換爲gensim所需要的形式: 訓練Doc2Vec,其中參數dm=1表示DM模型,dm=0

原创 通過gensim,加載預訓練詞向量,獲取embedding_matrix

使用預訓練的詞向量 1. 加載詞向量 # 加載訓練好的詞向量模型 import gensim Word2VecModel = gensim.models.Word2Vec.load(詞向量模型所在路徑) # 讀取詞向量 2.

原创 Python繪製詞雲圖wordcloud

假設文本內容爲如下所示: 三支決策聚類理論模型與方法研究基於三支決策的微博中文反語識別研究數據分析的三層與三支屬性約簡系統研究基於決策粗糙集的模糊多分類三支決策方法與應用研究三支決策空間理論研究面向複雜數據的多粒度三支決策研究三

原创 Python保存數據到CSV文件

利用字符串的形式將多行數據保存到CSV文件。 a = np.array([(1,2), (3,4), (5,6), (7,8)]) lines = "" for i in a: for j in a: dis = np.sq