基于cnn和rnn的文本分类实践

原創

2018-09-03 10:05

本文主要介绍在文本分类中，使用CNN网络和RNN网络的实践，其中CNN又分为maxPool和k-maxpool。可以直接在juputer执行。

代码已经上传github

https://github.com/yixiu00001/text-classify-cnn-rnn/blob/master/README.md

1.CNN+maxPool

text-classification-cnn-maxpool 该工程为cnn-maxpool相关代码。

dataOwn.py

主要包括基于word2vec的embedding方法构建词和index的映射词典，词长不到设定值的打padding以及数据的载入和batch_iter

CNNDiseaseModel.py

主要是CNN网络相关的变量初始化及网络构造。重点看placeholder/inference等部分，在计算损失部分，由于目前的label只有一个数值，非onehot类型，所以调用sparse_softmax_cross_entropy_with_logits接口。

CNNDiseaseModelTrain.ipynb

这个文件是训练模型的文件，在train部分是整个训练的逻辑。

CNNDiseaseModelPredict.ipynb

这个文件是对已经训练好的模型，进行结果测试，提供了输入一段文本进行测试的接口和输入一个测试文件地址进行测试的接口。

2.CNN-k-max-pool

这里和上面工程的区别是使用了k-max pool，但是本实验中效果和max-pool差不多。同样包含几个文件

dataOwn.py
modelOneConv.py
trainWord2vec.ipynb
predictWord2vec.ipynb

3.text-classification-rnn

这个文件是基于rnn实现的分类，可以选择使用LSTM或者GRU

rnn_model_oneLable.py
train_rnn_oneLable.ipynb
predict_rnn_oneLablelNew.ipynb

这三个文件对应的数据的label是一个数字，如0 ，1 ，2这种类型

rnn_model_onehotLable.py
train_rnn_onehotLable.ipynb

这两个文件对应的数据的label是onehot类型，如100000000000000，010000000000

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

深度学习基础——张量的通俗理解

轉載鏈接：https://www.cnblogs.com/abella/p/10142935.html 也許你已經下載了TensorFlow，而且準備開始着手研究深度學習。但是你會疑惑：TensorFlow裏面的Tensor，也就是“

2020-07-08 11:53:15

视频目标分割之Video Object Segmentation using Space-Time Memory Networks

Video Object Segmentation using Space-Time Memory Networks 文章目錄Video Object Segmentation using Space-Time Memory Ne

2020-07-08 11:18:09

基于attention机制实现 CRNN OCR文字识别

定義網絡結構實現 BahdanauAttention，其中socre的實現方法爲 perceptron 形式 class BahdanauAttention(tf.keras.Model): def __init__(sel

2020-07-08 12:23:28

opencv 加载tensorflow pb模型

opencv加載的pb模型必須是用tf.layers 和 tf.nn 下的api構建的,使用slim會在加載時報未知的layer的錯誤基本流程: 1.加載pb bool CardDetect::load_model(string mo

2020-07-08 12:23:28

深度学习-攒机小记

預算1w以內吧。下面是英偉達DevBox的配置，可以作爲參考。 The DIGITS DevBox includes the following hardware and software: Four TITAN X GPU

2020-07-08 12:17:40

聊天机器人/对话生成

在這裏記錄一下聊天機器人方面的瞭解。算是一個Survey吧。聊天機器人有兩種技術方向： 1. 基於檢索 2. 基於生成模型術語 Generation based automatic chatting system Ne

2020-07-08 12:17:40

推荐系统系列（二）：从零开始搭建基于向量的推荐策略

從零開始搭建基於向量的推薦策略背景架構離線Pipeline搭建用戶行爲日誌上報日誌存儲到數據倉庫數據預處理模型訓練構建項目索引在線服務用戶向量預測最近項目查找總結參考背景向量召回/語義向量召回是現在流行的一種推薦策略，簡單來說

2020-07-08 12:17:27

论文解读：Single path one-shot neural architecture search with uniform sampling

Single path one-shot neural architecture search with uniform sampling 1、總覽大多數搜索空間鬆弛化的方法裏，結構分佈是被連續地參數化了，這些參數在超網絡訓練時一同被

2020-07-08 12:06:15

深度学习论文中的一些术语（仅备份用，不定时更新）

hinge loss: 是機器學習領域中的一種損失函數，可用於“最大間隔(max-margin)”分類 hinge loss 函數是凸函數，因此機器學習中很多的凸優化方法同樣適用於 hinge loss empirical risk: 經

2020-07-08 12:04:52

深度学习_目标检测_FPN论文详解

FPN的創新點多層特徵特徵融合解決了目標檢測中的多尺度問題，通過簡單的網絡連接改變，在基本不增加原有模型計算量的情況下，大幅度提升小物體（small object）的檢測性能。在物體檢測裏面，有限計算量情況下，網絡的深

2020-07-08 11:57:07

深度学习_目标检测_“YOLOv5”详解（持续更新）

YOLOv5可以方便的進行工程化部署： YOLOv5（PyTorch）−>ONNX−>CoreML−>iosYOLOv5（PyTorch） -> ONNX -> CoreML -> iosYOLOv5（PyTorch）−>ONNX

2020-07-08 11:57:07

[深度之眼]LeNet/AlexNet/VGGNet/InceptionNet/ResNet实现fashion_mnist分类

本文使用五種經典卷積神經網絡，實現fashion_mnist十分類問題，並對比準確度和運行時間LeNet5 原理AlexNet8 原理VGGNet16 原理InceptionNet10 原理ResNet18 原理用到的包： im

2020-07-08 11:53:37

TensorFlow+CNN+OpenCV快速识别中文验证码

聲明:文章僅源自個人興趣愛好，不涉及他用，侵權聯繫刪。轉載請註明：轉自此博文https://leejason.blog.csdn.net/article/details/106150572 TensorFlow+CNN+Open

2020-07-08 11:43:39

apt-get update 卡在working 0 已解决

Ign:1 http://mirrors.163.com/ubuntu trusty InRelease Get:2 http://mirrors.163.com/ubuntu trusty-security InRelease

一蓑烟雨任平生yu

2020-07-08 11:20:23

深度学习调参技巧pdf . Free download!

這裏有一份深度學習的調參技巧《Neural Networks: Tricks of the Trade》收錄了許多論文裏提出的調參技巧。送給大家！鏈接: https://pan.baidu.com/s/1dtKVOYsu6pY

一蓑烟雨任平生yu

2020-07-08 11:20:22

24小時熱門文章

最新文章

最新評論文章