Embedding層

原創

2018-10-10 07:46

爲什麼要使用嵌入層 Embedding呢? 主要有這兩大原因:
1、使用One-hot 方法編碼的向量會很高維也很稀疏。
2、訓練神經網絡的過程中，每個嵌入的向量都會得到更新。

“deep learning is very deep”

通過索引對該句子進行編碼
1 2 3 4 1

創建嵌入矩陣

這樣，我們就可以使用嵌入矩陣來而不是龐大的one-hot編碼向量來保持每個向量更小。簡而言之，嵌入層embedding在這裏做的就是把單詞“deep”用向量[.32, .02, .48, .21, .56, .15]來表達。
https://blog.csdn.net/u010412858/article/details/77848878

Embedding層就是以one hot爲輸入、中間層節點爲字向量維數的全連接層
https://kexue.fm/archives/4122

利用Word Embedding將一個單詞轉換成固定長度的向量表示，從而便於進行數學處理。

使用數學模型處理文本語料的第一步就是把文本轉換成數學表示，有兩種方法，第一種方法可以通過one-hot矩陣表示一個單詞

第二種方法是Word Embedding矩陣給每個單詞分配一個固定長度的向量表示，這個長度可以自行設定

Word Embedding的生成我們使用tensorflow，通過構造一個包含了一個隱藏層的神經網絡實現。
有兩種業界常用的Word Embedding生成方式，Continuous Bag Of Words (CBOW)方法和n-gram方法
https://www.jianshu.com/p/394892ec58b5

word2vec是一個將詞表示爲一個向量的工具，通過該向量表示，可以用來進行更深入的自然語言處理，比如機器翻譯等。
https://www.jianshu.com/p/418f27df3968

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

自然語言處理-多分類模型搭建

文章目錄一\介紹二\數據處理思路讀取數據提取char和word,轉化爲txt利用上面的txt, 使用word2vec生成模型對每句話根據上面生成的模型,得到對應的向量利用re正則匹配將csv中的word和char做成list,將l

2020-07-03 15:42:14

python連接sqlserver數據庫

python連接sqlserver數據庫 1、python3.6連接sqlserver數據庫需要引入pymssql模塊 2、 pip install pymssql pymssql儘量和自己的python版本一致，我的版本是py

2020-07-02 01:34:40

Tensorflow七種初始化函數

一、tf.constant_initializer(value) 作用：將變量初始化爲給定的常量，初始化一切所提供的值。二、tf.zeros_initializer() 作用：將變量設置爲全0；也可以簡寫爲tf.Zeros()

2020-07-02 01:34:38

RNN循環神經網絡相關知識

循環神經網絡是啥循環神經網絡種類繁多，我們先從最簡單的基本循環神經網絡開始吧。基本循環神經網絡下圖是一個簡單的循環神經網絡如，它由輸入層、一個隱藏層和一個輸出層組成：納尼？！相信第一次看到這個玩意的讀者內心和我一樣是崩潰

2020-07-02 01:34:38

圖注意力模型GAT代碼分析（Keras版）

本文分享一個對Keras版GAT源碼的分析。 GAT原文：https://arxiv.org/abs/1710.10903，建議參考着知乎superbrother大神的文章進行理解。 TensorFlow版可以看：https://gith

翻滚的老鼠屎

2020-06-30 03:30:27

深度學習實戰筆記一：google colab使用入門+mnist數據集入門+Dense層預測

首先kexue上網，進入google雲端硬盤新建->更多->Google Colaboratory 創建了一個新的.ipynb文件可修改該文件的名稱使用google colab的GPU 運行代碼，點擊鏈接，操作

用之有弗盈

2020-06-27 21:12:58

深度學習實戰筆記三：編碼器、解碼器+mnist+kears

對matplotlib的解釋 import matplotlib.pyplot as plt import numpy as np a = [[1,2]] a = np.array(a) c = a[:,0]#‘：'表示：不管a中

用之有弗盈

2020-06-27 21:12:57

深度學習實戰筆記四：在自己處理的數據集上訓練CNN網絡並進行預測

#cnn 識別狗狗類別 #用類構造代碼 #dog圖片的訓練、保存 #預測以及結果輸出 import os import numpy as np from PIL import Image from keras.models im

用之有弗盈

2020-06-27 21:12:57

深度學習實戰筆記二：keras+cnn+mnist cnn模型的創建、保存、調用

google colab的使用、文件路徑設置參見上一篇博客：深度學習筆記一：google colab使用入門+mnist數據集入門+Dense層預測本節筆記參考了Mike高的視頻一個完整的cnn模型 #CNN mnist im

用之有弗盈

2020-06-27 21:12:57

postgresql（psql） windows安裝+ MIMIC III 下載+導入數據庫

本文參考了shuaban的視頻先總結步驟如下：先在psql官網下載數據庫安裝包根據大家反饋導入數據其他版本有問題，最好下載9.6版本安裝：下載之後一般安裝就行安裝過程值得注意的三點： ① 設置數據庫軟件的安裝位置

用之有弗盈

2020-06-27 21:12:46

從代碼案例入門keras1:LeNet對手寫數字Mnist分類

本系列文章適合有深度學習基礎（上過課，看得懂代碼，但是想自己上手覺得困難的初學者）首先上LeNet論文： ===Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner. (1998).Gradi

2020-06-27 06:26:38

查找海外人工智能相關資訊時可能會遇到的日語英語專業名詞術語整理（不定期更新）

大家可能日常xx上網翻閱一些國外的文獻參考，也需要搜索一些關鍵詞，這裏整理一些常用詞彙的中，日，英表現以供參考。由於留學狗平時時間也不多，所以不定期更新，多多諒解。（全是我一個一個手打的，轉載請標明出處）狀態空間表達式 state

2020-06-27 06:26:38

keras深度學習入門筆記附錄1：讓我們看看有多少種讓搭建好的模型開始跑的方式（fit 和 train on batch）

https://blog.csdn.net/timcanby/article/details/103620371 上一篇文章我們介紹了怎麼用keras寫一個最簡單的數字分類網絡，但是可能有同學會說我怎麼在不同地方看到的大家跑模型的方法都不

2020-06-27 06:26:38

keras入門筆記2:我們來玩卷積層（ Convolution Layer）～一層卷積層分類Mnist！

哈囉哈囉～繼之前的： keras深度學習入門筆記附錄1：讓我們看看有多少種讓搭建好的模型開始跑的方式（fit 和 train on batch） https://blog.csdn.net/timcanby/article/details

2020-06-27 06:26:38

深度學習入門之基本概念

1、機器學習：根據我的理解，機器學習就是讓電腦自動學習或者是訓練出一個好的模型來解決實際問題。圖一機器學習如上圖所示，模型類似於函數，輸入可能爲向量（圖像矩陣轉化爲向量輸入），輸出可能爲離散值如分類問題（比如手寫數字預測），也

2020-06-26 19:01:10

24小時熱門文章

最新文章

最新評論文章