读FastText文章

原創

2020-04-26 17:57

这篇博客主要针对Bag of Tricks for Efficient Text Classification文章的一些理解。主要是介绍FastText算法是速度多块，通过标签预测和情感分析两个任务来说明。

1. 模型的结构，文章中给出了这样的图

上图注解中提到，x1，x2，,xN都是一个词向量，那么hidden是对N个词的词向量求平均，那么具体怎么计算呢？

这个图不是非常直观能看出如何计算的，文章中提到了结构和cbow很类似，于是找到了介绍word2vec的文章，见下图

这里说明几点：

Hidden layer怎么算呢？文章中也给出公式了

x1，x2，xC均为词向量， V*1 ， W是V*N维，N表示隐藏层的神经元的个数，所以h的结构为N*V*V*1=N*1

对于FastText算法而言，隐藏层的平均同这里是一致的；

2. 损失函数

3.层次SoftMax

如果要分的类是非常非常多的，比如cbow中，需要根据上下文的词预测中间词，中间词的类别是巨大的，等同于词典的数量，

所以word2vec中用到了softmax，那么fasttext中也用到该技术

目标函数转变为：

4. 一些实验的结果

基于情感分析8个数据集

fasttext 用了5个epoch，学习率的集合为 0.05，0.1，0.2，0.5，如果用bigram，那么准确率有1%-4%的提升，如果用trigrams，准确率可以达到97.1%

参考:

https://arxiv.org/pdf/1607.01759.pdf Bag of Tricks for Efficient Text Classification

https://arxiv.org/pdf/1411.2738.pdf word2vec Parameter Learning Explained

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.