序列向量化

DeepIntent模型

文獻：Zhai S, Chang K H, Zhang R, et al. DeepIntent: Learning Attentions for Online Advertising with Recurrent Neural Networks[C]// KDD 2016:1295-1304.

思想

從pooling的角度來解釋attention機制，last pooling（選擇RNN的最終隱輸出作爲序列表示向量）存在“遠距離信息容易遺忘”的問題；mean pooling(將RNN的各個時刻對應輸出進行簡單平均）存在“無法區分各個term對用戶意圖的貢獻度的差異”的問題；max pooling(對RNN的所有時刻對應的輸出向量的分量取最大值）存在與mean pooling類似的問題. 提出如下的attention pooling:

h=∑t=1Tatht , 其中at=exp(s(ht;θ))∑Tt=1exp(s(ht;θ))

s(ht;θ) 爲注意網絡，主要用來學習權重係數at , 網絡結構如下：

以查詢log文件構造有監督學習的數據集：(q,d+) ，(q,d−i) , 分別表示查詢序列q，與q誘發的點擊d+ , q查詢下並沒有點擊(q,d−i) , 有如下目標函數：

J(θ)=−∑(q,d+)logexp(score(q,d+))exp(score(q,d+))+∑ni=1exp(score(q,d−i)) s.t. score(q,d)=hq(q)Thd(d)

CSE模型(Conceptual Sentence Embedding)

文獻：Wang Y, Huang H, Feng C, et al. CSE: Conceptual Sentence Embeddings based on Attention Model[C]// ACL 2016:505-515.

思想

爲了解決一詞多義問題，將概念與注意機制相結合來實現文本序列的嵌入表示，使得相同的詞在不同概念中有不同的向量表示形式。
啓發於CBOW與Skip-gram的思想”在預測中心目標詞或局部語境詞時，需要對詞進行向量化”，提出類似思想“在預測中心目標詞或局部語境詞時，需要對句子進行概念相關向量化”：

模型：（1） CBOW-CSE ；（2）Skip-Gram-CSE

每個句子有其ID，利用基於知識的文本概念化算法獲得句子的概念分佈θC ,W 與S 分別爲單詞向量列空間與句子向量列空間，C 是將句子概念分佈θC 轉化爲概念向量c 的固定線性算子。
在對CBOW-CSE的模型參數W，S，U 與b 進行估值時，並沒有考慮中心目標詞的各語境詞之間的相對位置，也就是說，忽略了語境詞的順序，這會降低句子向量化性能。

Skip-Gram-CSE：忽略輸入中的語境詞，而從輸出中的定長語境隨機選取語境詞進行預測。預測語境窗口內的一個語境詞向量實質上就是給定句子向量s 與其概念向量c 的多分類問題。該模型的參數爲S，U 與b 。

Attention-CSE：CBOW-CSE與Skip-Gram-CSE都需要確定語境窗口大小，這是個難題。太大可能會引入無關詞，太小可能會排除相關詞。這是由於這些模型是採用同等重要的方式來處理語境窗口內的詞語。爲此，引入注意機制以區別對待語境窗口內的詞語。即將CBOW中的ct=12k∑−k⩽c⩽k,c≠0wt+c 修改爲ct=12k∑−k⩽c⩽k,c≠0at+c(wt+c)⋅wt+c , 其中at+c(wt+c) 是t+c 位置上的詞語的權重。具體計算方法如下：

ai(w)=edw,i+ri∑−k⩽c⩽k,c≠0edw,c+rc

其中dw,i∈D|V|×2k 表示詞語w 的2k 個位置語境詞中的第i 位置語境詞的權重，ri∈R2k 是各個距中心詞相對位置的語境詞的對應偏差。

Attention-CSE（參數包括：W，C，S，D，R）

DeepIntent模型

思想

CSE模型(Conceptual Sentence Embedding)

思想

如何使用 JS 判斷用戶是否處於活躍狀態

Mono 支持LoongArch架構

lightdb秒級增加列和刪除列（not null帶默認值）

lightdb數據庫超時相關控制參數

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

❤️‍🔥 Solon Cloud Event 新的事務特性與應用

網絡爬蟲的祕密：如何高效地抓取JD.com視頻鏈接

lightdb mysql 8.0兼容之不可見主鍵

使用 JS 實現在瀏覽器控制檯打印圖片 console.image()

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（四）使用域名訪問網站應用

答案選取(基於嵌入表示的相似度量)

面對稀疏噪聲的有標籤數據時如何改造通用詞嵌入表示

基於語義知識不等式的詞嵌入

面向語義對比分析的詞嵌入

繼續dropout

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結