原创 SQL語句速查表

SQL語句AVG()NULLIF()DECIMAL()CAST()CASE..WHEN..ENDDISTINCTCOUNT()ROUND()MIN() AVG() AVG 函數返回數值列的平均值。NULL 值不包括在計算中。 SE

原创 NLP paper精讀(五)——Bag of Tricks for Efficient Text Classification

fastTextAbstractIntroductionModel architectureHierarchical softmaxN-gram featuresExperimentDiscussion and conclusio

原创 NLP paper精讀(五)——Efficient Estimation of Word Representations in Vector Space

詞向量AbstractIntroductionGoals of the PaperPrevious WorkModel ArchitecturesFeedforward Neural Net Language Model(NNLM

原创 三種梯度下降的對比——BGD、SGD、MSGD

梯度下降批量梯度下降(BGD)隨機梯度下降(SGD)小批量梯度下降(MBGD)Reference 梯度下降優化器有很多,但是本文僅僅討論梯度下降時所採用的數據量對效果的影響。從梯度下降的大類來分,可以分爲如下的三類: 三個梯度下降

原创 NLPpaper精讀(三)—— Attention Is All You Need

論文精讀——TransformerAbstractIntroductionBackgroundModel ArchitectureTransformer的整體架構圖編碼器和解碼器堆棧AttentionAttention在Trans

原创 實體鏈接——《Entity Linking with a Knowledge Base Issues Techniques and Solutions》淺析

實體鏈接綜述候選實體生成(Candidate Entity Generation)基於命名字典的技術實體頁面重定向頁面消歧頁面首段加粗字段Wikipedia文章中的超鏈接從本地文檔擴展表面的形式啓發式方法監督學習的方式基於搜索引擎

原创 實體鏈接調研總結

實體鏈接什麼是實體鏈接?實體鏈接的目前存在的問題實體鏈接的分類與流程實體鏈接從大類上可以分爲兩類:實體鏈接的流程:實體鏈接的一般方法候選實體生成構建規則維護詞表同義詞表縮寫全稱映射表別名詞表基於編輯距離召回實體基於詞向量相似性召回

原创 NLP進階之路——CS224n(一)

NLP緒論什麼是自然語言處理?NLP的層次NLP的應用人類語言的特殊之處什麼是深度學習爲什麼NLP很難?NLP語義層面的表示Reference 什麼是自然語言處理? 自然語言處理(NLP natural language proc

原创 機器學習中的數學基礎(2)——線性代數

線性代數基礎 矩陣的運算: 加法:對位相加 數乘:每位都乘 矩陣乘法 方陣纔有逆矩陣 矩陣求導 ∂Ax∂x=AT{\frac{\partial Ax}{\partial x}=A^T}∂x∂Ax​=AT 求導後爲係數矩陣的轉置

原创 NLP paper精讀(一)——Deep Learning

Deep Learning 論文筆記前言監督學習反向傳播算法卷積神經網絡使用深度卷積神經網絡進行圖像理解分佈式表示和語言處理循環神經網絡深度學習的未來Reference 本論文是人工智能領域三大牛人在2015年Nature上發表的

原创 深度學習筆記(1)

邏輯迴歸 邏輯迴歸雖然字面上是迴歸二字,但是它本質是一種解決分類問題的算法,最直觀的表達它就是一個Sigmod函數 Sigmod(x)=11+eω∗x+b{Sigmod(x)=\frac{1}{1+e^{\omega*x+b}}}

原创 面試常考算法

快速排序 def quick_partition(my_list, start, end): position = my_list[start] while start < end: while sta

原创 極大似然估計MLE

Reference https://blog.csdn.net/zengxiantao1994/article/details/72787849 https://blog.csdn.net/u011508640/article/det

原创 什麼是交叉驗證(Cross Validation)?

交叉驗證簡述常見方法1.簡單交叉驗證2.S折交叉驗證3.留一交叉驗證Reference 簡述 驗證是指的在機器學習模型訓練時對模型好壞程度的衡量。 交叉驗證就是一種常用的模型選擇方法,使用部分數據集進行驗證模型的有效性。 常見方法 常

原创 機器學習中的評價方法總結(正確率,精確率,召回率,F1值,ROC曲線,AUC面積,Loss)

機器學習中的評價指標詳解機器學習中的評價指標混淆矩陣正確率(準確率、Accuracy)精確率(Precision)召回率(Recall)P-R曲線F1-值(F1-Score)ROC曲線*示例代碼*Reference 機器學習中的評價指