原创 【置頂】本博客內容導讀(2019/10/28更新)

文章目錄版權說明1.程序類C#程序設計Java程序設計Python2.數據結構3.算法類4.設計思想GoF設計和23種設計模式經典工作法則和定律5. 應用開發數據庫技術6.項目開發LaTeX學習筆記開發工具與方法Linux開發工具

原创 自然語言理解難在哪兒?

文章目錄自然語言理解本質是結構預測自然語言理解的關鍵是語義表示自然語言有哪些特點創新性遞歸性多義性主觀性社會性自然語言理解難在哪結構語義表示空間構建多模態複雜語境的理解小結參考文獻 轉載來源:https://zhuanlan.z

原创 帶你理解樸素貝葉斯分類算法

文章目錄分類問題綜述樸素貝葉斯分類例題分析樸素貝葉斯算法的樸素一詞解釋樸素貝葉斯分類的優缺點 轉載來源:https://zhuanlan.zhihu.com/p/26262151 貝葉斯分類是一類分類算法的總稱,這類算法均以貝葉

原创 用Siamese和Dual BERT來做多源文本分類

文章目錄數據單個BERT雙路BERTSIAMESE BERT總結 轉載來源:https://mp.weixin.qq.com/s/cyNcVNImoCOmTrsS0QVq4w 導讀:使用不同的方式來使用BERT模型。 在NL

原创 什麼是語言?什麼是自然語言?

文章目錄一、什麼是語言?表達方式性質定義特性結構種類用途文字特徵符號性和系統性任意性和線條性不變性和可變性傳承性和交際性表徵加工生理機制語音知覺語言起源二、什麼是自然語言?簡介發展特點VB缺陷 轉載來源:https://blog.

原创 NLP 中的Mask全解

文章目錄Mask的作用處理非定長序列RNN中的MaskAttention中Mask防止標籤泄露Transformer中的MaskBERT中的MaskXLNet中的Mask 轉載來源:https://zhuanlan.zhihu.c

原创 Soft-Masked BERT:文本糾錯與BERT的最新結合

文章目錄一.文本糾錯示例與難點二.文本糾錯常用技術三、將BERT應用於文本糾錯四、文本糾錯最優模型:Soft-Masked BERT論文簡要分析檢測網絡 與 Soft Masking糾正網絡實驗結果五、立馬上手的糾錯工具推薦Ref

原创 微調預訓練模型的新姿勢——自集成和自蒸餾

文章目錄1、什麼是自蒸餾?2、爲什麼要自蒸餾?3、如何進行自蒸餾?4、通過自蒸餾我們可以得到什麼? 轉載來源:https://zhuanlan.zhihu.com/p/133804801 論文:Improving BERT Fi

原创 StringBuilder和String做字符串拼接時的性能比較

前言 本文簡單測試了 StringBuilder 和 String 在做連接時的性能差異。 測試原理 循環1萬次,連接相同字符串 “1234567890”,然後記錄 StringBuilder 和 String 的操作時間。 測試

原创 Kad算法模擬測試程序

目錄前言代碼解釋源代碼數據 前言 本代碼主要用於Kad算法的模擬測試,以理解其工作原理。 代碼解釋 在主函數中,首先會生成一個隨機的Kad網絡,然後通過輸入起點ID和終點ID,返回查找過程。本Kad網絡的容量爲 28,即共256個

原创 MD5算法的Java高效精簡的實現

源代碼 本文只給出了具體的實現,至於算法原理請參考相關文章。 注:本算法系數參考百度百科:MD5。 算法經過簡化後,如下所示。 public class MD5 { private static final int[]

原创 高效計算一個字節中所有的1的個數。

問題:高效計算一個字節中所有的1的個數 思路1:轉成字符串再輸出 這種方式效果肯定不好,因爲字符串效率低,所以不推薦(代碼略) 思路2:利用位的與計算 基本方法是對每一位進行與運行,如果是不是0,計數器就加1,這種效率還可以,代碼

原创 離散數學:異或的基本性質

1 異或定義 異或是一種位運行,數學符號記作 ⊕\oplus⊕,在程序中記爲 ^,如 a⊕ba \oplus ba⊕b 或 a^b。 異或滿足以下運行規則: 0⊕0=00⊕1=11⊕0=11⊕1=0 0 \oplus 0 = 0\

原创 自然語言處理(NLP)語義分析--文本分類、情感分析、意圖識別

文章目錄第一部分:文本分類一、文本預處理(解決特徵空間高維性、語義相關性和特徵分佈稀疏)二、文本特徵提取三、分類模型第二部分:情感分析一、概述二、基於情感詞典的情感分類方法三、基於機器學習的情感分類方法第三部分:意圖識別一、概述二

原创 NLP中的自監督表示學習

文章目錄1. 預測中心詞2. 預測鄰居詞3. 相鄰句子的預測4. 自迴歸語言建模5. 掩碼語言建模6. 下一個句子預測7. 句子順序的預測8. 句子重排9. 文檔旋轉10. 表情符號預測 轉載來源:https://mp.weixi