原创 Go語言學習筆記(一)

原文請參考:http://www.runoob.com/go/go-tutorial.html Go 是一個開源的編程語言,它能讓構造簡單、可靠且高效的軟件變得容易。 Go是從2007年末由Robert Griesemer, Rob

原创 Go語言學習筆記(三)

1.Go語言變量 2.Go語言常量 3.Go語言運算符 1.Go語言變量 變量來源於數學,是計算機語言中能儲存計算結果或能表示值抽象概念。變量可以通過變量名訪問。 Go 語言變量名由字母、數字、下劃線組成,其中首個字符不能爲數字。 聲

原创 Go語言學習筆記(二)

Go 語言基礎語法 上一章節我們已經瞭解了 Go 語言的基本組成結構,本章節我們將學習 Go 語言的基礎語法以及基本數據類型。 Go 標記 Go 程序可以由多個標記組成,可以是關鍵字,標識符,常量,字符串,符號。如以下 GO 語句由

原创 Go語言學習筆記(四)字符串

字符串 字符串是 UTF-8 字符的一個序列(當字符爲 ASCII 碼時則佔用 1 個字節,其它字符根據需要佔用 2-4 個字節)。UTF-8 是被廣泛使用的編碼格式,是文本文件的標準編碼,其它包括 XML 和 JSON 在內,也都使

原创 Git開發規範學習筆記

代碼庫 master分支爲線上代碼,發版人員在發版前負責將任務分支合入master,開發人員不得擅自改動 develope分支爲迴歸測試分支,任務分支在提測通過後,開發人員應將代碼及時合入develope分支,以便提前解決多任務合併

原创 深度學習筆記(一)——感知器

啥事深度學習 在人工智能領域,有一個方法叫做機器學習。在機器學習這個方法裏,有一類算法叫做神經網絡。 神經網絡: 上圖中每個圓圈都是一個神經元,每條線表示神經元之間的鏈接。我們可以看到,上面神經元被分了很多層,層與層之間的神經元是有

原创 放棄幻想,全面擁抱Transformer:NLP三大特徵抽取器(CNN/RNN/TF)比較

今日有幸閱讀了一篇非常有意思的乾貨,僅此存留。 作者 | 張俊林,中國中文信息學會理事,目前在新浪微博 AI Lab 擔任資深算法專家。在此之前,張俊林曾經在阿里巴巴任資深技術專家,以及在百度和用友擔任技術經理及技術總監等職務。同時他

原创 BERT的學習理解筆記

BERT的理解 從模型的創新角度看一般,創新不大,但在機器閱讀理解頂級水平測試SQuAD1.1中表現出驚人的成績:全部兩個衡量指標上全面超越人類,並且還在11種不同NLP測試中創出最佳成績,包括將GLUE基準推至80.4%(絕對改進7

原创 BERT相關論文、文章和代碼資源彙總

BERT最近太火,蹭個熱點,整理一下相關的資源,包括Paper, 代碼和文章解讀。 1、Google官方: BERT: Pre-training of Deep Bidirectional Transformers for Lang

原创 怎樣區分線性和非線性_線性與非線性的區別(線性分析、線性模型)

一直對線性非線性沒有很準確的定義認識,今天特意查了查,特此記錄下。 怎樣區分線性和非線性 1.線性Line,是指量與量之間按照比例成直線關係,在數學上可理解爲一階導數是個常數;    非線性non-line則指不按照比例不成直線關係,一節

原创 最小二乘法的擬合原理

一. 最小二乘法的擬合原理 根據《數學指南》書中的解釋: 圖2 《數學指南》中對最小二乘法的解釋 上面這段話,枯燥且無趣,大家不用厭惡,數學向來這個樣子。 現在,我們來慢慢認識上面這段話的意思,這句話的意思是說,擬合有兩個前提: 1.

原创 HanLP用戶自定義詞典源碼分析

HanLP用戶自定義詞典源碼分析 1. 官方文檔及參考鏈接 關於詞典問題Issue,首先參考:FAQ 自定義詞典其實是基於規則的分詞,它的用法參考這個issue 如果有些數量詞、字母詞需要分詞,可參考:P2P和C2C這種詞沒有分

原创 HanLP自定義詞典注意事項

對於詞典,直接加載文本會很慢,所以HanLP對於文本文件做了一些預處理,生成了後綴名爲.txt.bin的二進制文件。 這些二進制文件相當於緩存,避免了每次加載去讀取多個文件。 通過這種txt和bin結合的方式,HanLP一方面方便用戶編輯

原创 Hanlp源碼解析之中文分詞算法

詞圖 詞圖指的是句子中所有詞可能構成的圖。如果一個詞A的下一個詞可能是B的話,那麼A和B之間具有一條路徑E(A,B)。一個詞可能有多個後續,同時也可能有多個前驅,它們構成的圖我稱作詞圖。 需要稀疏2維矩陣模型,以一個詞的起始位置作爲行,終

原创 Java ArrayList使用技巧 - 從第一個List中去除所有第二個List中與之重複的元素

需求:從 mAllList 中去除所有 mSubList 中與之重複的元素 測試數據:mAllList 中包含100000個無序無重複字符串,mSubList 中包含50000個無序無重複字符串   方法一、ArrayList中提供的re