原创 第九章:基於深度學習的醫藥保險命名體識別

9.1 電子病例背景介紹 近年來,在電子病歷文本上應用自然語言處理、信息抽取等技術服務於臨牀決策支持的研究倍受關注。這個過程分爲兩個不同的階段: 1.自然語言處理研究主要關注病歷文本的預處理,包括句子邊界識別、詞性標註、句法分析等; 2.

原创 第八章:深度學習之循環神經網絡與遞歸神經網絡

8.1 循環神經網絡與遞歸神經網絡的區別與聯繫 1.循環神經網絡(recurrent neural network)是時間上的展開,處理的是序列結構的信息,是有環圖,模型結構如下: recurrent: 時間維度的展開,代表信息在時間維

原创 第七章:深度學習之卷積神經網絡

7.1 BP神經網絡 手推BP神經網絡見PPT 7.2 卷積神經網絡介紹 幾個知識點: 1.卷積神經網絡(Convolutional Neural Network, CNN)是深度學習技術中極具代表的網絡結構之一。CNN相較於傳統的算法避免

原创 第六章:表徵學習與關係嵌入

6.1 語言模型 詞向量模型與語言模型非常緊密地交織在一起。語言模型的質量評估是基於它們對詞語用概率分佈的表徵能力。事實上,許多最先進的詞向量模型都在攻堅的任務就是已有一串詞語序列,預測下一個出現的詞語將會是什麼。 語言模型是幹嘛的?chu

原创 第五章:N-GRAM

5.1 N-GRAM介紹 N-Gram是基於一個假設:第n個詞出現不前n-1個詞相關,而不其他任何詞不相關。(這也是隱馬爾可夫當中的假設。)整個句子出現的概率就等於各個詞出現的概率乘積。各個詞的概率可以通過語料中統計計算得到。假設句子T是有

原创 第四章:依存句法和語義依存分析

4.1 依存句法分析 依存語法 (Dependency Parsing, DP) 通過分析語言單位內成分之間的依存關係揭示其句法結構。 直觀來講,依存句法分析識別句子中的“主謂賓”、“定狀補”這些語法成分,並分析各成分之間的關係。 上面的例

原创 第二章:NLP常用開發工具包

1.NumPy numpy系統是Python的一種開源的數值計算包。 包括:1、一個強大的N維數組對象Array;2、比較成熟的(廣播)函數庫;3、用於整合C/C++和Fortran代碼的工具包;4、實用的線性代數、傅里葉變換和隨機數生成函

原创 第三章:分詞、詞性標註及命名實體識別介紹及應用

3.1 分詞、詞性標註及命名實體識別介紹及應用 分詞 ==中文分詞==(Chinese Word Segmentation) 指的是將一個漢字序列切分成一個一個單獨的詞。分詞就是將連續的字序列按照一定的規範重新組合成詞序列的過程。 中文/n

原创 第一章:NLP簡介

第一章:NLP簡介 NLP是什麼? •NLP( Natural Language Processing ) 是 自然 語言 處理 的 簡稱,是研究人與計算機交互的語言問題的一門學科。機器理解並解釋人類寫作與說話方式的能力。近年來,深度學習技

原创 python筆記(一)

字符串處理單雙引號一樣.title():將每個單詞的首字母變爲大寫,其餘小寫(不管原來是什麼樣).upper():將字符串中所有字母變爲大寫.lower():將字符串中所有字母變爲小寫.strip():刪除行首和行末的空白(空格和製表符)(

原创 編譯安裝Nginx實現網絡訪問多虛擬主機(wordpress+phpmyadmin)

一、安裝Nginx    後面會有一篇博客專門介紹Nginx,在這篇博客中僅僅介紹如何安裝Nginx並配置,使其實現多個虛擬主機,分別根據不同的域名訪問wordpress和phpMyadmin,對於這兩個軟件已經使用apache進行過配置,

原创 使用Python將PDF轉換成圖片

    必須在Linux環境下,使用到的環境和工具:CentOS7+Python3.6+pdf2image+poppler        首先要在系統中安裝poppler,這是一個用於呈現可移植文檔格式(PDF)文檔的免費軟件實用程序庫一、

原创 搭建螞蟻筆記(服務器)

    爲了能將筆記保存在自己的服務器上,可以使用螞蟻筆記這款軟件一、環境配置    使用的Linux版本爲CentOS7,搭載在騰訊雲中二、安裝MongoDB     具體內容可以查看:https://www.cnblogs.com/be

原创 python功能筆記——雜七雜八

×××複習階段,無聊弄點東西玩一下,實現功能有(控制瀏覽器訪問學校校歷,截圖保存下來,通過圖片處理,最終將其設置爲桌面):    1.控制瀏覽器訪問網頁;    2.將網頁截圖;    3.圖片處理(圖片合併、圖片換色);    4.調用w

原创 自動化之安裝操作系統——PXE

    PXE:Preboot eXecution Everionment,Intel公司開發的預啓動執行環境,使用這套環境能夠使我們在爲大量的計算機部署操作系統的時候,不必在每一臺新主機上部署操作系統,而是讓其自動安裝,我們只需要讓機器開