原创 知識圖譜 每日閱讀(三)

概率圖模型 本節詳細介紹一下概率圖模型,概率圖模型比如隱馬爾可夫模型和條件隨機場模型在實體識別、自然語言處理的過程中:分詞、關鍵詞提取部分都會用到。 首先概率圖模型可大致分爲兩類:第一類是使用有向無環圖表 示變量間的依賴關係,稱爲有向圈模

原创 MAC搭建阿里雲服務器並訪問頁面

本人在校研究生一枚,趁着學生認證還可以用,搭建了阿里雲服務器。 第一步:註冊併購買阿里雲服務器。 根據自身情況需要選擇服務器,我購買的是輕量應用服務器。 選擇重置系統,我使用的是Ubuntu。修改防火牆添加8080端口。 然後可以重

原创 基於BERT做中文文本分類(情感分析)

Bert: BERT是一種預訓練語言表示的方法,這意味着我們在大型文本語料庫(例如Wikipedia)上訓練通用的“語言理解”模型,然後將該模型用於我們關心的下游NLP任務,BERT優於之前的方法,因爲它是第一個用於預訓練NLP的無監督,

原创 ELECTRA實現文本多分類

相關論文:  ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators. 一、環境搭建(以下爲我建立的環境): Tensorflow==1.1

原创 知識圖譜 每日閱讀(四)

論文名稱: 《Variational Reasoning for Question Answering with Knowledge Graph》 (基於知識圖譜的變分推理) 論文來源: AAAI Conference on Artifi

原创 自然語言處理 第二節

自然語言處理 第二節 1.存在的問題 分類學表徵存在一個普遍問題,之前幾乎所有的NLP研究,除了深度學習外的NLP外,都是用了原子符號來表示單詞。如果使用神經網絡來考慮這個問題,那麼使用原子符號就像是使用一個只有一個位置是1,其他位置時0

原创 自然語言處理 第一節

什麼是自然語言處理 自然語言處理是人工智能的一部分,人工智能還有其他部分:計算機視覺、知識表示和推理等。語言是人工只能中一個非常特殊的部分,因爲語言是人類特有的屬性,而對於計算機視覺來說,地球上有很多生物都有相當不錯的視覺系統。因此自然語

原创 基於chatterbot製作聊天機器人

一、環境搭建 python 3.6 安裝chatterbot  安裝方式: 1.在項目目錄下pip install chatterbot進行安裝 2.下載源碼,運行setup.py進行安裝 本人嘗試使用第一種安裝方式失敗後,下載源碼進行安

原创 《機器學習》學習筆記

  第二章  模型評估與選擇 一、經驗誤差與過擬合 錯誤率:通常我們把分類錯誤的樣本數佔樣本總數的比例稱爲"錯誤率" (error rate) ,即如果在 m 個樣本中有 α 個樣本分類錯誤,則錯誤率 E= α/m。 誤差:把 學習器的實

原创 基於 CRF 的中文命名實體識別模型實現

CRF即條件隨機場在前面的博客中提到過,這次做一個實驗“基於 CRF 的中文命名實體識別模型實現”,首先需要掌握的是瞭解實體識別,這在前面的“知識圖譜每日閱讀(二)”中有詳細介紹,條件隨機場在知識圖譜每日閱讀(三)”中有詳細介紹,需要更深

原创 知識圖譜 每日閱讀(二)

知識圖譜中實體識別、實體抽取是一個十分重要的過程。它與自然語言處理密不可分。本篇將介紹自認語言處理中的預處理過程,幫助更好的理解實體抽取。 1.獲取語料庫 自然語言處理首先需要有數據,數據可以來自現有的語料庫,開放網站上提供了一些語料庫網

原创 知識圖譜每日閱讀(一)

論文題目:知識圖譜技術綜述 論文作者:徐增林,盛泳潘,賀麗榮,王雅芳 論文關鍵字:知識融合; 知識圖譜技術; 知識表示; 開放互聯; 語義處理 論文來源:電子科技大學學報 第45卷 第4期 摘要部分介紹了萬維網、語義網的發展背景,點出了當

原创 實現微信的二次分享(自定義圖片、文字等)

參考:官網微信JS-SDK說明文檔 使用方法: angular項目 步驟一:綁定域名 先登錄微信公衆平臺進入“公衆號設置”的“功能設置”裏填寫“JS接口安全域名”。 備註:登錄後可在“開發者中心”查看對應的接口權限。 微信授權賬號:微信授

原创 基於知識圖譜的簡單知識問答系統

作者寄語: 剛開始接觸知識圖譜不久,看過一些知識圖譜視頻及論文後,想自己親手做實驗來驗證下所學的知識。於是開始在網上查看各種實驗,找到了一個比較全面的實驗,能更讓人理解這裏面的層層關係:如何構建本體,如何獲取數據,如何將數據錶轉成三元組關

原创 使用scrapy框架爬蟲並將數據保存到MySQL數據庫

作者寄語: 這兩天主要研究了一下爬蟲,看了一些爬蟲代碼,整理了一些最簡單的爬蟲入門,也遇到很多坑,希望能幫助和我一樣的初學者。 這篇文章主要講了如何使用python實現簡單的爬蟲,並將爬取的數據保存到數據庫中,使其結構化,因爲平時