原创 pytorch小試

pytorch小試   之前一直使用Tensorflow寫程序,今天初學pytorch來實現一個簡單的迴歸模型。迴歸模型即給定一組樣本特徵 xxx (相當於超空間中的點),訓練一個簡單的線性函數來擬合它們 y=wx+by=wx+b

原创 強化學習(六):時序差分方法

強化學習(六):時序差分方法   時序差分(TD)方法結合了動態規劃與蒙特卡洛的思想,其可以像蒙特卡洛方法一樣直接從智能體與環境互動的經驗中學習,而不需要知道環境的模型,其又可以像動態規劃一樣無須等待交互的結果,可以邊交互邊學習。

原创 論文解讀:Reinforcement Learning for Relation Classification from Noisy Data

論文解讀:Reinforcement Learning for Relation Classification from Noisy Data   本文是一篇以強化學習來解決遠程監督關係抽取中噪聲的問題。強化學習作爲一個比較新的機

原创 [PPT]一種在多核環境下用於大規模線性分類的並行對偶座標下降法

一種在多核環境下用於大規模線性分類的並行對偶座標下降法   課程需要完成閱讀一篇文章,因此挑選本篇論文作爲講解,論文名稱爲《Parallel Dual Coordinate Descent Method for Large-sca

原创 論文解讀:Knowledge Base Relation Detection via Multi-View Matching

論文解讀:Knowledge Base Relation Detection via Multi-View Matching   關係檢測(Relation Detection)是知識庫問答的核心步驟,有時候也被稱爲關係匹配(Re

原创 HeapSort堆排序原理與實現

HeapSort堆排序原理與實現   堆排序是比較重要的數據結構,其主要優點是通過排序二叉樹的特性能夠記錄每個數之間的大小關係,以至於不需要重複比較,對於海量數據排序問題可以減少時間複雜度。 一、基本概念 (1)大根堆(大頂堆):

原创 論文解讀:Improving Question Answering over Incomplete KBs with Knowledge-Aware Reader

論文解讀:Improving Question Answering over Incomplete KBs with Knowledge-Aware Reader   知識庫問答(KBQA)是一種領域問答系統(Domain QA)

原创 論文解讀:A Hierarchical Framework for Relation Extraction with Reinforcement Learning

論文解讀:A Hierarchical Framework for Relation Extraction with Reinforcement Learning   關係抽取是一項比較基礎的自然語言處理任務,而聯合實體和關係抽取

原创 基於深度學習的知識圖譜綜述

基於深度學習的知識圖譜綜述 摘要:隨着現如今計算機設備的更新,計算能力的不斷提高促使深度學習再一度推上熱門技術,深度學習已經廣泛應用於圖像處理、文本挖掘、自然語言處理等方面,在醫學、交通、教育、旅遊等行業發揮極大地作用。知識圖譜也

原创 [轉載收藏]隨機採樣方法整理與講解(MCMC、Gibbs Sampling等)

本文僅爲轉載收藏,供個人學習。 轉載地址:https://www.cnblogs.com/xbinworld/p/4266146.html 本文是對參考資料中多篇關於sampling的內容進行總結+搬運,方便以後自己翻閱。其實參

原创 強化學習(八):Dyna架構與蒙特卡洛樹搜索MCTS

強化學習(八):Dyna架構與蒙特卡洛樹搜索MCTS   在基於表格型強化學習方法中,比較常見的方法有動態規劃法、蒙特卡洛法,時序差分法,多步引導法等。其中動態規劃法是一種基於模型的方法(Model-based),因爲它的前提是必

原创 強化學習(七):n步自舉法(多步引導法)

強化學習(七):n步自舉法(多步引導法)   在之前,我們知道求解有限馬爾可夫決策過程可以通過蒙特卡洛和時序差分來通過與環境多次交互從經驗中學習,然而,蒙特卡洛方法在一些不滿足分幕式任務或連續型任務上無法獲得最終的收益,因此我們引

原创 強化學習(五):蒙特卡洛採樣方法

強化學習(五):蒙特卡洛採樣方法   在強化學習(四)中,我們學習瞭如何使用動態規劃法求解強化學習問題,我們還學習了策略評估和策略改進,以及廣義策略迭代(GPI),事實上,動態規劃能夠很好地收斂到最優值,但是否動態規劃就是最好的呢

原创 Pytorch使用LSTM實現Movie Review數據集情感分析

Pytorch使用LSTM實現Movie Review數據集情感分析   入門Pytorch一週時間,週六試着手寫情感分類代碼。學過Tensorflow的都知道,其需先生成計算圖,還得通過placeholder喂入數據,十分的麻煩

原创 論文解讀:Denoising Distant Supervision for Relation Extraction via Instance-Level Adversarial Training

論文解讀:Denoising Distant Supervision for Relation Extraction via Instance-Level Adversarial Training   本文是一篇以生成對抗網絡爲出