原创 《利用條件隨機場實現中文病歷文本中時間關係的自動提取》——閱讀筆記

摘要 提出一種基於CRF的時間關係提取算法。以經過醫學問題和時間信息語義標註的病歷爲訓練內容,時間關係結果標註採用以醫學問題爲中心的模式。以63份實際病歷作爲實驗文本。 引言 時間關係非常重要,如,哥倫比亞大學Zhou等開發的Ti

原创 《概率統計與隨機過程》——筆記3

第三章 二維隨機變量 3.1 聯合分佈 定義1 設試驗E的樣本空間爲S={e},而X=X(e),Y=Y(e)是定義在S上的兩個隨機變量。稱由這兩個隨機變量組成的向量(X,Y)爲二維隨機變量或二維隨機向量。 定義 2 設(X,Y)

原创 《線性代數》——讀書筆記2

第二章 矩陣 寫在前面的話,當初去北大面試的時候,那老師問了我好些矩陣的知識,我也真是醉醉的,他和我說知道就說,不知道也沒關係,我就想問沒關係那你還問個什麼=-=,現在趕緊好好複習下,省的以後再被問到=_= 話說矩陣這邊的東西怎

原创 《機器學習》——讀書筆記1

寫在前面的話:周志華老師的這本書,我多次嘗試閱讀了,=-=,但卻每次都堅持不下來,最後只是一個不明真相的吃瓜羣衆。每次心中卻隱隱較着勁似得想要重頭讀一遍,這次恰逢年關,趁此閒暇,好好拜讀一番! 第一章 緒論 1.1 引言 通過買西

原创 《線性代數》——讀書筆記1

第一章 行列式 1.1 n階行列式 1.1.1 排列與逆序 定義 1.1.1 由自然數1,2,…,n組成的一個有序數組稱爲一個n階排列,記爲j1,j2...jn 。按數字的自然排序由小到大的n階排列123…n稱爲標準排列或自然排列

原创 《機器學習》——讀書筆記2

事實證明,寒假在家也並不能高效工作,年前準備過年,年後沒事了,想動手卻凍手,幸好姥姥家裏暖和,過年姥姥又傷風感冒,姥姥今年74,姥爺今年81,今天本來到邢臺的,但是放心不下又回來了,願姥姥姥爺健康長壽,別無他求。 第 3 章 線性

原创 《概率統計與隨機過程》——筆記1

第一章 隨機事件的概率 1.1 隨機事件與樣本空間 1.1.1 隨機試驗與隨機事件 試驗:各式各樣的科學實驗或對某一事物的某種特性的觀察。 隨機試驗:如果在相同的條件下可以重複進行,而且每次試驗的結果事前不可預言,簡稱試驗。

原创 《機器學習》——附錄

A矩陣 A.1 基本演算 轉置矩陣 (A+B)T(AB)T=AT+BT=BTAT(1)(2) 逆矩陣(AT)−1(AB)−1=(A−1)T=B−1A−1(3)(4) 矩陣的跡,對於n階方陣A,它的跡是主對角線上的元素之和,

原创 《面向慢性病的中文健康問答框架研究與實現》——筆記

第 1 章 引言 1.1 研究背景 1.1.1 互聯網時代的健康服務 醫療健康產業發展帶來了大量的數據。 1.1.2 數據處理技術的發展 數據庫技術、數據挖掘技術、自然語言處理技術的發展。 1.1.3 人口老齡化和慢性病現狀 即有

原创 《A comprehensive study of named entity recognition in Chinese clinical text》——筆記

該文章與哈工大的《中文電子病歷命名實體識別研究_曲春燕》的工作有些相似,屆時對比閱讀! ABSTRACT Objective The goal of this study was to systematically investi

原创 《大規模圖數據匹配技術綜述》——筆記

摘要 在大規模圖數據上進行高效地查詢、匹配是大數據分析處理的基礎問題。從應用角度對圖查詢的圖數據匹配技術的研究進展進行綜述,根據圖數據的不同特徵以及應用的不同需求對圖匹配問題分類進行介紹。同時,將重點介紹精確圖匹配,包括無索引的匹

原创 《概率統計與隨機過程》——筆記2

第2章 隨機變量及其分佈 2.1 隨機變量 定義 1 設隨機試驗E的樣本空間S={e}。若對每個試驗結果e,都有確定的實數X(e)與之對應,則稱實值變量X(e)爲隨機變量,簡記爲X。 引入隨機變量後,隨機事件就可以用隨機變量的取

原创 《Named Entity Recognition in Chinese Clinical Text Using Deep Neural Network》——筆記

Abstract We investigated a novel deep learning method to recognize clinical entities in Chinese clinical documents

原创 《中文電子病歷實體關係抽取研究》——筆記

摘要 本文首先對電子病歷去隱私,制定了隱私信息標註規範,使用條件隨機場完成了隱私信息識別模型的構建。 使用992份經去隱私的已標註中文電子病歷,首先實現了基於特徵的關係抽取方法,通過抽取一些基本特徵以及中文電子病歷中一些特有的特

原创 《Joint segmentation and NER using dual decomposition in Chinese discharge summaires》——筆記

ABSTRACT 三方面的工作: - 標註一箇中文出院小結的標準語料集 - 在該數據集上進行,分詞和命名實體識別 - 建立一個分詞和命名實體識別的聯合模型 提出了一個聯合模型,使用雙重分解來執行兩個任務,設計了三組特