禁忌關係抽取
數據來源
尋醫問藥網站爬取的所有藥物按照藥物名稱去重之後的藥物數據集,共有12318個藥物
抽取方法
在尋醫問藥中的禁忌關係共有四種,其中
- 藥物-禁忌-成分、藥物-禁忌-疾病、藥物-禁忌-藥物三種禁忌關係的抽取方法爲:如果某種成分、疾病、藥物的表達出現在了該藥物的禁忌關係這一標籤下,則認爲該藥物的對於這種成分、疾病、藥物存在禁忌關係;
- 藥物-禁忌-病人屬性的禁忌關係的抽取方法爲:在該藥物的婦女兒童這一標籤下如果出現“禁忌”、“禁用”等詞語時認爲該藥物對於婦女兒童存在禁忌關係,在該藥物的中老年人用藥這一標籤下出現“禁忌”、“禁用”等詞語時認爲該藥物對於中老年人存在禁忌關係,在該藥物的兒童用藥這一標籤下出現“禁忌”、“禁用”等詞語時認爲該藥物對於兒童存在禁忌關係,在該藥物的禁忌這一標籤下如果出現“運動員”、“高空作業”等特殊人羣的描述方法時認爲該藥物對於這些特殊人羣存在禁忌關係。
結果展示
從尋醫問藥中共存在禁忌關係29165個,展示結果如下圖
藥物知識圖譜
叮噹快藥知識圖譜(婦科)
叮噹快藥知識圖譜本體
![image_1dd5ck2k4qqq97mgpt17311ihcp.png-56.6kB][17]
知識圖譜說明
- 實體
實體 | 數量 | 簡介 | 示例 |
---|---|---|---|
藥品 | 470 | 藥品sku | 10698301 |
商品一級分類 | 1 | 商品的第一級分類 | 中西藥品 |
商品二級分類 | 2 | 商品的第二級分類 | 婦科用藥、感冒用藥 |
商品三級分類 | 11 | 商品的第三級分類 | 乳腺疾病、更年期、清熱解毒、頭痛發燒 |
OTC標識分類 | 4 | OTC的的分類標籤 | 雙軌處方、OTC甲類 |
藥物分類 | 2 | 藥物的中西藥分類 | 中成藥、化學藥品 |
疾病 | 170 | 粒度比較粗的病人體徵 | 乳腺增生、乳腺外科、乳腺增生 |
病症 | 387 | 粒度比較細的病人體徵 | 經期乳脹,有結塊,月經不調,量少, |
成分 | 395 | 藥物的中藥材成分或化學式成分 | 浙貝母,當歸,赤芍,漏蘆 ,茜草,香附、醋酸甲羥孕酮,炔雌醇葡萄糖酸鈣,維生素E,維生素A,維生素D |
- 關係
關係 | 數量 | 簡介 | 示例 |
---|---|---|---|
藥物-禁忌-病人 | 714 | 某藥物不能用於患某種病的患者 | 阿莫西林膠囊-‘藥物-禁忌-病人’-孕婦 |
藥物-禁忌-藥物 | 0 | 某種藥物不能和另外一種藥物同時服用 | 磺胺藥-‘藥物-禁忌-藥物’-酵母片 |
藥物-禁忌-疾病或症狀 | 3618 | 患有該疾病的病人不能服用某種藥物 | 阿苯達唑顆粒-‘禁忌-藥物-疾病或症狀’-心功能不全 |
藥物-禁忌-成分 | 1148 | 該藥物不能和某種中藥材或者化學式共同服用 | 頭孢克洛分散片-‘藥物-禁忌-藥物’-酒精 |
包括 | 7496 | 在數據中存在的上下位關係 | 中西藥品-包括-婦科用藥、婦科用藥-包括-乳腺疾病 |
治療 | 6609 | 某藥物的可以治療疾病或症狀 | [同仁堂]乳核內消液-治療-乳腺增生、[同仁堂]乳核內消液-治療-經期乳脹、[同仁堂]乳核內消液-治療-有結塊 |
導致 | 13699 | 細粒度的症狀導致了粗粒度的疾病 | 經期乳脹-導致-乳腺增生、有結塊-導致-乳腺增生 |
包含 | 19 | 在臨牀用藥數據中的科室與部位的上下位關係 | 頭部-包含-眼部、頭部-包含-口部 |
- 屬性
所屬實體 | 屬性名 | 數量 | 示例 |
---|---|---|---|
藥品 | 商品名稱 | 470 | 藥品1的商品名稱是阿莫西林膠囊 |
藥品 | 通用名稱 | 470 | 藥品1的通用名稱是阿莫西林 |
藥品 | 規格 | 470 | 藥品1的規格是100mgx6粒 |
數據說明
- 構建知識圖譜過程中用到哪些數據
- 叮噹快藥提供的實例文檔
- 尋醫問藥網站爬取的藥品說明書數據
- 臨牀藥品使用中的科室、部位層級結構數據
- 構建知識圖譜過程(構建邏輯)
- 將叮噹快藥中的實體與屬性提取出來放在neo4j數據庫總
- 將尋醫問藥中的禁忌關係全部抽取出來放在CSV文件中
- 默認當尋醫問藥中的禁忌關係數據中的藥品名稱與叮噹快藥中的商品名稱或通用名稱相同時,認爲該禁忌關係也相同,則在neo4j數據庫中搜索對應的禁忌關係節點,當禁忌關係節點爲病人屬性、成分、疾病或症狀時,如果在現在的neo4j數據庫中存在則直接連接形成禁忌關係,如果不存在則新建該節點並連接形成禁忌關係;當禁忌節點爲藥物時,如果在現有neo4j 數據庫中不存在該節點則跳過該關係
- 一些需要注意的事情或者臨時小調整
- 可以調整在導入禁忌關係時是否添加那些在現有neo4j數據庫中不存在的禁忌關係節點
- 在連接禁忌關係時,使用的是藥品名是否相同來進行判斷,這種做法準確率有待驗證
- 在從尋醫問藥數據中抽取禁忌關係時,對於藥物-禁忌-疾病或症狀與藥物-禁忌-成分粗暴的採用了疾病或症狀或成分是否出現在了藥物的禁忌關係這一標籤下的方法,這種方法的準確性有待驗證
- 在提取禁忌關係時,採用的字典是基於規則清洗的,字典準確性有待提高