原创 owl文件導入Neo4j

前提: 1.下載擴展neosemantics jar包,將jar複製到neo4j/plugins目錄下。 注意:neosemantics jar包必須與Neo4J版本相匹配。 例如:neo4j-community-3.3.1與ne

原创 聚類(上)

1.概述 聚類分析(cluster analysis)是將樣品個體或指標變量按其具有的特性進行分類的一種統計分析方法。 對樣品進行聚類,稱爲樣品(Q型)聚類分析。其目的是將分類不明確的樣品按性質相似程度分成若干組,從而發現同類樣

原创 Cypher查找兩個節點間的全路徑

Cypher查找兩個節點間的全路徑

原创 貝葉斯分類器(上)

1.簡介 貝葉斯分類器的分類原理:通過某對象的先驗概率,利用貝葉斯公式計算出其後驗概率,即該對象屬於某一類的概率,選擇具有最大後驗概率的類作爲該對象所屬的類。 貝葉斯決策論(Bayesian decision theory)是概率

原创 聚類(下)

1.原型聚類 原型聚類亦稱“基於原型的聚類”(prototype-based clustering),此類算法假設聚類結構能通過一組原型刻畫,在現實聚類任務中常用。通常,算法先對原型進行初始化,然後對原型進行迭代更新求解。 1)

原创 NLP錯字糾正---pycorrector

原文鏈接:https://github.com/shibing624/pycorrector https://github.com/shibing624/pycorrector

原创 簡單QA:TF-IDF句子相似度計算

簡單介紹一下基於TF-IDF計算句子相似度,並得到問題對應的答案過程: 準備好問題文件,答案文件,問題與答案一一對應,例如: 對問題文件進行分詞、去停用詞預處理操作 建立TF-IDF模型,計算所提問題與模板問題中相似度,將滿

原创 Python依賴包pyhanlp的安裝說明

1.安裝JPype1; 2.安裝pyhanlp包:python setup.py install 注意:pyhanlp中requirements.txt中jpype1版本與安裝的JPype1的版本相匹配 3.有時候可能會報:Impor

原创 owl文件轉換爲rdf

1.下載jar包:http://www.l3s.de/~minack/rdf2rdf/ 2.將jar包與owl文件放在同一目錄下 3.在cmd或linux下,進入owl文件所在目錄,在終端執行: java -jar rdf2rdf-1

原创 編輯距離-相似度計算

import Levenshtein as lvst 編輯距離計算相似度 Levenshtein Distance def leven_distance(s1, s2): dis = lvst.distance(s1, s2) # 1

原创 python調用cmd

import os print(‘測試開始’) os.system(‘ipconfig’) print(os.popen(‘ipconfig’).read()) print(‘測試結束’)

原创 相似度距離

1.Levenshtein計算相似度距離 https://www.cnblogs.com/zangrunqiang/p/6752430.html

原创 知識圖譜&智能問答

1.智能問答介紹 https://baike.baidu.com/item/智能問答系統/2937588 2.知識圖譜與智能問答 https://www.jianshu.com/p/9a68a9f98e12 3.數據建模&本體建模–p

原创 循環神經網絡

一、循環神經網絡(Recurrent neural network,RNN ) 循環神經網絡的來源是爲了刻畫一個序列當前的輸出與之前信息的關係。從網絡結構上,循環神經網絡會記憶之前的信息,並利用之前的信息影響後面結點的輸出。即:循環神

原创 卷積神經網絡(一)

一、卷積神經網絡簡介 一個卷積神經網絡主要由以下5種結構組成: 1.輸入層: 輸入層是整個神經網絡的輸入,在處理圖像的卷積神經網絡中,它一般代表一張**圖片的像素矩陣**(三維矩陣)。三維矩陣的長和寬代表圖像的**大小**,深度代表圖