原创 [Solr] Solr8.5.2 安裝、中文分詞以及定時更新索引

  1.官網下載地址直接下載 zip格式即可 2.解壓下載的壓縮包即可完成Solr安裝。 3.打開DOS,路徑切換至solr_home\bin,執行命令:solr start –p 8983,將solr在8983端口運行,看到以下圖片就證

原创 [solr] solr Similarity:切換不同相似度計算方法

Similarity改變solr的打分機制; solr本身已經提供了幾種算法 org.apache.solr.search.similarities.BM25SimilarityFactory org.apache.solr.searc

原创 [solr] solr5.5.2配置結巴分詞工具

  爲什麼選擇結巴分詞 分詞效率高 詞料庫構建時使用的是jieba (python) 結巴分詞Java版本 下載 git clone https://github.com/huaban/jieba-analysis 編譯 cd jie

原创 [solr] solr 測試 (python、curl、界面 )

curl測試: curl http://121.40.86.204:8983/solr/test/select?q=681&rows=20&wt=json&indent=true 或 value='echo -n "海藍之謎

原创 [文本糾錯] pycorrector框架測試

pycorrector:https://github.com/shibing624/pycorrector pycorrector 中文文本糾錯工具。音似、形似錯字(或變體字)糾正,可用於中文拼音、筆畫輸入法的錯誤糾正。pytho

原创 [文本糾錯] pycorrector框架訓練

深度模型使用說明 Install 全自動安裝:pip install pycorrector 半自動安裝: git clone https://github.com/shibing624/pycorrector.git cd

原创 [文本語義相似] 基於bow的餘弦距離(sklearn實現)

  文本相似在問答系統中有很重要的應用,如基於知識的問答系統(Knowledge-based QA),基於文檔的問答系統(Documen-based QA),以及基於FAQ的問答系統(Community-QA)等。像 對於問題的內容,需要

原创 [語音識別] 06 基於DNN-HMM的語音識別系統

基於DNN-HMM的語音識別系統  

原创 [語音識別] 07 語言模型

語言模型

原创 [語音識別] 語音識別系統化整理

實踐誠可貴,理論價更高,若爲自由故,兩個皆可拋。  (語音識別感興趣的可以加微信:lp9628) [語音識別] 01 語音識別概述 [語音識別] 02 語音信號處理及特徵提取 [語音識別] 03 GMM以及EM算法 [語音識別] 04 隱

原创 [語音識別] 08 基於WFST的解碼器

基於WFST的解碼器

原创 [語音識別] 10 端到端語音識別

端到端語音識別               • Espnet: https://github.com/

原创 [python] python 虛擬環境構建 & GPU環境

  GPU/python環境配置與驗證。 (1)GPU加速型實例安裝NVIDIA GPU驅動及CUDA工具包:https://support.huaweicloud.com/usermanual-ecs/zh-cn_topic_01494

原创 [TextMatch框架] 生成詞雲

TextMatch TextMatch is a semantic matching model library for QA & text search … It’s easy to train models and to export

原创 [文本語義相似] 基於ngram-tf-idf的餘弦距離(sklearn實現)

文本相似在問答系統中有很重要的應用,如基於知識的問答系統(Knowledge-based QA),基於文檔的問答系統(Documen-based QA),以及基於FAQ的問答系統(Community-QA)等。像 對於問題的內容,需要進行