原创 Neo4j Vs JanusGraph Vs Tigergraph

做知識圖譜的一般需要用圖數據庫存儲及檢索,相對更加的直觀化。記得2年前做教育方向用到過Neo4j,速度的確是慢。目前比較流行的Neo4j、JanusGraph、TigerGraph等,JanusGraph是開源的,在騰訊和百度都有用。收集

原创 Golang的 Json string和Map互相轉換

在存儲的時候想把數據列表存儲成json string,但是在代碼使用的時候又覺得用map更快更方便。這個時候就需要相互轉換,下面是一個轉換的例子。 // Test for json and map converting package

原创 ImportError: cannot import name 'IncompleteRead'

採用apt-get install python3-pip安裝pip3後,一直提示:ImportError: cannot import name 'IncompleteRead'。網上找了一些方法來解決這個這個問題,嘗試了easy_in

原创 簡單的理解熵的概念

通常我們爲了量化分類效果的好壞,會引入信息增益(ID3)、信息增益率(C4.5)、基尼係數(CART)等。一般採用熵(Entropy)來度量信息增益。 ID3算法的核心思想就是以信息增益度量屬性的選擇,選擇分裂後能夠獲得最大信息增益的屬性

原创 OpenFST概覽

學習Kaldi首先需要了解OpenFST,之後才能夠深入的學習Kaldi,很多概念都是和OpenFSTaging相關的,而且如果要調整模型的準確率和速度也離不開OpenFST。那OpenFST究竟是什麼呢? 這裏有個OpenFST在Kal

原创 Linux安裝GCC 9.2.0

Linux操作系統目前一般自帶的GCC4.8.5或者4.9.2等等,相對比較老的版本,當然隨着操作系統版本升級,可能會加入一些pre-build-in的高級版本。有些功能的支持需要在GCC的或者G++的高級版本纔有的支持,比如之前我們用的

原创 MAC 安裝ES(Elastic Search)及Kibana

關於ES這裏先不多介紹了,先看下怎麼安裝ES吧。 這裏安裝的ES是基於JDK 1.8,需要先安裝JDK1.8,否則會提示requirement is not satisfied。 安裝JDK 1.8 1. 下載JDK1.8 可以到http

原创 Mac 連接MySQL數據庫的坑

1. 安裝MySQL 大家可以官網下載一步步的安裝,我用的是Mac,直接用brew命令安裝了,比較方便。 (base) ➜  backend git:(master) ✗ brew reinstall mysql 2. 安裝完成之後可

原创 查看Linux系統支持的指令集

查看Linux系統支持的指令集很簡單,這裏說一下爲啥需要這個信息。具體指令集的描述可以參考下百科:https://baike.baidu.com/item/%E6%8C%87%E4%BB%A4%E9%9B%86 指令集序列比較多,這裏主要

原创 查看本地分支對應的遠程分支

可以通過如下命令拉取遠程分支到本地: git checkout -b <本地分支> <遠程分支> 一般遠程分支是以origin開頭的,比如你的分支叫dev,那麼對應的遠程分支可能叫origin/dev。爲什麼用可能呢?你拉成本地分支的

原创 Docker 鏡像和容器管理

20分鐘時間,大家可以快速掌握Docker相關知識,首先得了解幾個概念。其實Docker和我們之前接觸的Virtual Box、VMWare、QEMU類似,只是Docker是簡單的進程級隔離管理方法。其中包括容器及鏡像兩個常用的概念,可以

原创 導出數據爲PDF

在工作中,有很多數據需要導出成PDF,比如賬單、數據報表、簡歷等等。有很多方法可以做PDF的導出,JAVA就有很好的組件可以做這個事情。可以根據項目做不同的選擇,下面我們簡單探討一下。 常用的導出方法對比調研對 常用PDF導出方法 調研對

原创 Kaldi的安裝與測試

Kaldi是一款基於C++的開源語音識別工具箱,根據官方的說法,可以再UNIX和Windows編譯並執行。(吐槽一下,最近kaldi的作者也是風雨漂泊,說是要來中國發展,希望能夠接觸到大牛)。無論語音識別還是語音評測,大部分公司都是基於這

原创 Centos升級到GCC7

GCC最近版本升的比較快,最近一個項目需要升級到GCC7,可以通過下載GCC7的包,然後按步驟編譯安裝,但是發現編譯時間太長了,其實有個簡單的Hack方法,把別人安裝好的GCC7的lib複製到自己的機器上,然後修改軟鏈到最新的GCC上就O

原创 Mac查看端口號佔用

Mac上查看端口號佔用可以使用 lsof,然後跟上對應的端口,比如要查8081佔用的情況: lsof -i tcp:8081 結果爲: (base) ➜ native git:(master) ✗ lsof -i tcp:8081