原创 ubuntu下安裝crf++遇到的一個問題

遇到過兩次,在網上也找了許多資料,但是大多數都是忽悠人的,在這裏寫下我自己的解決方法。 對於這個問題的處理網上很多說在path.h或者在node.cpp中引入#include<stdlib.h>,是的,引入之後是能解決這個問題,但是新的問

原创 聚類系列-KMEANS

k-means聚類算法是聚類算法中應用非常廣泛的一種算法。它是屬於劃分法的一種,是一種基於距離的聚類方法,在聚類的開始需要指定一個K值,表示需要聚類的數目。 k-means聚類算法的思想非常容易理解:拿到待聚類的N個樣本和需要聚類的數目K

原创 聚類系列-概述

         本系列要講解一下本人這一段時間工作中 使用聚類來做的一些事情,第一次寫博客大家不喜勿噴,有錯誤請及時指出,本人一定改正。          聚類,在百度百科中的介紹是將物理或抽象對象的集合分成由類似的對象組成的多個類的過

原创 用.sql文件通過navicat導數據到mysql中,大文本會顯示BLOB的問題

用.sql文件通過navicat導數據到mysql中,大的文本會出現如下圖所示的顯示,就是不顯示內容,只顯示一個BLOB 具體的修改方法,右鍵表-》設計表,將相應的列的的類型改成text,再把字符集和排序規則修改,最後保存,按照以下格式

原创 聚類系列-Affinity Propagation

    今天我們來討論一個新的聚類算法-Affinity Propagation,(我喜歡叫它“親和信息傳播算法”,這是我的個人叫法,可能不專業也不準確)。顧名思義,親和信息傳播涉及到兩個方面,一個是親和信息,一個是傳播,下邊我們就圍繞

原创 聚類系列-譜聚類(spectral clustering)

聚類講到此,也是我聚類系列的最後一篇博客了,最後一篇的話我們就來講一下譜聚類。     譜聚類(spectral clustering)是一種基於圖論的聚類方法,主要思想是把所有的數據看做空間中的點,這些點之間可以用邊連接起來。距

原创 Python 簡單實現KNN算法

數據集是自己下載的mnist的手寫識別的數據,有一個train.csv文本,一個test.csv測試文本,還有一個submission.csv文本(存放的是test.csv的標籤),不多說了,KNN原理很簡單,直接上代碼吧 #autor