原创 基於Gate的ANNIE插件的中文信息抽取

        在上一篇文章《基於Gate的中文信息抽取API調用方式--未成功》中本來想採用Gate中的中文插件進行命名實體識別,但是沒有成功,最後只能通過擴展Gate中的ANNIE插件來實現了。        ANNIE是Gate中用

原创 Ubuntu Server 12.04安裝桌面環境以及配置VNC

        系統環境:Ubuntu Server 12.04         VNC主控端系統環境:Windows 7         因實際開發需要,採用VNC連接Ubuntu。         首先需要在Ubuntu Server

原创 我的2013年年終總結

       歷時兩天的我們部門的年終總結匯報剛結束,趁着餘溫我也總結一下自己的2013年。13年剛剛畢業開始工作,還是感想挺多的,收穫也挺大的,從年初找工作時候的迷茫、彷徨和焦急到現在工作漸漸步入正規,自己融入部門團隊。下面開始歷數一下

原创 基於Gate的中文信息抽取API調用方式--未成功

學習Gate快一週了,一直在看官方的英文文檔,卻一直收穫不到,想在自己的程序中通過API的方式實現調用Gate完成信息抽取。Gate中的ANNIE可以實現英文的命名實體識別,但是卻不支持中文,後來發現Gate提供了中文的插件即放於目錄pl

原创 JGibbLDA使用總結

最近在做基於LDA(Latent Dirichlet Allocation)的文本分類處理,開始學習和接觸了LDA,因爲代碼採用的是Java,所以我選擇的LDA開源工具是JGibbLDA,這個是LDA的Java版本實現,下載地址爲:ht

原创 採用Stanford Parser進行中文語法解析

      Stanford Parser是由StanforsNLP Group開發的基於Java的開源NLP工具,支持中文的語法分析,當前最新的版本爲3.3.0,下載地址爲:http://nlp.stanford.edu/softwar

原创 基於權值的句子情感分析

        主要目的是以句子爲基本單位,判斷句子的情感狀態。主要思路是對於句子中的每個詞語,根據一定規則賦予權值,統計句子所包含的所有詞語的權值之和,若權值爲正,則表示句子的情感狀態爲積極的,若句子的權值爲負,則表示句子的情感狀態爲負

原创 amCharts使用過程中出現的Invalid negative value for attribute width錯誤

採用amCharts做的圖形界面今天突然發現圖形顯示有問題,圖形橫座標沒法顯示,並且鼠標移動到圖形上沒有數據顯示。 並且查看頁面源碼也出現問題, 一直在查找問題,一直沒找到解決方法,浪費了一下午時間。 最後在一個英文網站上發現,原來數

原创 javascript中的數據類型、Object與Function

轉自http://blog.csdn.net/baiduforum/article/details/5381869 格式略有改動 1. 數據類型       javascript中包含6種數據類型:undefined、null、s

原创 java編譯原理

轉自http://blog.csdn.net/oyto12o/article/details/5274967 Java 虛擬機(JVM)是可運行Java 代碼的假想計算機。只要根據JVM規格描述將解釋器移植到特定的計算機上,就能保證經過編

原创 Ubuntu Server 12.10下安裝配置PyDev

本文是直接在Eclipse中安裝PyDev的,Eclipse版本是4.3.0 KEPLER。 啓動Eclipse,點擊Help-->Install New Software,在彈出的Install窗口中點擊 Add,Name填PyDev,

原创 Java中的基本類型與封裝類型以及自動裝箱、拆箱

      Java中的類型分爲原始類型和對應的封裝類型(裝箱類型),基本類型包括byte字節型(一個字節)、char字符型(兩個字節)、short短整型(兩個字節)、int整型(四個字節)、long長整型(八個字節)、float浮點型(

原创 對類型的Map根據Value數值由大到小排序

在實際中經常用到對<String,Double>類型的Map根據Value數值由大到小排序,可是每次都記不住代碼,需要花好長時間去查找,現在放在這裏,方便以後查找。 List<Map.Entry<String, Double>>

原创 採用Weka中的KNN算法進行文本分類

      Weka是新西蘭Waikato大學開發的一款開源的基於Java的數據挖掘工具,其官方網址爲http://www.cs.waikato.ac.nz/ml/weka/。Weka作爲一個公共的數據挖掘的平臺,集成了大量的機器學習的算

原创 使用VNC連接Ubuntu Server 12.10無法輸入字母D

        最近新裝了一臺虛擬機,採用VNC在win7環境下使用Ubuntu12.10,後來發現一個問題,在Ubuntu中無法輸入字母D,立刻顯示桌面,懷疑在輸入字母D時被Ubuntu識別爲顯示桌面的快捷鍵了,於是查找Ubuntu快捷