原创 UCI數據集轉化爲Arff數據集

以Adult數據集爲例 將adult.data.txt文件改爲csv格式,用Weka Explorer打開adult.data.csv然後保存爲arff文件。 將adult.test.txt文件也作如上操作,會出現錯誤:

原创 VisualVM——Java程序監控工具

自從 JDK 6 Update 7 以後已經作爲 Oracle JDK 的一部分,位於 JDK 根目錄的 bin 文件夾下(jvisualvm.exe),無需安裝,直接運行即可。 使用SizeOf測定JVM中對象佔用內存

原创 爬取JS動態加載的頁面

參考知乎:https://www.zhihu.com/question/21471960/answer/154098407 爬取網頁上的評論:http://music.163.com/#/song?id=86375 請求評論

原创 ROC and AUC

參考: ROC和AUC介紹以及如何計算AUC 多分類下的ROC曲線和AUC ROC曲線 首先ROC分析的是二元分類模型,也就是輸出類別只有兩種值的分類模型。對於其他的多類分類模型可以做相應的轉換,本文後面再作分析。 ROC曲線

原创 Weka中的Evaluation類源代碼分析

使用的數據是最簡單的weather.nominal.arff,使用的分類模型是NaiveBayes 1.在構造函數中進行了如下操作: m_ClassPriors[numClasses]統計構造函數傳入的data的各個類的先驗概率,

原创 一個簡體字對應多個繁體字的例子

幹:對應三個繁體字:(幹)涉,(乾)燥,(幹)部; 後:對應兩個繁體字:(後)面,皇(後); 系:對應三個繁體字:唔(系),關(係),聯(繫); :對應兩個繁體字:(歷)史,日(曆); :對應兩個繁體字:時(鐘),(鍾)意

原创 Ubuntu安裝MySQL

sudo apt-get install mysql-server 會提示你設置密碼,如果安裝時沒有設置密碼的解決辦法參考ubuntu安裝mysql 時未提示輸入密碼 udo apt isntall mysql-client su

原创 第九章 高階分類:核方法與SVM

用Bing Map服務代替Yahoo的Geocoding API Bing Map的相關網站: Bing Map 開發者中心 publice21@outlook Bing Map 的MSDN Bing Map 的MSDN

原创 本科論文查重

降低重複率的方法 (1) 網上的資源都是相互有着關聯的,要是直接把原話拿來用是很容易就被檢查出來的。可以在寫的時候變化一下,換個關鍵詞,用意思相同的詞來替換原文中的詞語。也可以變一下句子的結構,用自己的話重新改寫一下,這樣一來,意

原创 Java內存的相關問題

爲什麼java獲取的最大堆內存和設置的不一致 Java 內存溢出(java.lang.OutOfMemoryError)的常見情況和處理方式總結 Sublime Text 3 配置java運行環境 Java OutOfMemory

原创 Xshell5評估期已過

正在使用的xshell 5不能使用,提示xshell 5評估期已過,重新安裝還是不行。其實xshell 5有免費版的,即Home & school 版本。卸載原程序,下載安裝免費版本的xshell 5即可。 免費版本的鏈接:htt

原创 Weka分佈式實驗

File協議 startRemoteEngine.sh java -Xmx1024m -classpath ../db_drivers/mysql-connector-java-5.1.46.jar;remoteEngine.

原创 關於前端Web技術的幾點——網絡爬蟲的技術儲備

閱讀大型 JavaScript 源碼時有什麼好用的工具? web前端開發分享-css,js工具篇 點贊 收藏 分享 文章舉報 Avalonist 發佈了69 篇原創文章

原创 Python調用Java與Java中調用Python

Python中調用Java 參考: JPype:實現在python中調用JAVA 1.安裝 首先系統中Python和Java版本最好都是32位或者都爲64位,否則可能出現錯誤。 pip install jpype1 可能需要安裝

原创 在Python中過濾Windows文件名中的非法字符方法

今天小編就爲大家分享一篇在Python中過濾Windows文件名中的非法字符方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧 網上有三種寫法: 第一種(所有非法字符都不轉義): def s