原创 oracle 存儲過程

create or replace procedure DELETE_DATA(v in varchar2) isbeginfor i in 1..2647 loopbegindelete from cert t where ROWNUM

原创 TERRA-COTTA多服務器配置及控制檯運行

第一步:編寫tc-config.xml: <?xml version="1.0" encoding="UTF-8"?> <con:tc-config xmlns:con="http://www.terracotta.org/config

原创 字符串編碼

byte[] dd="text".getBytes("UTF-16LE"); //dd=[116, 0, 101, 0, 120, 0, 116, 0] String fileContent=new String(dd);//寬字節te

原创 vmware已安裝tools,但是hgfs仍無內容的解決方法

已經開啓vmware共享了   先安裝 sudo apt-get install open-vm-dkms然後在執行sudo mount -t vmhgfs .host:/ /mnt/hgfs /mnt前有空格

原创 數據挖掘易犯錯誤(轉)

數據挖掘中的易犯錯誤• 按照Elder博士的總結,這10大易犯錯誤包括:0. 缺乏數據(Lack Data)1. 太關注訓練(Focus on Training)2. 只依賴一項技術(Rely on One Technique)3. 提錯

原创 sas em模塊安裝

1 下載:sas 9.2 安裝介質dvd1:ed2k://|file|%5BSAS.9.2%E5%A4%9A%E5%9B%BD%E8%AF%AD%E8%A8%80%E7%89%88%EF%BC%88%E6%

原创 數據挖掘分類及常用算法

基於學習策略的分類機械學習傳授學習類比學習歸納學習基於解釋的學習基於學習方式的分類(1)有導師學習(監督學習):輸入數據中有導師信號,以概率函數、代數函數或人工神經網絡爲基函數模型,採用迭代計算方法,學習結

原创 clementine VS sas em

1.SAS EM 在所有的數據挖掘產品中唯一一家能夠將數據分爲訓練、驗證、測試三部分並能自動地在訓練數據上建模,在驗證數據上進行模型調整優化,在測試數據上進行模型評估而不影響模型建立,同時還能將各種模型的提

原创 spss中各常用節點及算法

主成分分析法 [url]http://baike.baidu.com/view/45376.htm[/url]時間序列分析 [url]http://baike.baidu.com/view/479624.h

原创 Terracotta tc-config.xml配置說明(這個真的是轉的)

<?xml version="1.0" encoding="UTF-8" ?> <!-- All content copyright Terracotta, Inc., unless otherwise indicated. All r

原创 三種常見的決策樹:CART,C5,CHAID

決策樹需要計算結點的純度來選擇最具顯著性的切分(split)。通常,CART以Gini,C5以信息增益(熵),CHAID以卡方。雖然存在這樣的差別,但他們樹形狀的不同更爲重要一些。卡方:http://wen

原创 mybatis優化(轉)

  最近測試發現個myBatis 有個比較嚴重的性能問題, 描述如下:1. define a bean classpublic class Bean {private int id;private String desc;private

原创 尋找第K大的數的方法總結(轉)

今天看算法分析是,看到一個這樣的問題,就是在一堆數據中查找到第k個大的值。 名稱是:設計一組N個數,確定其中第k個最大值,這是一個選擇問題,當然,解決這個問題的方法很多,本人在網上搜索了一番,查找

原创 向量空間的距離

在向量空間模型中,文本泛指各種機器可讀的記錄。用D(Document)表示,特徵項(Term,用t表示)是指出現在文檔D中且能夠代表該文檔內容的基本語言單位,主要是由詞或者短語構成,文本可以用特徵項集表示爲D(T1,T2,…,Tn)

原创 老忘的java getproperty

Properties props=System.getProperties(); //系統屬性 System.out.println("Java的運行環境版本:"+props.getProperty("java.version"