原创 [模型評估]五種評估圖表(Clementine)

預測值和置信度:   $R-表示預測值,$RC表示置信度,置信度在0-1之間,說明預測值的精準度。 評估圖表的工作原理: 根據預測值及預測的置信度排序記錄、將記錄分割爲大小相等的組(分位數)並按由高到低順序爲每個分位數繪製業務標準值

原创 數據挖掘步驟

圖1爲知識挖掘的步驟數據處理: 標準化處理 離散化 (Discretization) 連續值->離散值,分類中常用 取樣 (Sampling) 維度縮減 (Dimensionality Reduc

原创 spss 關聯關係挖掘算法

廣義規則歸納(GRI) 節點會發現數據中的關聯規則。例如,購買了剔須刀和客戶在購買須後水之後,還可能會購買剔須霜。GRI 基於某項指數抽取了信息量最大的規則,此指數考慮了規則的普遍性(支持度)和準確性(置信

原创 clementine中關聯的提升指數含義

再說說提升水平lift這個參數。假定設定規則的最小閥值爲支持度30%,置信度爲60%,然後你得到了很多的強關聯規則。比如有這麼一條,總數據10000個,A商品6000個,B商品7500個,然後同時購買A和B

原创 oracle數據庫導入(偶知道這個忒初級了,就是給自己看的)

# su - oracle$ sqlplus /as sysdbasql> @/path/create_user.sql/*-- Create the user create user myuser id

原创 oracle解釋命令開關

set autotrace on explain只解釋不出現結果set autotrace off關閉上述效果

原创 oracle數據庫性能瓶頸的定位及處理

在進行高併發、大數據量的對數據庫的寫操作時   發現數據庫寫操作耗時甚多,進入https://192.168.6.139:1158/em管理控制檯   進入性能選項卡,如圖oracle1.jpg,當時發現configuration棕色區域

原创 netty框架下性能優化

1 對於JVM啓動時選取的啓動參數是:-server -Xms2048m -Xmx2048m -XX:+UseParallelGC -XX:+AggressiveOpts -XX:+UseFastAccessorMethods    2