原创 Python3.x 開發問題彙總

【1】python matplotlib plot 中文無法顯示處理 在python的安裝目錄中找到配置文件: %Python_Home%\Lib\site-packages\matplotlib\mpl-data\matp

原创 ETL方法與過程講解

1 ETL基本概念和術語 1.1 ETL Extract-Transform-Load的縮寫,數據抽取(Extract)、轉換(Transform)、裝載(Load)的過程。 1.2 DW DataWarehousing,根據Bi

原创 安裝和使用Inforbright

Inforbright簡介 Infobright是一款基於知識網格的列式數據庫,對大批量數據(百萬、千萬、億級)的查詢性能非常高,據說比MyISAM、InnoDB等普通MySQL引擎快5~60倍,可存儲TB級體積的數據,存儲數據高

原创 機器學習筆記:K-最近鄰算法

K-最近鄰算法(k-Nearest Neighbors) KNN基本思想 計算輸入值的座標與當前所有點的座標距離(利用歐幾里得距離),將這些距離保存在一個遞增的列表裏,獲取k個最小的距離的值,在這些值中找到最主要的分類,即出現次數

原创 機器學習筆記:ID3算法建立決策樹(一)

ID3算法的核心思想 以信息熵的下降速度作爲選取測試屬性的標準,所選的測試屬性是從根節點到當前節點的路徑上尚未被考慮的具有最高信息增益的屬性。 維基百科上對ID3算法有比較詳細的介紹:ID3維基 計算過程相關公式 x 是一個離散

原创 Redis使用問題彙總

SET 中文之後,GET一串“\x..”(UTF-8編碼)的字符串,解決方法: 使用 redis-cli –raw 鏈接redis java連接虛擬機Ubuntu中的redis服務報無法連接錯誤: redis.clients

原创 JVM命令使用一:內存查看

1.整體情況查看(任務管理器):top 第三行就是CPU的使用情況了,如下: %Cpu(s)us用戶空間佔用CPU百分比sy內核空間佔用CPU百分比ni用戶進程空間內改變過優先級的進程佔用CPU百分比id空閒CPU百分比wa等待輸

原创 Fastjson關於List.addAll(Collection)方法遇到的問題

涉及的軟件環境:SpringMVC,fastjson 有一個需求,需要將熱詞信息跟自定義的熱詞信息(另外一個實體的信息)合併到一個列表裏, 獲取hotKeyList的代碼 List<HotKeys> hotKeyList = ho

原创 Spring定時任務無故停止又不報錯

一開始是使用Spring自帶的定時器來配置定時任務的,簡單快捷,配置如下: <bean id="refreshCache" class="com.gionee.baserom.search.job.RefreshCache" />

原创 Windows7安裝和使用Inforbright

Inforbright簡介 Infobright是一款基於知識網格的列式數據庫,對大批量數據(百萬、千萬、億級)的查詢性能非常高,據說比MyISAM、InnoDB等普通MySQL引擎快5~60倍,可存儲TB級體積的數據,存儲數據高

原创 機器學習筆記:支持向量機

關鍵術語 支持向量(Support Vector) 支持向量機(Support Vector Mechines,SVM) 序列最小優化(Sequential Minimal Optimization,SMO) 核函數(Ker

原创 機器學習筆記:貝葉斯算法(一)

有關貝葉斯定理和貝葉斯公式的推導過程,在阮一峯大神的博客裏的《貝葉斯推斷及其互聯網應用(一):定理簡介》寫得非常全面,簡潔明瞭。 下面是我的個人筆記總結: 貝葉斯定理 基於假設的先驗概率,給定假設下觀察到的不同數據的概率,提供了一

原创 學習筆記:OLTP語OLAP

OLTP(On-Line Transaction Processing):聯機事務處理 OLAP(On-Line Analytical Processing):練級分析處理 OLTP 是事件驅動、面向應用的。基本特點是:

原创 機器學習筆記:ID3算法建立決策樹(二)

在《機器學習筆記:ID3算法建立決策樹(一)》中記錄了ID3算法的計算公式和步驟,現在用例子記錄一下ID3構建決策樹的過程。 對以下數據進行分類: - 是否能飛? 是否有羽毛? 是小鳥? 1 是 是 是 2 是

原创 機器學習筆記:邏輯迴歸

Sigmoid函數 利用Sigmoid函數來求得迴歸係數 σ(z)=11+e−z 曲線圖如下 x=0時,Sigmoid函數的值爲0.5; x>0時,Sigmoid函數值大於0.5,x越大,函數值越接近1; x<0時,