原创 eclipse下運行第一個hadoop程序

1、下載eclipse(hadoop相關環境已經搭建好,具體見Hdoop安裝教程——單機和僞分佈式配置) eclipse的衆多版本可以從以下下載地址中獲取(注意選擇合適的版本,我的配置是ubuntu14+hadoop3.7+jdk1.8

原创 idea+maven+scala創建wordcount,打包jar並在spark on yarn上運行

1、 創建基於maven的scala項目步驟 (1)創建一個maven項目 File->new project -> maven   不需要選擇ar

原创 機器學習——神經網絡

一、代價函數Cost function 二、向後傳播算法 1、規定: 2、殘差δ的推導 (1)三層神經網絡模型推導 流程如圖: k :輸出層 j :隱藏層 I :輸入層 Θ_kj:從隱藏層到輸出層的權重 Θ_ji:從輸入層到隱藏層

原创 機器學習---降維之PCA主成分分析法

(一)、主成分分析法PCA簡介  PCA 目的:降維——find a low dimension surface on which to project data ~如圖所示,尋找藍色的點到直線的垂直距離的和最小的直線(向量)

原创 機器學習——多元線性迴歸

點贊 收藏 分享 文章舉報 Itzel_yuki 發佈了30 篇原創文章 · 獲贊 25 · 訪問量 7萬+ 私信 關

原创 機器學習----聚類之k-means

(一)、K-Means聚類算法 KMeans是聚類算法的一種,先來直觀的看一下該算法是怎樣聚類的。給定一組數據如下圖所示,K-Means算法的聚類流程如圖: 圖中顯示了Kmeans聚類過程,給定一組輸入數據{x(1),x(2),...

原创 機器學習——邏輯迴歸

點贊 收藏 分享 文章舉報 Itzel_yuki 發佈了30 篇原創文章 · 獲贊 25 · 訪問量 7萬+ 私信

原创 機器學習----無監督學習算法之異常檢測

(一)異常檢測---基於高斯(正態)分佈 m個訓練樣本,每個樣本有n個features 即m個樣本的每個屬性集都呈現高斯分佈,因此有以下計算: 例子如下: (二)評價異常檢測系統 將所有數據按照60%,20%,20%的比例分成三部

原创 win7 64位利用eclipse搭建android開發環境教程

適合win7 64位的操作系統的JDK1.7+eclipse+android SDK 23.0.2+adt23.0.2資源下載: http://pan.baidu.com/disk/home?sr=fc 安裝注意事項: 注意:sdk和ad

原创 mysql索引和查詢優化

BTree索引: 1、對於組合索引,如果查詢中有某個列是範圍查詢,則其右邊所有列都無法使用索引優化查詢 2、高性能索引,索引的列不能是表達式的一部分,也不能是函數的參數。應該養成簡化where查詢的習慣,始終將索引列單獨放在符號的一側。

原创 jdk1.8 J.U.C併發源碼閱讀------CountDownLatch源碼解析

一、繼承關係 public class CountDownLatch功能:讓n個線程(線程之間是共享的關係)等待另外m個線程執行完任務後再開始執行。 具體流程:將n個調用countDownLatch.await()的線程添加到CLH隊列中

原创 floodlight之forwarding模塊源碼解析

以“一個包在交換機上匹配失敗,向控制器上發packet_in包,控制器計算出路徑,給該路徑上所有交換機下發相應流表項”這個過程爲例,分析floodlight中forwarding模塊源碼。   說明:floodlight採用事件驅動的異步

原创 jdk1.8 J.U.C併發源碼閱讀------ReentrantLock源碼解析

一、繼承關係 public class ReentrantLock implements Lock, java.io.Serializable實現了Lock接口、Serializable接口。 是一個獨佔鎖,包含公平和非公平兩種實現。

原创 jdk1.8 J.U.C併發源碼閱讀------AQS之獨佔鎖的獲取與釋放

一、繼承關係 since1.5 public abstract class AbstractQueuedSynchronizer extends AbstractOwnableSynchronizer implements