原创 P2P(Peer to Peer)網絡的原理

最近在研究P2P技術,奈何相關資料不多,自己琢磨了一下,分享一下學習P2P的一些原理, 以及如何打造一個P2P聊天應用。 這裏指的P2P是指peer to peer, 點對點的技術, 每個客戶端都是服務端,沒有中心服務器,不是websoc

原创 什麼是次梯度(次導數)

1.導數(Derivative)的定義 在說次梯度之前,需要先簡單介紹一下導數的概念與定義。導數(英語:Derivative)是微積分學中重要的基礎概念。一個函數在某一點的導數描述了這個函數在這一點附近的變化率。導數的本質是通過極限的概念

原创 word2vec的應用場景

在社交網絡中的推薦 前東家工作的時候,有一個個性化推薦的場景,給當前用戶推薦他可能關注的『大V』。對一個新用戶,此題基本無解,如果在已知用戶關注了幾個『大V』之後,相當於知道了當前用戶的一些關注偏好,根據此偏好給他推薦和他關注過大V相似的

原创 常用數學符號大學(包含羅馬字符)

大寫 小寫 英文注音 國際音標註音 中文注音 Α α alpha alfa 阿耳法 Β β beta beta 貝塔 Γ γ gamma gamma 伽馬

原创 一個有趣的說法:多層神經網絡的致命問題與過擬合

Bengio在Learning Deep Architectures for AI 一書中舉了一個有趣的例子。他說:最近有人表示,他們用傳統的深度神經網絡把訓練error降到了0,也沒有用你的那個什麼破Pre-Training嘛! 然後B

原创 異常檢測算法:孤立森林(Isolation Forest)

摘要:iForest用於挖掘異常數據,如網絡安全中的攻擊檢測和流量異常分析,金融機構則用於挖掘出欺詐行爲。算法對內存要求很低,且處理速度很快,其時間複雜度也是線性的。可以很好的處理高維數據和大數據,並且也可以作爲在線異常檢測。 0x14

原创 TensorFlow 最新版安裝教程

1.準備好Anaconda環境 tensorflow是屬於很高層的應用。高層應用的一個比較大的麻煩就是需要依賴的底層的東西很多,如果底層依賴沒有弄好的話,高層應用是沒法玩轉的。  在極客學院有關tensorflow的教程中,提到了這樣幾種

原创 深度學習中的“卷積”與數學中的“卷積”有何不同

深度學習中的卷積 當提到神經網絡中的卷積時,我們通常是指由多個並行卷積組成的運算。(因爲單個核只能特區一種類型的特徵,我們usually希望可以在多個位置提取多個特徵) 輸入也不僅僅是實值的網格,而是由一系列觀測數據的向量構成的網格。 我

原创 Coursera-Deep learning深度學習作業代碼

這個月開始刷NG老師的深度學習課程,代碼和練習都放在: 我的github 對於作業有問題的同學,歡迎參考,但是希望不要直接複製粘貼

原创 深入淺出Java反射機制

反射是框架設計的靈魂 (使用的前提條件:必須先得到代表的字節碼的Class,Class類用於表示.class文件(字節碼))   一、反射的概述 JAVA反射機制是在運行狀態中,對於任意一個類,都能夠知道這個類的所有屬性和方法;對於任意一

原创 Scala正則表達式替換

在之前的博文《Scala正則表達式》我簡單地介紹瞭如何在Scala中使用正則表達式來匹配一些我們需要的內容。本篇文章將接着此文繼續簡單介紹如何使用Scala來匹配出我們需要的字符串,然後使用某種規則來替換匹配出來的字符串。 如果想及時瞭

原创 python DataFrame獲取行數、列數、索引及第幾行第幾列的值

print df.columns.size#列數 print df.iloc[:,0].size#行數 print df.ix[[0]].index.values[0]#索引值 print df.ix[[0

原创 Python-Scikit learn保存機器學習訓練的模型

在做模型訓練的時候,尤其是在訓練集上做交叉驗證,通常想要將模型保存下來,然後放到獨立的測試集上測試,下面介紹的是Python中訓練模型的保存和再使用。 scikit-learn已經有了模型持久化的操作,導入joblib即可 from s

原创 Python機器學習基礎教程(一):簡介

這周開始做《Python機器學習基礎教程》的系列,因爲還在刷前幾章,所以代碼和文章沒有碼多少,書裏的源碼和習題可以參見我的github: https://github.com/Y1ran/Introduction-to-Machine-L

原创 深入淺出Flume之原理解析

閱讀目錄(Content) 一、Flume簡介 二、Flume特點 三、Flume的一些核心概念 3.1、Agent結構   3.2、source 3.3、Channel 3.4、Sink 四、Flume攔截器、數據流以及可靠性 4.1