原创 RNN聊天機器人與Beam Search [Tensorflow Seq2Seq]

本博客分析了一個Tensorflow實現的開源聊天機器人項目deepQA,首先從數據集上和一些重要代碼上進行了說明和闡述,最後針對於測試的情況,在deepQA項目上實現了Beam Search的方法,讓模型輸出的句子更加準確,修改後的源碼

原创 Alphago雜談

Alphago版本經歷了Fan,Lee,Maser,以及後面的AlphaGo和AlphaZero,前三版Fan,Lee,Master用的是監督學習+強化學習訓練,後兩面Alphago Zero和AlphaZero則是直接使用強化學習訓練。

原创 研發工程師面試題整理

TCP, UDP區別和各自優缺 TCP提供一種面向連接的、可靠的字節流服務 在一個 TCP 連接中,僅有兩方進行彼此通信。廣播和多播不能用於 TCP TCP使用校驗和,確認和重傳機制來保證可靠傳輸 TCP 給數據分節進行排序,並使用

原创 詳解神經網絡中矩陣實現的梯度計算

對神經網絡有一定了解的同學知道:一般的神經網絡的具體實現都是通過矩陣實現的,包括誤差反向傳導,梯度計算和更新等等,比如y=w∗x+b ,這裏的所有變量都是矩陣,我們通常會叫w 和b 爲參數矩陣,矩陣相乘首先效率比較高,然後也比較好操作,那

原创 [CS231n-assignment2] Python從零實現的CNN在CIFAR-10上的實驗報告

1. CS231n課程 CS231n是斯坦福大學李飛飛團隊的一門關於卷積神經網絡CNN的課程,這個課程從KNN和線性分類器講到普通的神經網絡,再將到卷積神經網絡的實現,以及一些實用的技術如Dropout、Batch Normalizati

原创 Ubantu 16.04 用apt-get自動安裝oracle java

每次安裝都要查一遍,索性記錄一下。 首先執行: sudo apt-get install python-software-properties sudo add-apt-repository ppa:webupd8team/java su

原创 經典算法題彙總

鏈表 鏈表第一個公共節點:1) 利用棧先進後出,用兩個棧對兩個鏈表從頭至尾遍歷,那麼棧頂就爲鏈表的尾節點,依次彈出兩個棧,直到彈出的元素不一樣時,前一個相同的即爲第一個公共節點. 2)分別遍歷一次兩個鏈表,算出長度差L,讓長的鏈表的指

原创 數據挖掘:如何通過百度地圖API抓取物體周邊地理位置信息

1.需求描述 對於數據挖掘工程師來說,有時候需要抓取地理位置信息,比如統計房子周邊基礎設施信息,比如醫院、公交車站、寫字樓、地鐵站、商場等,一般的爬蟲可以採用python腳本爬取,有很多成型的框架如scrapy,但是想要爬百度地圖就必須遵

原创 [天池智慧交通預測挑戰賽]新手向的時間序列預測解決方案-前Top2%

本博客分享新人第一次參加天池比賽的實況記錄,比較完整地給出了數據預處理,缺失值補全,特徵分析過程以及訓練和交叉驗證的注意事項,適合數據挖掘新人找到解題思路,全程沒有調參,沒有模型融合,只憑一手簡單的特徵和xgboost,最後止步41/17

原创 java.ulti中的接口和抽象類梳理與分析

梳理一下java中我們常用的java.ulti包中的數據結構對象,如set,list,map,collection,queue之間的關係, 以及實現的LinkedList, ArrayList,HashSet,TreeSet,HashTa