原创 [數據挖掘]關聯規則學習筆記

關聯規則 頻繁項集的產生 規則產生 基於置信度的剪枝 頻繁項集的緊湊表示 41 極大頻繁項集 42 閉頻繁項集 6 FP增長算法 61 FP樹表示法 關聯規則 參考資料:《數據挖掘導論》人民郵電出版社P

原创 [神經網絡]2.2/2.3-How the backpropagation algorithm works-The two assumptions we need...(翻譯)

The two assumptions we need about the cost function(2個關於成本函數的假設) 反向傳播的全局是計算網絡的成本函數C 關於權重w 和偏差b 的偏導數∂C/∂w 和∂C/∂b 。關於

原创 [圖論]用Edmonds-Karp算法求解最大流問題(C語言實現)

Edmonds-Karp是求解最大流的一種算法,其他還有Ford-Fulkerson算法,這個算法在《算法導論》中有詳細的介紹。下面我們來探討下Edmonds-Karp算法。 Edmonds-Karp算法是利用一種動態規劃的思想

原创 [運籌學]關於動態規劃的2個問題-最長公共子序列與最長非降子序列問題

最近在做搜狗編程的時候,遇到了動態規劃一類的問題,感覺很有意思。寫此博文總結之。 首先先簡單敘述下什麼是動態規劃。 動態規劃 (下面部分概念參考自:百度百科) 把多階段過程轉化爲一系列單階段問題,利用各階段之間的關係,逐

原创 [Spark]Spark與Anaconda配置(Python)

對於Python開發者來說,使用Anaconda是很爽的。linux安裝好後,如何在pyspark中也可以使用Anaconda呢?這裏筆者研讀了下pyspark的腳本,這裏給出解決方案。 安裝Anaconda後,需要配置下bash_pr

原创 [Linux]常用Linux命令小結(持續更新中)

pbcopy命令 cat命令 locate命令 find命令 grep命令 tar命令 sed命令 關機命令 awk編程 記錄和域的概念 常用使用 對於ls,cd等太過於基礎的命令,本文不將進行介紹。 pbcop

原创 [神經網絡]1.3-Using neural nets to recognize handwritten digits-The architecture of neural networks(翻譯)

原文地址:http://neuralnetworksanddeeplearning.com/chap1.html#exercises_191892 The architecture of neural networks 在下一章,

原创 [神經網絡]1.7-Using neural nets to recognize handwritten digits-Toward deep learning(翻譯)

Toward deep learning(走向深度學習) 雖然我們的神經網絡給出了令人印象深刻的表現,表現的有點神祕。他自動更改網絡中的權重和偏差。這意味着我們不立即解釋網絡如何做。我們是否可以找到一些分類手寫數字的原則?並且基於

原创 [數學學習]數學知識回顧之概率統計與信息論

Logistic迴歸模型 Logistic分佈 聯合界與Hoeffding不等式 聯合界定理 Hoeffding不等式 極大似然估計 信息論基本理論 熵 聯合熵 條件熵 鏈式法則 互信息 Logistic迴歸

原创 [神經網絡]2.1-How the backpropagation algorithm works-Warm up: a fast matrix-based approach ...(翻譯)

在上一章中,我們看到神經網絡通過隨機梯度下降法可以學習權重和偏差。然而,之前我們沒有解釋過如何計算成本函數的梯度計算方法,這是個空白!在本章,我將會闡述一個計算這個梯度的快速算法,稱爲反向傳播(backpropagation)算法

原创 [雜記]某高中對口高考培訓班授課有感

2016年1月28日-2016年2月2日,我有幸能夠得到機會給某地高三對口高考生輔導了數據庫基礎的課程,教學時長27小時。 備課篇 對於還在讀研的我,這是一個挑戰。雖說之前本人曾經做過家教,但是卻一直沒有機會給一個班上過課。在上課

原创 [雜記]國內某知名電商數據研發面試題

面的國內知名的互聯網公司數據崗 一面: (1)首先自我介紹。 先介紹了下自己的教育背景,後來說研究方向,最近做的項目(這裏我說我之前做過一個數據挖掘的項目)。 (2)你說你本科是數學系的,是那種和計算機相關的數學專業對嗎?

原创 [Leetcode]解題文檔-Longest Substring Without Repeating Characters

[這個問題之前面試中有問到過,還是值得學習下的~] 3. Longest Substring Without Repeating Characters Given a string, find the length of the

原创 [神經網絡]1.4-Using neural nets to recognize handwritten digits-A simple network to classify ...(翻譯)

原文地址:http://neuralnetworksanddeeplearning.com/chap1.html#the_architecture_of_neural_networks A simple network to cl

原创 [數據庫]數據庫基礎知識複習

DQLDMLDDLDCL 數據查詢語言DQL 數據操縱語言DML 數據定義語言DDL 數據控制語言DCL 數據庫中的五大約束 數據庫範式 1NF 2NF 3NF BCNF 存儲過程 存儲過程的好處 寫在前:最