原创 愛因斯坦求和

Numpy庫、pytorch庫和tensorflow庫中,存在一個非常通用但鮮爲人知的函數,稱爲einsum(),它根據愛因斯坦的求和約定執行求和。PyTorch和TensorFlow像numpy支持einsum的好處之一是einsum可以

原创 典型相關分析

原创 均值向量的推斷

import numpy as np from operator import * from cytoolz import * from scipy import stats def Hotelling(X, u0_, alpha):

原创 周志華推薦閱讀材料

1 機器學習入門教材 Machine Learning Pattern Classification 2nd Introduction machine learning machine-learning-the-art-and-sc

原创 資料推薦

書籍推薦 1.《機器學習》 周志華。概述比較系統的介紹了機器學習的各個分支,即可作爲教材,又可以作爲自學用書和科研參考書。 2.《統計學習方法》 李航著。該書比較詳細地介紹了算法的原理,只從理論層面來研究算法。通過這本書和《機器學習實戰》兩

原创 精通數據探索-第一課

數據探索是進行數據分析和建模的關鍵步驟,筆者推薦一本書 .目前大數據已經成爲熱詞,但是如果真的獲取了很多數據,是不是一頭霧水,有一種淹死在數據海洋裏面的感覺,本系列精通數據挖掘,將介紹一系列在數據游泳的方法,讓你暢遊在數據的海洋裏,體會大

原创 模型融合 - 第二課

kaggle比賽中,單個模型,基本上已經不能取得好成績,需要多個模型集合。本文是一個非常基本和簡單的入門教程,來介紹集成(組合)基礎學習模型的方法,特別是稱爲堆疊的集成變體。簡而言之,堆疊用作第一級(基礎),預測幾個基本分類器,然後在第二級

原创 評估一元邊緣分佈的正態性

1 檢查是否對稱 一般來說,統計量較小的時候使用點圖,n較大的時候使用直方圖,可以揭示一元分佈的一個尾部比另一個長的多的情況. 例子 import numpy as np import seaborn as sns import matpl

原创 林達華推薦的幾本數學書

1. 線性代數 (Linear Algebra): Introduction to Linear Algebra by Gilbert Strang. http://math.mit.edu/~gs/linearalgebra/ 這本書

原创 How系列3 如何閱讀論文2

作者:S. Keshav David R. Cheriton School of Computer Science, University of Waterloo Waterloo, ON, Canada keshav@uwaterloo.

原创 HOW系列1-如何讀論文

英文原址 1多遍閱讀 首先瀏覽論文,跳過任何需要大量精力的部分。只要順着紙張的方向,寫論文原因,歷史以及創新新的內容即可。要強迫自己繼續前進,請爲每頁提供有限的時間預算或乾脆使用PDF閱讀器的自動滾動功能。 現在,假設論文看起來仍然值得,請

原创 第九章 經典,前沿和後續步驟

在本章中,我們將從整本書的角度回顧前面的章節,並瞭解本書中討論的看似獨立的主題是如何相互依賴的,以及研究人員如何將這些想法混合和匹配以解決手頭的問題。我們還總結了自然語言處理(NLP)中的一些經典主題。最後,我們指出了該領域的前沿,截至20

原创 數學編程哪家強

名稱 用途 編程語言 評價 openssl OpenSSL是一個開放源代碼的實現了SSL及相關加密技術的軟件包,由加拿大的Eric Yang等發起編寫的。它可以實現消息摘要、文件的加密和解密、數字證書、數字簽名和隨機數字等。它

原创 使用概率編程和Pyro進行財務預測

英文文章原址 大家好!去年我發表了幾篇關於使用神經網絡進行財務預測的教程,我認爲其中一些結果至少很有意思,值得在真實交易應用中應用。如果您閱讀它們,您必須注意到,當您嘗試將某些機器學習模型放在“隨機”數據上時,希望找到隱藏的模式,您往往會

原创 第4章 自然語言處理的前饋網絡

在第3章中,我們通過查看Perceptron(最簡單的神經網絡)來介紹神經網絡的基礎。感知器的歷史性挫折之一是它無法學習數據中存在的適度非線性模式。例如,看一下圖4-1中繪製的數據點。是一個異或(XOR),使用一條線不能分開(也稱爲線性可分