原创 pytorch入門(一)深度學習入門及pytorch相關demo

以下是我的學習筆記,以及總結,如有錯誤之處請不吝賜教。 什麼是深度學習? 深度學習是機器學習的一個分支領域:它是從數據中學習表示的一種新方法,強調從連續的層(layer)中進行學習,這些層對應于越來越有意義的表示。深度學習中的深度指的並不

原创 量化小白成長記(一):量化交易基礎

以下是我的學習筆記,以及總結,如有錯誤之處請不吝賜教。 無論是基金還是股票賬戶都需要做的是記錄自己的淨值變化:   淨值:根據份額進行計算  關於交易策略:主要分爲判斷型、量化型、技術型、基本面型。 策略評價:標的物、交易次數、盈虧

原创 nlp paper:【第3篇】句和文檔的分佈式表示學習(Distributed Representations of Sentences and Documents)

一、傳統的幾種句向量學習方法的缺點? 傳統句向量表示主要有bag-of-words和bag-of-ngram-words,缺點主要是無法學習語義信息和順序信息。 二、總結詞向量的概念以及其學習到語義和語法特徵的含義? 詞向量就是用向量表示

原创 Mongodb安裝及使用命令

mac上用brew安裝: brew install mongodb 如果你現在就啓動mongo你並不會成功,如下:Failed to connect to 127.0.0.1:27017, reason: errno:61 Connect

原创 nlp paper:【第2篇】基於神經網絡的詞向量(Efficient Estimation of Word Representations in Vector Space)

1.    簡述幾種你瞭解的詞向量? ①離散表示主要有:one-hot、Bag of Words、TF-IDF ②分佈式表示有:基於矩陣的分佈表示(主要有Glove模型、共現矩陣、SVD分解等等)和基於神經網絡的分佈表示(主要有word2

原创 數據結構課程:樹和堆

二叉樹基礎: 樹的定義:樹(英語:Tree)是一種無向圖(undirected graph),其中任意兩個頂點間存在唯一一條路徑。或者說,只要沒有迴路的連通圖就是樹。 二叉樹(英語:Binary tree)是每個節點最多隻有兩個分支(不存

原创 NLP課程:Encoder-Decoder框架、Attention、Transformer、ELMO、GPT、Bert學習總結

Encoder-Decoder框架: 可以把它看作適合處理由一個句子(或篇章)生成另外一個句子(或篇章)的通用處理模型。對於句子對<Source,Target>,我們的目標是給定輸入句子Source,期待通過Encoder-Decode

原创 數據結構課程:必知必會的數據結構(隊棧、哈希表、布隆過濾器)

棧和隊列基礎: 定義:存放數據的線性表。 操作:入棧/隊列、出棧/隊列、判斷滿/空。 空間複雜度:O(n) 單次操作時間複雜度:O(1) 區別:棧是先進後出(FILO, First In Last Out),隊列是先進先出(FIFO, F

原创 算法刷題:股神

題目: 有股神嗎? 有,小賽就是! 經過嚴密的計算,小賽買了一支股票,他知道從他買股票的那天開始,股票會有以下變化:第一天不變,以後漲一天,跌一天,漲兩天,跌一天,漲三天,跌一天...依此類推。 爲方便計算,假設每次漲和跌皆爲1,股票初始

原创 Linux shell腳本命令彙總(不斷更新)

Shell 是什麼? Shell 指一種應用程序,它提供了一個界面 用戶通過這個界面訪問操作系統內核的服務 Shell 腳本(shell script) 用shell 編寫的腳本程序。 shell 通常都是指 shell 腳本 Linux

原创 Git常用命令(轉)

Git常用命令及方法大全     下面是我整理的常用 Git 命令清單。幾個專用名詞的譯名如下。 Workspace:工作區 Index / Stage:暫存區 Repository:倉庫區(或本地倉庫) Remote:遠程倉庫

原创 nlp paper:【第4篇】基於神經網絡的機器翻譯(NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE)

1.    簡述你理解的機器翻譯? 機器翻譯又稱爲自動翻譯,就是利用計算機將一種自然語言轉換爲另一種自然語言的過程。機器翻譯經歷了基於規則的翻譯-基於統計的翻譯-基於神經網絡的翻譯。 2.    簡述你學習到的神經機器翻譯過程? 基於神經

原创 cv paper:【第2篇】AlexNet

1、試着說明一下Top-5 top-1 的區別early-stop點? 這裏top-5和top-1指的是分類是否準確的一個閾值,比如大分類可以爲車,而車則可以有自行車,轎車,公交車等等。top-5的閾值相對更大,因此錯誤率也更低。top

原创 pytorch入門(二)詞向量簡介及負例採樣實現代碼

以下是我的學習筆記,以及總結,如有錯誤之處請不吝賜教。 離散表示:one-hot表示、bag of words(TF-IDF)、N-gram; 問題:無法衡量詞向量之間的關係、詞表維度隨着語料庫增長膨脹、數據稀疏問題、各種度量(距離、或與

原创 pytorch入門(一)

以下是我的學習筆記,以及總結,如有錯誤之處請不吝賜教。 什麼是深度學習? 深度學習是機器學習的一個分支領域:它是從數據中學習表示的一種新方法,強調從連續的層(layer)中進行學習,這些層對應于越來越有意義的表示。深度學習中的深度指的並不