原创 玩JoinQuant的開始

#初始化方法,在整個回測、模擬實盤中最開始執行一次,用於初始一些全局變量 #context: UserContext對象,存放有當前的賬戶/股票持倉信息 initialize(context) #該函數每個單位時間會調用

原创 NumPy中的基本數據類型

NumPy中的基本數據類型 名稱 描述 bool 用一個字節存儲的布爾類型(True或False) inti 由所在平臺決定其大小的整數(一般爲int32或int64) int8 一個字節大小,-128 至 127 int16 整數,-3

原创 哎,學一半發現難以繞過著名數據分析模塊

import numpy as np import pandas as pd from scipy import stats # 初始化此策略 def initialize(context): #對比標的

原创 理解 Python 語言中的 defaultdict

轉自http://kodango.com/understand-defaultdict-in-python 衆所周知,在Python中如果訪問字典中不存在的鍵,會引發KeyError異常(JavaScript中如果對象中不存在某個

原创 文本分類的數據預處理流程介紹

在進行文本分類時,毫無疑問會涉及到對文本數據進行預處理,包括文檔切分、文本分詞、去停用詞(包括標點、數字、單字和其它一些無意義的詞)、文本特徵提取、詞頻統計、文本向量化等操作。下面就這幾方面作一個概括性的介紹,具體的實現還有待慢慢的研究。

原创 Python for Data Analysis (10)

numpy知識點羅列 創建數組array,zero,arrange,ones,eye,linspace,logspace,思想可以是列表到ndarray,經過reshape;注意fromfunction系列函數方法的運用* dtype,

原创 詞頻直方圖

詞頻直方圖 算詞頻 import nltk #加載Gutenberg語料庫 from nltk.corpus import gutenberg gutenberg.fileids() ['austen-emma.txt', 'auste

原创 Python for Data Analysis (11)

### pandas知識羅列 --- #### Series 1. series 是類似turple結構的一維數組對象,並可以通過turple來創建;索引在左邊,值在右邊;索引和值之間有link; 2.

原创 特徵工程

原创 class--review python

通過學習Java與Python的類部分可以發現 Java的一個類就寫成一個文件,幾個類合成一個package;而Python不同,一個文件看成一個module,即*.py的文件,一個module由多個類合成。 即: Java: proj

原创 Transforming Code into Beautiful,Idiomatic Python(1)

原文位置:http://sssslide.com/speakerdeck.com/pyconslides/transforming-code-into-beautiful-idiomatic-python-by-raymond-hetti

原创 文本預處理學習(2)

R包之tm:文本挖掘包 原文地址: http://www.bagualu.net/wordpress/archives/6112  簡介安裝數據輸入—文集(corpus)數據輸出查看語料庫(corpora) 查看某幾條信息查看

原创 Python for Data Analysis (7)

enumerate 它可以逐個返回序列的(i,vlue)元組,可以用於映射其所在位置的字典 #語法 for i, value in enumerate(collection): #用value做一些事情 list1=['foo',

原创 Python for Data Analysis (9)

魔法命令 a=1;b=100 a*b %timeit a*b The slowest run took 15.46 times longer than the fastest. This could mean that an inter

原创 PAT (Basic Level 1001-python3)

卡拉茲(Callatz)猜想: 對任何一個自然數n,如果它是偶數,那麼把它砍掉一半;如果它是奇數,那麼把(3n+1)砍掉一半。這樣一直反覆砍下去,最後一定在某一步得到n=1。卡拉茲在1950年的世界數學家大會上公佈了這個猜想,傳說當時耶魯