原创 百萬級大樣本中的countif實現

任務描述 對每個減持事件分別統計該股票在減持前30天和減持後30天發佈的公告數。由於數據集過於龐大,用stata和excel都不好操作,所以選用輕便靈活的python語言。 數據集描述 主要有兩個數據集: 公告列表 爬取的巨潮資訊網

原创 1970年以來中國(含港澳臺)公共安全事件統計

最近偶然得到了一份1970年以來的公共安全事件數據,不看不知道,一看嚇一跳。本來覺得歲月靜好,看了以後才知道原來“有人替你負重前行”這句話原來是真的。被這份數據驚到了,於是手動簡單統計了一下分享出來請大家感受一波。話不多說,上圖。

原创 合併重疊時間窗口

任務描述 最近在做上市公司的事件研究,得到了每個事件發生及之後 15 個交易日的時間窗口,已經按照stkcd evendate的順序排好序,下面截取小段 sample 存儲到 test.txt 中。顯然存在很多重疊的時間窗口,所以想去

原创 VAR 在 Stata 中的模擬、估計和推斷

Source: Ashish Rajbhandari → Vector autoregression—simulation, estimation, and inference in Stata VAR 是分析多維時間序列動態變化的利

原创 Stata 中的向量自迴歸模型(VAR)

Source: David Schenck→ Vector autoregressions in Stata 1. 引言 在單變量回歸中,一個平穩的時間序列 yty_tyt​ 經常被模型化爲 AR 過程: yt=α0+α1yt−1+α

原创 OLS可視化模擬:A Shiny App for Playing with OLS

1. OLS 回顧 1.1 估計係數的決定因素 採用矩陣形式將線性迴歸模型表示如下: (1)y=xβ+u y = x\beta + u \tag{1} y=xβ+u(1) 若假設解釋變量外生 (同時滿足其它基本假設條件),即 E(x

原创 協整還是僞迴歸?

幫Stata連享會翻譯的第二篇文章:協整還是僞迴歸?。由於markdown語言還不是很成熟,尤其是在數學公式上有很多bug,所以我自己的博客就是我的測試001啦。以下爲原文: Source: Ashish Rajbhandari →

原创 Stata中的單位根檢驗

今天幫連玉君老師的stata連享會翻譯了一篇文章,原文鏈接。第一次嘗試用markdown編輯,發現CSDN竟然支持markdown,所以順手po上來試試效果。以下爲正文: 檢驗序列的平穩性是時間序列分析的關鍵步驟。時間序列中很多估計量

原创 Bubbles for Fama(2018, JFE)的泡沫識別策略:應用於中國股票市場

今年9月的JFE發了篇評價Fama“價格變動是理性的,價格飆升不等同於價格泡沫”觀點的文章,核心結論有: i)行業層面,價格的劇烈上揚並不表示未來資產收益的降低(即動量效應是存在的); ii)但是,價格的急增與未來股票崩盤有顯著正相關;

原创 Wind量化接口初探

最近要從Wind上下很多數據,但是點來點去太繁瑣了,而且會下很多冗餘的數據,還好有量化接口這個東西,直接用代碼訂製你想要的數據,而且速度飛快,體驗極好。嘿嘿嘿先把用Python接口寫的代碼po上來,過兩天寫教程順便介紹一波Wind炒雞好用

原创 中山大學羽毛球場館自動訂場(Python+selenium+百度aip)

雙鴨山南校人太多,小夥伴們日常約球搶不到室內的場館,只好去室外打。所以趁考完試有時間寫了一個自動搶羽毛球場的腳本,網好的時候20秒訂場無壓力。下面來分享一波這個腳本的一些技術細節(重點講一下圖像降噪和百度雲的文字識別接口),也算是對我這兩