原创 R語言程序設計week2

2.1控制結構 如下圖 如if  if(x>3){                                       這種寫法較常見,有特色的則是這種           y<-  if(x>-3) { y<-10  10

原创 數據清洗與收集week1

整個過程先瞄下先 2 下載文件 親身痛苦的實驗,發現在window中不需用curl方法,自己還在那實驗半天,哎哎,另外,如果還不行的話,將https改爲http可能會有效一些,https比http多了個安全協議 讀取當地

原创 可重複性研究week1

1.1可重複性研究:概念與思想 replication(複製) 也就是說replication研究會很困難,然而仍可以做小規模的replication.即reproducible research,反正就是reproducible res

原创 統計推斷week1

1.1統計推斷導論 統計推斷是從數據中得出正式結論的過程(frormal conclusions) 在此課中,我們對正式的統計推斷的定義是在考慮到不確定性的情況下,通過帶有噪音的數據,從大量的事實中推斷 In our class, we

原创 網上流傳數據來源

世界經濟專業常用數據庫 常用數據庫介紹 1. IMF--ifs 國際金融統計年鑑 IMF-DOT 國際貿易方向統計年鑑 IMF-BOP 國際收支平衡表 2 PWT 是聯合國的ICP(國際比較計劃),委託賓州大學的一個研究所建立的數據庫

原创 機器學習week9(一)_anomaly detection

此章一直搞不懂爲麼要用正態分佈來表示屬性,爲麼不能用其他的呢? 9.1 problem motivation      如下圖       9.2高斯分佈 此處有個注意點,即標準誤standard error 標準差standard de

原创 機器學習9(2)推薦系統

9.1 problem formulation   第一節就講了下問題,看起來好簡單,但實際的想法還是很不錯的,開兩個矩陣,一個矩陣用0/1來表示評分與否,另一個矩陣表示具體的評分。兩層結構,略顯冗餘,但在對客戶分類時可能還是很有好處的,

原创 數據科學工具箱week3筆記

3.1 問題的類型 困難可能的次序 描述性——探索性——推理——預測——因果——機理 3.2 what is data  Definiton of   Data Data are values of qualitative o

原创 探索性數據分析week1筆記

1.1圖表分析的準則 老師說此處主要參考了 Edward Tufte(2006)年的 Beautiful Evidence一書,第二條指的是表示出自己所認爲的因果關係及相關解釋 1.2 探索性圖表 legend:傳說,也有圖例的意

原创 機器學習筆記-advice for applying machine learning

首先要感謝stanford 大學的adrew ng 老師的課程 6.1 deciding what to try next   1.debug 時出現問題要咋辦呢? 最終結論爲:普遍認爲1,2,6能解決過擬合問題,機遇3,4,5能

原创 數據科學工具箱week1筆記

最近同時在上cousera的另一門課程,希望三年後能成爲一名出色的數據分析師,曾想過往大數據挖掘那方面試下的,不過慢慢地想法改變了下,只抱着單純的學習數據處理技能來學習,或許也不錯吧 第一節。series motivation 第一節嘛,

原创 可重複性研究week2

1.1  coding standards .常用文本文件/文本編輯器,即 text files/text editor .縮進代碼 。縮進提高可讀性 。修正行長(80列)能讓你從容的面對嵌套和長函數 。小建議:最少縮進(4個格);8個最

原创 R語言程序設計 week3

好吧,瞄函數構造的話還是用str(fun)方便些,用fun,太雜,不爽 3.1各種-apply(即簡化循環) 各種,一個輔助的split,較之前只會subset要強一些哈.最後一個mapply是一個multivariate多元應用 la

原创 數據科學工具箱week2筆記

同樣來自於著名網校coursera,本來寫了第一章的筆記的,可惜不小心不見了,哎,只有從week2開始搞起了 2.1 命令行界面(就是window中的cmd.exe) 命令行界面(Command Line Interface,簡寫:CL

原创 數據清洗與收集week2

2.1 從MySQL中獲取數據 首先是mysql的一些簡介 Connecting and listing databases ucscDb <- dbConnect(MySQL(),user="genome",