- KDD杯的中心,所有的數據,任務和結果。
- UCI機器學習和知識發現研究中使用的大型數據集KDD數據庫存儲庫。
- UCI機器學習數據庫。
- AWS(亞馬遜網絡服務)公共數據集,提供了一個集中的資料庫,可以無縫集成到基於AWS的雲應用程序的公共數據集。
- 生物測定數據,在 虛擬篩選,生物測定數據,對化學信息學,J.由阿曼達Schierz的,有21個生物測定數據集(有效/無效的化合物)可供下載。
- 加拿大開放數據,許多政府和地理空間數據集的試點項目。
- 因果關係工作平臺的數據存儲庫。
- 數據源手冊,指南公開數據,由皮特·沃登,奧萊利(2011年1月)。
- Data.gov.uk,英國(倫敦數據存儲的公開數據 )。
- Data.gov /教育,中央指導教育數據資源,包括高價值的數據集,數據可視化工具,課堂上的資源,創建開放數據和更多的應用程序。
- DataMarket,可視化世界的經濟,社會,自然,與行業,與100萬次系列由聯合國,世界銀行,歐盟統計局和其他重要的數據提供者。
- Datamob,公共數據善加利用。
- DataSF.org,從舊金山市與縣,CA的數據資料交換所。
- DataFerrett,數據挖掘工具,訪問和操縱TheDataWeb,許多美國上線的電子政務數據集的集合。
- 鑽研,評估學習有效的實驗數據
- EconData,成千上萬的經濟時間序列,產生一些美國政府機構。
- 安然郵件數據集,約150個用戶的數據,主要是安然公司的高級管理人員。
- Europeana的數據,包含2000萬的文本,圖像,視頻和聲音Europeana的-歐洲文化遺產內容的信任和全面的資源收集的開放的元數據。
- FEDSTATS,美國的統計數據,更全面的信息來源
- FIMI頻繁項集挖掘,實現和數據集庫。
- 財務數據搜索在OSU,大的目錄的財務數據集。
- 全球環境展望(GEO基因表達OMNIBUS),基因表達/分子的豐富存儲庫支持MIAME兼容的數據提交,並策劃,網絡資源的基因表達數據的瀏覽,查詢和檢索。
- GeoDa中心,地理空間數據。
- 的谷歌ngrams數據集,從數以百萬計的谷歌掃描圖書的文字。
- 糧食市場調研,財務數據,包括股票,期貨等。
- 希拉里·梅森研究質量的大數據集的集合-許多文本和圖像數據集。
- ICWSM-2009年的數據集包含4400萬8月1日和2008年10月1日的博客文章。
- Infochimps,公開目錄和市場數據。您可以共享,出售,牧師和下載任何東西,一切有關的數據。
- 投資者的鏈接,包括財務數據
- 凱文灣仔數據集列表,文本,SNA,和其他領域。
- KONECT,科布倫茨網絡的收集,與所有類型的大型網絡數據集,以執行網絡挖掘領域的研究。
- 關聯開放數據項目,數據免費提供給大家。
- 萬首歌曲數據集
- 麻省理工學院癌症基因組基因表達數據和出版物,從麻省理工學院懷特黑德基因組研究中心。
- ML數據,數據存儲庫的,歐盟Pascal2網絡。
- 納斯達克Data Store數據存儲系統,提供市場數據的訪問。
- 國民政府統計網站,數據,報告,統計年鑑,新聞發佈,以及來自約70個網站,其中包括來自非洲,歐洲,亞洲和拉丁美洲的國家。
- 國家空間科學數據中心(NSSDC),美國航空航天局的數據集從行星探測,空間和太陽物理,生命科學,天體物理學,和更多。
- OpenData Socrata,訪問超過10,000的數據集,包括商業,教育,政府和樂趣。
- 彼得Skomoroch數據集書籤
- PubGene(TM)基因數據庫和工具,基因組學相關的出版物數據庫
- 羅伯特·席勒住房,股市,並從他的著 作“非理性繁榮的數據。
- SMD:斯坦福微陣列數據庫,從微陣列實驗的原料和標準化的數據存儲。
- SourceForge.net研究資料,包括歷史和狀態統計,約10萬的項目和超過100萬註冊用戶的活動,在項目管理網站。
- StatLib,債務工具中央結算系統的數據集存檔。
- STATOO數據集的第1部分和 STATOO數據集的第2部分
- 時間序列資料庫
- 可視化分析測試資源庫。
- UCR的時間序列數據存檔,提供數據集,文件,鏈接和代碼。
- 美國人口調查局。
- Wikiposit,(虛擬)合併(主要是金融)從許多不同的網站的數據,使用戶能夠合併來自不同來源的數據
- 雅虎沙盒的數據集,語言,圖形,資信評級,廣告和市場營銷,競爭
- Yelp的學術資料集,所有的數據和評論的250企業,30所大學的學生和學者探索和研究。
機器學習相關數據庫(轉)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.