Tianchi發佈完整開源機器學習數據集!

↑↑↑點擊上方藍字,回覆資料,10個G的驚喜

來源:Tianchi,方向:開源數據集

近期,Tianchi發佈了一份非常全面的開源數據集。包含了計算機視覺,自然語言處理,金融,電商,醫療,工業,農業等數據集,非常適合學習和實踐,Datawhale整理如下:

# 數據集開源地址
https://tianchi.aliyun.com/dataset

「電商」

淘寶直播商品識別數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=75730

阿里巴巴用戶行爲數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=81505

面向商品的視頻描述生成數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=75986

電商服裝產品視頻標題數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=75173

速賣通搜索系統數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=74690

淘寶用戶行爲數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=72423

甜品店鋪用戶評分數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=4366

智能出行平臺車輛訂單數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=39384

「醫療」

脊椎疾病病理數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=79463

醫學影像和標題的語篇照應數據集MedICaT

https://tianchi.aliyun.com/dataset/dataDetail?dataId=86602

息肉醫學影像數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=84385

中風後病竈解剖追蹤數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=82972

顱骨醫學圖像數據集用於監測顱內出血

https://tianchi.aliyun.com/dataset/dataDetail?dataId=82967

皮膚病圖像數據集用於診斷黑素瘤

https://tianchi.aliyun.com/dataset/dataDetail?dataId=82823

COVID-19 mRNA疫苗數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=82790

OSIC肺部CT掃描影像數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=82703

自然神經影像數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=82631

醫學影像數據集MedMNIST

https://tianchi.aliyun.com/dataset/dataDetail?dataId=82187

生物醫學實體標準化數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=81720

生物醫學概念標準化數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=81565

社交媒體醫學實體鏈接語料數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=81554

PubMedQA生物醫學研究問答數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=81523

中文BLUE數據集(生物醫學文本挖掘語料庫)

https://tianchi.aliyun.com/dataset/dataDetail?dataId=81513

中文醫學知識圖譜數據集CMeKG

https://tianchi.aliyun.com/dataset/dataDetail?dataId=81506

醫學對話數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=79671

中文醫學問答數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=79670

平安醫學技術疾病問答遷移學習數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=79665

臨牀術語標準化數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=79664

醫學實體識別和屬性抽取EMR數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=79663

疫情相似句對診斷數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=76751

2019-nCoV新型冠狀病毒基因測序數據

https://tianchi.aliyun.com/dataset/dataDetail?dataId=51202

2020新冠肺炎全國各省數據

https://tianchi.aliyun.com/dataset/dataDetail?dataId=78902

「IT通訊」

阿里巴巴快遞送達檢測系統Beacon數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=76359

大型硬盤故障預測數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=70251

「交通」

谷歌地標數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=86611

「自然語言處理」

語義分割數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=82714

谷歌MC4數據集(可翻譯101種語言)

https://tianchi.aliyun.com/dataset/dataDetail?dataId=82412

「工業」

布匹瑕疵智能識別數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=79336

「農業」

遙感檢測數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=74952

「科學」

太陽耀斑預測數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=74780

太陽黑子類型智能分類數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=74779

「計算機視覺」

視盲OCR圖片文案順序理解數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=72926

「家裝」

家居成品房3D圖像數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=65347

「公共」

2012美聯邦總統選舉數據

https://tianchi.aliyun.com/dataset/dataDetail?dataId=2581

共享單車租用數據

https://tianchi.aliyun.com/dataset/dataDetail?dataId=54174

教育系統學生分班預測

https://tianchi.aliyun.com/dataset/dataDetail?dataId=47307

員工離職預測數據

https://tianchi.aliyun.com/dataset/dataDetail?dataId=25860

「娛樂」

豆瓣電影評分數據

https://tianchi.aliyun.com/dataset/dataDetail?dataId=9603

「金融」

銀行營銷活動效果預測

https://tianchi.aliyun.com/dataset/dataDetail?dataId=45944

信貸用戶逾期預測數據

https://tianchi.aliyun.com/dataset/dataDetail?dataId=29157

金融業股票數據

https://tianchi.aliyun.com/dataset/dataDetail?dataId=46522

二手車交易數據集

https://tianchi.aliyun.com/dataset/dataDetail?dataId=62977



 
    
    
    
也可以加一下老胡的微信
圍觀朋友圈~~~


推薦閱讀

(點擊標題可跳轉閱讀)

我愛線代,線代使我快樂

麻省理工學院計算機課程【中文版】

【清華大學王東老師】現代機器學習技術導論.pdf

機器學習中令你事半功倍的pipeline處理機制

機器學習避坑指南:訓練集/測試集分佈一致性檢查

機器學習深度研究:特徵選擇中幾個重要的統計學概念

老鐵,三連支持一下,好嗎?↓↓↓


本文分享自微信公衆號 - 機器學習算法與Python實戰(tjxj666)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章