↑↑↑點擊上方藍字,回覆資料,10個G的驚喜
近期,Tianchi發佈了一份非常全面的開源數據集。包含了計算機視覺,自然語言處理,金融,電商,醫療,工業,農業等數據集,非常適合學習和實踐,Datawhale整理如下:
# 數據集開源地址
https://tianchi.aliyun.com/dataset
「電商」
淘寶直播商品識別數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=75730
阿里巴巴用戶行爲數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=81505
面向商品的視頻描述生成數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=75986
電商服裝產品視頻標題數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=75173
速賣通搜索系統數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=74690
淘寶用戶行爲數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=72423
甜品店鋪用戶評分數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=4366
智能出行平臺車輛訂單數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=39384
「醫療」
脊椎疾病病理數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=79463
醫學影像和標題的語篇照應數據集MedICaT
https://tianchi.aliyun.com/dataset/dataDetail?dataId=86602
息肉醫學影像數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=84385
中風後病竈解剖追蹤數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82972
顱骨醫學圖像數據集用於監測顱內出血
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82967
皮膚病圖像數據集用於診斷黑素瘤
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82823
COVID-19 mRNA疫苗數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82790
OSIC肺部CT掃描影像數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82703
自然神經影像數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82631
醫學影像數據集MedMNIST
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82187
生物醫學實體標準化數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=81720
生物醫學概念標準化數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=81565
社交媒體醫學實體鏈接語料數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=81554
PubMedQA生物醫學研究問答數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=81523
中文BLUE數據集(生物醫學文本挖掘語料庫)
https://tianchi.aliyun.com/dataset/dataDetail?dataId=81513
中文醫學知識圖譜數據集CMeKG
https://tianchi.aliyun.com/dataset/dataDetail?dataId=81506
醫學對話數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=79671
中文醫學問答數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=79670
平安醫學技術疾病問答遷移學習數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=79665
臨牀術語標準化數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=79664
醫學實體識別和屬性抽取EMR數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=79663
疫情相似句對診斷數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=76751
2019-nCoV新型冠狀病毒基因測序數據
https://tianchi.aliyun.com/dataset/dataDetail?dataId=51202
2020新冠肺炎全國各省數據
https://tianchi.aliyun.com/dataset/dataDetail?dataId=78902
「IT通訊」
阿里巴巴快遞送達檢測系統Beacon數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=76359
大型硬盤故障預測數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=70251
「交通」
谷歌地標數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=86611
「自然語言處理」
語義分割數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82714
谷歌MC4數據集(可翻譯101種語言)
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82412
「工業」
布匹瑕疵智能識別數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=79336
「農業」
遙感檢測數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=74952
「科學」
太陽耀斑預測數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=74780
太陽黑子類型智能分類數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=74779
「計算機視覺」
視盲OCR圖片文案順序理解數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=72926
「家裝」
家居成品房3D圖像數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=65347
「公共」
2012美聯邦總統選舉數據
https://tianchi.aliyun.com/dataset/dataDetail?dataId=2581
共享單車租用數據
https://tianchi.aliyun.com/dataset/dataDetail?dataId=54174
教育系統學生分班預測
https://tianchi.aliyun.com/dataset/dataDetail?dataId=47307
員工離職預測數據
https://tianchi.aliyun.com/dataset/dataDetail?dataId=25860
「娛樂」
豆瓣電影評分數據
https://tianchi.aliyun.com/dataset/dataDetail?dataId=9603
「金融」
銀行營銷活動效果預測
https://tianchi.aliyun.com/dataset/dataDetail?dataId=45944
信貸用戶逾期預測數據
https://tianchi.aliyun.com/dataset/dataDetail?dataId=29157
金融業股票數據
https://tianchi.aliyun.com/dataset/dataDetail?dataId=46522
二手車交易數據集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=62977
也可以加一下老胡的微信
圍觀朋友圈~~~
推薦閱讀
(點擊標題可跳轉閱讀)
老鐵,三連支持一下,好嗎?↓↓↓
本文分享自微信公衆號 - 機器學習算法與Python實戰(tjxj666)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。