原创 寶藏索引圖出爐!一圖在手,文章全擁有!

親愛的粉絲們,在看數據派THU(以及其他公衆號)文章時你是否曾有以下的困擾? 碰運氣——每天發佈什麼類型的文章其實並沒有規律可循;好茫然——自己關注的內容也不知道什麼時候會發布;心好累——想學習一個數據處理方面的知識點,但是爬了半天樓也

原创 ICLR2020 NLP優秀論文分享(附源碼)

來源:知乎https://zhuanlan.zhihu.com/p/139069973作者:清華阿羅本文長度爲1500字,建議閱讀5分鐘爲你分享ICLR2020 NLP優秀論文。1.REFORMER:THE EFFICIENT TRAN

原创 獨家 | 決策樹VS隨機森林——應該使用哪種算法?(附代碼&鏈接)

作者:Abhishek Sharma翻譯:陳超校對:丁楠雅本文長度爲4600字,建議閱讀20分鐘本文以銀行貸款數據爲案例,對是否批准顧客貸款申請的決策過程進行了算法構建,並對比了決策樹與隨機森林兩種機器學習算法之間的異同及各自的優劣。標

原创 斯坦福CS520 | 知識圖譜到底是什麼?從各頂會看知識圖譜定義

來源:專知本文約多圖,建議閱讀10分鐘本文將討論從最近的ML和AI會議中看到的關於理解知識圖譜的各種角度和觀點。知識圖譜在計算機科學領域的吸引力越來越大,通常被認爲是令人印象深刻的新技術背後的“祕方”。在這次演講中,我們將討論從最近的M

原创 福利 | 如何創造可信的AI?人工智能大牛蓋瑞·馬庫斯的11條建議

文末有福利哦~(本文來自湛廬文化策劃出版新書《如何創造可信的AI》,作者蓋瑞·馬庫斯(Gary Marcus )  歐內斯特·戴維斯(Ernest Davis))在人工智能領域中,深度學習掀起了最近一次大的浪潮,也是目前最受關注、獲得投

原创 數學表達式一鍵變圖,CMU開發實用工具Penrose,堪稱圖解界LaTeX(附鏈接)

來源:七月在線實驗室本文長度爲2000字,建議閱讀5分鐘本文爲大家介紹了卡內基梅隆大學開發的一款可自動生成的新工具。有 A、B 兩個集合,A 與 B 相交,C 是 A 與 B 的交集,分別將三個集合命名爲 Circles、Diagram

原创 《自然綜述-神經科學》:大腦中的反向傳播

來源:神經前研本文長度爲10000字,建議閱讀10+分鐘。俗話說得好:大腦要學習,突觸可塑性少不了。標籤:人工智能大腦中的神經元能調控自身與其它神經元之間的連接強度,這一點我們早在上世紀七十年代就知道了[1]。但我們也知道,學習的突觸可

原创 五位工程師親述:AI技術人才如何快速成長?

來源:AI前線本文長度爲12000字,建議閱讀10分鐘本文與你分享AI技術人才的真實成長經歷。標籤:人工智能前言參考塞繆爾. 約翰遜(18 世紀英國文學評論家、詩人,著有《英語大辭典》、《莎士比亞集》)的思路,“當一個人厭倦了學習技術,

原创 原創 | 一文看盡2020上半年阿里、騰訊、百度入選AI頂會論文(附地址)

2020年已過近半,人工智能學術界的頂級會議也舉行了不少。在今年已經舉行的頂會中,騰訊、百度、阿里等國內科技巨頭被收錄論文在數量和質量上均有所突破,涉及機器學習、自然語言處理、計算機視覺等多個領域。下面,本文整理出這些科技公司在今年頂會

原创 獨家 | 數據科學入門指南:新手如何步入數據科學領域?

作者:Sangeet Aggarwal翻譯:陳之炎校對:馮羽本文長度爲2900字,建議閱讀6分鐘本文將帶大家討論如何從零開始數據科學之旅。 標籤:數據科學,機器學習數據科學,據說是本世紀最吸引人的工作,已經成爲我們許多人夢寐以求的工作。

原创 薦讀 | 9篇近期社會化推薦論文

作者:機器學習與推薦算法本文長度爲3300字,建議閱讀5分鐘均爲近期瀏覽到的關於社會化推薦相關的文章。近期瀏覽到的關於社會化推薦相關的文章,有幾篇利用圖卷積網絡(GCN)來建模的,也有利用生成對抗網絡(GAN)來進行樣本生成的,有關注社

原创 獨家 | 手把手教你推導決策樹算法

作者:Arun Mohan翻譯:楊毅遠校對:王琦本文長度爲2000字,建議閱讀5分鐘本文爲大家介紹了機器學習中常用的決策樹算法以及相關術語,並基於天氣數據集進行決策樹算法(ID3、CART算法)實現過程的手動推導。標籤:機器學習決策樹是

原创 獨家 | COVID-19:利用Opencv, Keras/Tensorflow和深度學習進行口罩檢測

作者:Adrian Rosebrock翻譯:張一然校對:馮羽本文約8800字,建議閱讀10+分鐘本文爲大家介紹瞭如何使用Opencv,Keras/Tensorflow構建一個口罩檢測模型,以及如何將該模型應用到圖片和視頻中。標籤:深度學

原创 強者愈強!疫情拉大“數據資產”貧富差距,頂級公司數據建設靠什麼

5月12日,谷歌子公司Waymo宣佈獲得7.5億美元的額外投資,將無人駕駛汽車商業化。兩個月內,Waymo的籌款額已經達到了30億美元。阿里雲計算收入同比增長58%,新零售平臺在疫情影響下不減反增。於此同時,許多傳統行業如品牌零售商已經

原创 獨家 | 機器學習中的四種分類任務(附代碼)

作者:Jason Brownlee翻譯:陳丹校對:楊毅遠全文約4400字,建議閱讀18分鐘本文爲大家介紹了機器學習中常見的四種分類任務。分別是二分類、多類別分類、多標籤分類、不平衡分類,並提供了實戰代碼。 標籤:機器學習機器學習是一個研