原创 國內NLP競賽平臺一覽(附平臺連接)

來源:NLP有品本文約700字,建議閱讀10分鐘本文爲大家分享國內NLP競賽平臺。標籤:自然語言處理“白嫖數據的聖地,NLP技能的訓練場”,當你覺得學好了NLP技能想練手卻苦於沒有數據;當你工作學習之於想通過真實NLP項目來增加項目經驗卻苦

原创 卷積神經網絡中10大拍案叫絕的操作!

來源:AI蝸牛車本文約4000字,建議閱讀8分鐘。本文我們從變革性工作中探討日後的CNN變革方向。標籤:人工智能技術從2012年的AlexNet發展至今,科學家們發明出各種各樣的CNN模型,一個比一個深,一個比一個準確,一個比一個輕量。我下

原创 百度語義解析 ( Text-to-SQL ) 技術研究及應用

來源:DataFunTalk本文長度爲6500字,建議閱讀10+分鐘本文介紹自然語言問題轉成數據庫可操作的SQL查詢語句的應用。[ 導讀 ]語義解析 ( Semantic Parsing ) 是自然語言處理技術的核心任務之一,涉及語言學、計

原创 原創|一文讀懂主成分分析(PCA)

作者:賈恩東本文長度爲2500字,建議閱讀7分鐘這篇文章主要帶大家入門PCA,逐漸理解PCA最原始的概念和設計思路,以及簡單的實現原理。主成分分析,即Principle Component Analysis (PCA),是一種傳統的統計學方

原创 送你一份概率圖模型筆記

來源:NewBeeNLP本文長度爲2700字,建議閱讀6分鐘本文爲你分享一份概率圖模型學習筆記,一起交流。寫在前面其實接觸概率圖模型也有一段時間了,從開始入坑NLP起,也陸陸續續看了很多關於圖模型這方面的論文、博客和教程等,但是總是不能形成

原创 數據安全最佳實踐案例庫建設項目案例徵集

2020年5月15日,由清華大學大數據研究中心和大數據系統軟件國家工程實驗室聯合發起的數據安全最佳實踐案例庫建設項目正式啓動。清華大學大數據研究中心和大數據系統軟件國家工程實驗室作爲我國數據科學與大數據技術創新研究平臺,在大數據基礎理論、核

原创 開啓註冊丨ACL-IJCAI-SIGIR頂級會議論文報告會(AIS 2020)

ACL、IJCAI和SIGIR是自然語言處理、人工智能和信息檢索領域的頂級國際學術會議。AIS頂級會議論文報告會是由中國中文信息學會青年工作委員會主辦的系列學術活動,自2017年起已連續舉辦四屆。該活動邀請被三大頂級國際會議錄用的文章作者進

原创 獨家 | 淺析機器學習中的自由度

作者:Jason Browniee翻譯:張若楠校對:林鶴衝本文長度爲2800字,建議閱讀8分鐘本文介紹了自由度的概念,以及如何判斷統計學模型和機器學習模型中的自由度。標籤:數據處理自由度是統計和工程學的重要概念,它通常用於總結在人們在計算樣

原创 量子計算的人才、軟件和硬件:解開你對量子的困惑

來源:AI TIME 論道本文約2300字,建議閱讀10分鐘量子計算到底是什麼?它和量子力學有什麼關係?它的發展歷程怎麼樣?它能否取代現有的電子計算機?近幾年,量子計算屢屢登上媒體的頭條,從量子計算機到量子手機,量子計算彷彿已經悄然走進我們

原创 原創 | 腦機接口不斷迎來重大突破,“思想鋼印”還會遠嗎?

一、腦機接口發展正在走向高潮上個月,腦機接口領域再次迎來重大突破:使癱瘓者成功恢復運動能力,觸覺準確率高達 90%。4 月 23 日,《細胞》(Cell)雜誌刊登了一篇來自美國俄亥俄州 Battelle 研究所和俄亥俄州立大學 Wexner

原创 北京小夥用AI修復100年前的京城老視頻爆火網絡,作者:7天完成,顏色還有不足...

來源:大數據文摘本文長度爲4300字,建議閱讀8分鐘。下次給AI看看清宮劇學習。標籤:機器學習昨天,一個“修復老北京街道”的視頻刷屏全網。一段由加拿大攝影師在100年前的北京被AI修復後,活靈活現地展現在人們面前,一百年前人們打招呼的方式、

原创 如何用python製作動態二維碼,提升表白成功率?

來源:凹凸數據本文約1000字,建議閱讀5分鐘。本文教你用python製作動態二維碼,助你表白成功!關注數據派THU(DatapiTHU)後臺回覆“20200520”獲取完整代碼和gif圖片大家好,我是朱小五如何用python製作動態二維碼

原创 也有個自由職業夢?日本碼農辭職一年後:獨立工程師太難了

來源:大數據文摘本文長度爲5700字,建議閱讀9分鐘本文爲你介紹自由AI工程師的心得,不依賴企業名聲,真的能靠自己打出一片天地嗎?如今,越來越多的人選擇成爲自由職業者,但是在AI行業,自由職業者似乎還不多見,最主要的問題是,不依賴企業名聲,

原创 獨家 | 數據轉換:標準化vs 歸一化(附代碼&鏈接)

作者:Clare Liu, 英國金融科技數據科學家翻譯:林鶴衝校對:王紫嶽本文約2300字,建議閱讀10分鐘本文將解釋數據轉換中常見的特徵縮放方法:“標準化”和“歸一化”的不同之處,並舉例說明何時使用,以及如何使用它們。數據轉換的前幾步往往

原创 數據缺失、混亂、重複怎麼辦?最全數據清洗指南

作者:機器之心本文約5000字,建議閱讀10分鐘本文爲你介紹如何在 Python 中執行數據的分步清洗。標籤:數據處理要獲得優秀的模型,首先需要清洗數據。在擬合機器學習或統計模型之前,我們通常需要清洗數據。用雜亂數據訓練出的模型無法輸出有意