原创 “達觀杯”進行時 | 萬字長文詳解“智能文本抽取”算法進階與應用

首先簡單地介紹一下我們公司。達觀數據是一家專注於做文本智能處理的科技公司,目前完成了B輪,融資超過2億元,投資機構包括寬帶、軟銀、真格等等。我們主要做的是利用自然語言處理、光學字符識別(OCR)、知識圖譜等技術,爲大型企業和政府機構提供機器

原创 達觀數據CTO紀達麒:小標註數據量下自然語言處理實戰經驗

自然語言處理在文本信息抽取、自動審校、智能問答、情感分析等場景下都有非常多的實際應用需求,在人工智能領域裏有極爲廣泛的應用場景。然而在實際工程應用中,最經常面臨的挑戰是我們往往很難有大量高質量的標註語料。 “巧婦難爲無米之炊”,在缺少語

原创 第三屆“達觀杯”文本智能信息抽取挑戰賽強勢來襲,獎金 Offer你想要的都在這裏!

“達觀杯”是由達觀數據主辦的全國前沿人工智能和大數據技術競賽,面向全國數百所高等院校本科及以上學生、大型科技企業和初創科技企業研發人員及各行業數據工作者、愛好者展開,意在發現更多技術人才,共同在NLP應用系統的開發實現突破,促進人工智能產業

原创 達觀數據:中文對比英文自然語言處理NLP的區別綜述

關於作者陳運文:達觀數據創始人,復旦大學計算機博士,科技部“萬人計劃”專家,國際計算機學會(ACM)、電子電器工程師學會(IEEE)、中國計算機學會(CCF)、中國人工智能學會(CAAI)高級會員;第九屆上海青年科技英才。在人工智能領域擁有

原创 達觀數據特聘專家復旦大學黃萱菁教授帶你瞭解自然語言理解中的表示學習

本文根據達觀數據特聘專家復旦大學黃萱菁教授在達觀數據舉辦的長三角人工智能應用創新張江峯會上的演講整理而成,達觀數據副總裁魏芳博士統稿 一、概念 1 什麼是自然語言和自然語言理解? 自然語言是指漢語、英語、德語、俄語等人們日常使用的語言,是自

原创 達觀數據王文廣:如何玩轉自然語言理解和深度學習實踐?

​ 本文根據達觀數據王文廣在“達觀杯”文本智能處理挑戰賽期間的技術直播分享整理而成,內容略有刪減。 一、深度學習概述 深度學習是從機器學習基礎上發展起來的,機器學習分爲監督學習、非監督學習以及強化學習三種類型。深度學習是在機器學習的基礎上把

原创 一文詳解深度學習在命名實體識別(NER)中的應用

近幾年來,基於神經網絡的深度學習方法在計算機視覺、語音識別等領域取得了巨大成功,另外在自然語言處理領域也取得了不少進展。在NLP的關鍵性基礎任務—命名實體識別(Named Entity Recognition,NER)的研究中,深度學習也獲

原创 達觀數據桂洪冠:如何省時省力驗證模型效果?達觀數據在線分層實驗平臺給你支招

背景 隨着大數據和人工智能時代的到來,數據的驅動使得企業經營決策和精細化運營的效果指標的量化評估成爲可能,企業的決策和運營也越來越離不開數據的支持。尤其是朝夕萬變的互聯網行業,產品創新和決策都需要快速得到用戶反饋的數據去不斷的迭代更新。 產

原创 “達人”計劃丨達觀數據2019屆校園招聘正式啓動

一 Who we are 用理解分析情景 用熱誠驅動革新 用AI開拓未來 爲有志於在人工智能NLP領域發展的同學 提供一條有趣、錢多、目標明確的賽道 爲客戶提供文本智能處理解決方案 以一流文本挖掘技術賦能企業轉型 在AI趨勢中一起破浪前行

原创 達觀數據:深度學習來一波,受限玻爾茲曼機原理及在推薦系統中的應用

深度學習相關技術近年來在工程界可謂是風生水起,在自然語言處理、圖像和視頻識別等領域得到極其廣泛的應用,並且在效果上更是碾壓傳統的機器學習。一方面相對傳統的機器學習,深度學習使用更多的數據可以進行更好的擴展,並且具有非常優異的自動提取抽象特徵

原创 達觀數據桂洪冠:一文詳解知識圖譜關鍵技術與應用

本文根據達觀數據桂洪冠在“達觀杯”文本智能處理挑戰賽期間的技術直播分享整理而成,內容略有刪減。 ▌一、知識圖譜的概述 我們先直觀的來看一下什麼是知識圖譜,下面有一張圖,從這張圖裏可以看到,這個圖裏圓圈是節點,節點之間有一些帶箭頭的邊來連成

原创 聽說你想來做人工智能了

達觀數據招人啦! 面向北京、上海、深圳、成都四個地區 提供人工智能、算法、產品、銷售等多類崗位 畢業多年,你的狀態還好嗎? 是否憂慮被甩在時代的邊緣? 是否擔心被機器取代? 是否不安現狀、躍躍欲試? 來吧, 選擇對的行業,與優秀的人一起共事