香儂科技:打造出有中國文化特色的全球技術領先人工智能公司 | 百萬人學AI評選

2020 無疑是特殊的一年,而 AI 在開年的這場”戰疫“中表現出了驚人的力量。站在“新十年”的起點上,CSDN【百萬人學AI】評選活動正式啓動。本屆評選活動在前兩屆的基礎上再度升級,設立了「AI優秀案例獎Top 30」、「AI新銳公司獎Top 10」、「AI開源貢獻獎Top 5」三大獎項。我們相信,榜樣的力量將成爲促進AI行業不斷髮展的重要基石,而CSDN將與這些榜樣一起,助力AI時代的”新基建“。

活動官網:https://bss.csdn.net/m/topic/ai_selection/index

申報地址:http://csdnprogrammer.mikecrm.com/WpA03hJ

一、公司簡介

香儂科技2017年12月註冊成立於北京,主要技術領域爲自然語言處理,創始人兼CEO李紀爲,本科畢業於北京大學,博士就讀於斯坦福大學,是該學院歷史上用時最短的博士學位獲得者。在全世界所有自然語言處理領域的學者中,頂級會議論文第一作者數量排名全球第一,同時也是論文引用量最多的學者之一。創業前,先後在微軟研究院 (MSR),Facebook人工智能實驗室(FAIR)從事研究工作。近兩年先後榮獲《福布斯》“30位30歲以下精英”,《麻省理工科技評論》“35歲以下科技創新35人”,《財富》“40位40歲以下商界精英”,“中國青年科技創業者30人”,“中國海歸科技創業者100人”等十餘個獎項,並受聘擔任清華大學互聯網產業研究院研究員,智源人工智能研究院青年科學家等職務 。

目前主要將人工智能技術應用於金融領域,提供全球資本市場信息智能服務以及智能投研輿情項目服務,致力於爲金融行業從業者提高信息獲取能力、基礎數據支持及智能技術服務,以便讓相關從業者可以及時掌握、瞭解行業、企業動態,爲金融資產管理、風控評級、行業研究、投資決策等各類金融業務賦能。

 

二、技術創新能力

技術團隊介紹

香儂科技公司擁有集聚算法和和工程能力的專業人工智能技術能力人員,這些專業技術人員大多畢業於國內外知名學府,包括斯坦福大學、麻省理工學院、卡耐基梅隆大學、普利斯頓大學、波士頓大學、愛丁堡大學、密歇根大學、北京大學、清華大學、中科院、中國人民大學等,並在國內外一線企業有相關從業經驗,包括谷歌、微軟、Facebook、亞馬遜、阿里、百度、騰訊、網易等。

技術積累及創新

時至今日,中美科研產出非常接近,中國多個優勢學科表現出世界一流水平,但是中國普遍在基礎研究上,較美國還有一定差異。而基礎科學研究是技術創新和發展的前提和核心,有了產業技術的深根探索和核心控制的前提,纔會有更好的產品和產業控制力的產生。所以香儂自成立伊始,就開始注重基礎科學的研究,累積在人工智能頂級會議發表文章50餘篇,是發表論文量最多的初創公司之一。

且從創立公司起,就希望打造出有中國文化特色、立足於中國本土的全球技術領先人工智能公司,所以香儂科技是第一家專門針對中文提出基於中文的自然語言處理模型的公司,這幾年陸續針對中文提出了多種模型。因爲漢字是象形文字(logographic language),與英文有着本質區別。大多數漢字起源於圖形,字形中蘊藏着豐富的語音信息。而英文是alphabetic language,基於的羅馬字母更多反映的是詞的讀音,而不是語義。然而當今中文自然語言處理的方法,大多是基於英文NLP的處理流程,並沒有考慮漢語字形的信息,所以讓機器學習中文會比其他語言更爲困難。香儂科技提出了基於中文字形的語義表示模型Glyce,打破13項中文自然語言處理記錄。此外,中文自然語言生成之所以難,不僅僅是因爲複雜的字形原因,還有分詞問題,英文單詞之間以空格作爲自然分界符的,而中文以字爲基本的書寫單位,詞語之間沒有明顯的區分標記,針對這個問題香儂科技提出可替代中文分詞的字級別中文神經網絡模型,其效果超過了基於分詞的詞級別模型。

 

三、技術商業化能力

除了重視基礎研究外,香儂科技也同樣重視技術的落地,目前主要將人工智能技術應用於金融領域,提供全球資本市場信息智能服務以及智能投研輿情項目服務,致力於爲金融行業從業者提高信息獲取能力、基礎數據支持及智能技術服務,以便讓相關從業者可以及時掌握、瞭解行業、企業動態,爲金融資產管理、風控評級、行業研究、投資決策等各類金融業務賦能。目前已與60餘家機構展開了合作,包括戰略支援部隊、軍事科學院、上交所、證監會、中信建投證券、招商銀行等機構。

香儂科技產品見微數據專注於提供全球資本市場的信息,爲廣大從業人員提供公告、法律法規、財務數據、盡職調查等方面的檢索、篩選等信息服務,信息覆蓋國內外所有主要市場信息,同時信息可追溯且更新及時,最早可追溯至2000年。此外,在金融領域,文本大多是以PDF文件的形式存在的,爲了讓大家的使用上更爲方便,見微提供了在站內即可對PDF文件直接進行編輯使用的服務,同時利用NLP技術顯著提升了問題智能搜索度。

此外,還有輿情投研數據庫,之所以做這個產品,是因爲除了一級市場和二級市場公開的信息外,目前市場上跟金融相關的第三類渠道數據量越來越多,這些信息在一定程度上影響了投資決策但又不屬於市場統計範圍之內的數據,是智能投研、金融輿情的原材料,但以新聞輿情、財經資訊報道、自媒體言論等爲代表的第三類渠道信息很多並沒有被相關領域的從業者重視。香儂科技認爲,智能投研所揭示的規律實際上是一種“變量間的相關關係”,而不是準確的因果關係,所以對於信息關係的掌握度越完善,越能有效的把控投資決策的走向。

因此,香儂科技內部專業金融業務專家在充分了解金融市場運行和客戶需求的基礎上,結合技術對於所有的第三類數據進行了處理。他們會從海量新聞中識別出對應公司,同時運用自然語言處理技術自動識別出行業標籤和事件標籤,目前香儂梳理出了將近 200 個公司事件標籤,基本上涵蓋了所有重要的金融事件,比如生產情況、供給情況、併購情況等,通過打上這些事件標籤,可以迅速的幫助投資者瞭解新聞內容,同時用於新聞篩選、風控和投資。

 

四、公司未來發展規劃

香儂科技經過不到2年的發展,將自然語言處理技術的研發積澱用在了金融領域,目前要金融類產品包括智能投研、財經輿情、全球資本市場信息提供商見微數據等,未來希望打造智能投研產業鏈閉環生態。

未來將持續深耕金融行業,同時增強人才隊伍的建設,力爭爲中國人工智能隸屬的發展貢獻更多的力量。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章