原创 ##好好好好###開源的標註工具

## 開源的標註工具 自然語言處理標記工具彙總 https://blog.csdn.net/wangyizhen_nju/article/details/94559607 spacy原來有兩個標註工具,displaCy-ent和displ

原创 ###haohaohao######主動學習用於標註優化迭代

我們使用一些傳統的監督學習方法做分類的時候,往往是訓練樣本規模越大,分類的效果就越好。但是在現實生活的很多場景中,標記樣本的獲取是比較困難的,這需要領域內的專家來進行人工標註,所花費的時間成本和經濟成本都是很大的。而且,如果訓練樣本的規模

原创 ###豪豪豪豪######2020 推薦系統技術演進趨勢瞭解

讀知乎文章《推薦系統技術演進趨勢:從召回到排序再到重排》筆記: 《推薦系統技術演進趨勢:從召回到排序再到重排》這篇文章主要說了下最近兩年,推薦系統技術的一些比較明顯的技術發展趨勢。主要從以下幾個方面介紹: 推薦系統整體架構 召回技術演進趨

原创 ###好好好######一文詳解微服務架構

本文將介紹微服務架構和相關的組件,介紹他們是什麼以及爲什麼要使用微服務架構和這些組件。本文側重於簡明地表達微服務架構的全局圖景,因此不會涉及具體如何使用組件等細節。 爲了防止不提供原網址的轉載,特在這裏加上原文鏈接:https://ww

原创 einsum初探

Einsum 是幹嘛的? 使用愛因斯坦求和約定,可以以簡單的方式表示許多常見的多維線性代數數組運算。舉個栗子:給定兩個矩陣A和B,我們想對它們做一些操作,比如 multiply、sum或者transpose。雖然numpy裏面有可以直接使

原创 事件抽取與事理圖譜(一)

事件抽取是信息抽取研究中最具挑戰性的任務之一,其主要研究如何從非結構化自然語言文本中抽取出事件的基本信息,例如事件的類型,事件的參與者,發生時間和地點等,並以結構化的形式呈現出來。 一些信息抽取領域的國際評測會議針對事件抽取提出了一系列的

原创 #####好好好#######一文揭祕!自底向上構建知識圖譜全過程

阿里妹導讀:知識圖譜的構建技術主要有自頂向下和自底向上兩種。其中自頂向下構建是指藉助百科類網站等結構化數據源,從高質量數據中提取本體和模式信息,加入到知識庫裏。而自底向上構建,則是藉助一定的技術手段,從公開採集的數據中提取出資源模式,選擇

原创 ####haohaohaohao#####愛奇藝個性化推薦排序實踐

作者|Michael 作者介紹 Michael,推薦算法助理研究員,2014年碩士畢業於北京郵電大學後加入愛奇藝。從事推薦算法的研發和管理工作,對於機器學習和深度學習在推薦上的應用有着豐富的經驗。 請輸入標題     abcdefg 導

原创 ####好好好######信息抽取——實體關係聯合抽取

信息抽取——實體關係聯合抽取 目錄 簡介 實體關係聯合抽取 Model 1: End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures Mode

原创 ###好好好好#####模型蒸餾(Distil)及mnist實踐

結論:蒸餾是個好方法。 模型壓縮/蒸餾在論文《Model Compression》及《Distilling the Knowledge in a Neural Network》提及,下面介紹後者及使用keras測試mnist數據集。 蒸餾

原创 ###好好好##知識圖譜與推薦系統

文章目錄     知識圖譜與個性化推薦         1、推薦系統的任務和難點         2、知識圖譜的優勢         3、知識圖譜與推薦系統的結合方法             3.1 基於特徵的推薦方法          

原创 事件抽取相關論文

# 商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。 # For commercial use, please contact the author for authorization. For non-commercial use,

原创 詳解編輯距離(Edit Distance)及其代碼實現

概述 編輯距離(Minimum Edit Distance,MED),由俄羅斯科學家 Vladimir Levenshtein 在1965年提出,也因此而得名 Levenshtein Distance。 在信息論、語言學和計算機科學領域,

原创 ####好好好###多因子融合的實體識別與鏈指消歧

雷鋒網AI科技評論按:本文爲上汽集團人工智能實驗室祝凱華,戴安南,範雪麗向雷鋒網AI科技評論獨家投稿。本文的研究對象是“面向中文短文本的實體鏈指任務”,該任務擁有9萬條語句用於做實體識別和實體消歧。相應論文在該評測中獲得top3。 全國知

原创 python高併發的解決方案

python高併發的解決方案 一.cdn加速 簡單說就是把靜態資源放到別人服務器上 全稱:Content Delivery Network或Content Ddistribute Network,即內容分發網絡 基本思路: 儘可能避開互聯