原创 知識圖譜—關係抽取—遠程監督—OpenNRE(一)

一、遠程監督簡介         遠程監督的英文名稱Distant Supervision,是目前關係抽取中比較常見的一類做法。該方法由 M Mintz 大佬於ACL2009上首次提出,它既不是單純的傳統意義上的監督語料,當然也不是無監督

原创 深度學習環境搭建(二)—— Ubutun16.04 安裝CUDA、CUDNN

          該篇關於安裝CUDA、CUDNN的博客是基於已經安裝好NVIDA驅動的基礎,具體如何安裝NVIDIA驅動可參考我的上一篇博客 一、安裝CUDA (1)CUDA官網選擇適合自己系統的版本下載。(建議選擇CUDA10.

原创 深度學習之RNN和LSTM(七)

一、RNN        RNN(Recurrent Neural Networks,循環神經網絡)不僅會學習當前時刻的信息,也會依賴之前的序列信息,允許信息持久化。由於其特殊的網絡模型結構解決了信息保存的問題。所以RNN對處理時間序列和

原创 python3 時間格式轉換

廢話不多說,直接上代碼,關於python3中時間戳、datetime、str的轉換,以及兩個時間的時間間隔計算方式等。 import time import datetime release_time = 1558426818

原创 樹結構(二)——二叉搜索樹、平衡二叉樹、紅黑樹、B樹、B+樹

        本篇博客內容略多,涵蓋面比較廣,小編也是正在學習中,故讀者在發現有錯誤的說法,歡迎在評論區指出。此外,樹結構本身就是一個非常複雜的大家庭,各種規則,各種條件,望大家不要氣餒,加油,奧利給。 一、二叉搜索樹         

原创 Transform中的Attention注意力機制

本文邊講細節邊配合代碼實戰,代碼地址爲: https://github.com/princewen/tensorflow_practice/tree/master/basic/Basic-Transformer-Demo 數據地址爲:h

原创 詞向量發展史-共現矩陣-SVD-NNLM-Word2Vec-Glove-ELMo

話不多說,直接上乾貨。 首先介紹相關概念: 詞嵌入:把詞映射爲實數域上向量的技術也叫詞嵌入(word embedding)。 詞向量的分類表示: 一、共現矩陣        通過統計一個事先指定大小的窗口內的word共現次數,以word

原创 擁抱Transformer,圖解NLP處理流程四部曲

一、Transformer簡介                Transformer是google團隊在2017年提出來的,它的問世刷新了一系列NLP競賽的結果,現在也成爲各大NLP愛好者的首選結構,諸如ELMO、Bert等超牛的mode

原创 深度學習環境搭建(一) —— Ubutun16.04 安裝NVIDIA驅動

一、在Mac上製作ubutun啓動盤         傳統的深度學習開發都是基於Linux系統,而大部分人都選擇安裝Ubutunl來開發。安裝Ubutun啓動盤在Windows要容易很多,只要下載對應的Ubutun鏡像再借助UltraIS

原创 Spark教程(二)—— RDD運行原理

一. RDD設計背景         程序運行階段會涉及很多迭代算法, 這些場景的共同之處是, 不同計算階段會重用中間結果, 即一個階段的輸出作爲下一個階段的輸入. MapReduce在處理這種情況的時候更多的是把中間結果寫入到HDFS中

原创 Spark教程(三)—— 安裝與使用

        Spark可以獨立安裝使用,也可以和Hadoop一起安裝使用。本教程中,我們採用和Hadoop一起安裝使用,這樣,就可以讓Spark使用HDFS存取數據。需要說明的是,當安裝好Spark以後,裏面就自帶了scala環境,不

原创 EleasticSearch綜述(二)

1. 簡單Demo 索引 (1) 創建一個名字爲demo的索引 PUT http://localhost:9200/demo ES響應 { "acknowledged": true, "shards_acknowled

原创 EleasticSearch綜述(一)

        Elasticsearch是一個開源的分佈式、RESTful 風格的搜索和數據分析引擎,它的底層是開源庫Apache Lucene。EleasticSearch的特點如下: 一個分佈式的實時文檔存儲,每個字段可以被索引與搜

原创 信息檢索之BM25算法

BM25算法參考文檔,搜索引擎中的相關應用。 import math import jieba class BM25(object): def __init__(self, docs): self.D =

原创 樹結構(一)——二叉樹、字典樹的操作

一、二叉樹的遍歷         樹結構分爲廣度優先遍歷和深度優先遍歷。廣度遍歷是一層一層的遍歷樹中的元素,這種遍歷方式需要藉助隊列的方式,左右子樹分別入隊列,利用隊列先進先出的特性,按層對樹進行遍歷。深度遍歷有又分爲前序遍歷、中序遍歷、