原创 我的讀研經歷與算法崗求職經驗

其實一直覺得自己求職經歷與校招去的公司相對於很多大神來說,並不算什麼,所以也一直沒有想法寫關於自己的讀研以及求職經驗。不過,最近經一個朋友的提醒,我想雖然自己的求職經歷並不算很牛逼,但總會給一些準備找工作或者準備校招的人一些幫助。

原创 Chatbot-檢索式模型介紹(一)

檢索式模型介紹(一) 這個系列的文章主要是介紹一些可以作爲文本匹配工作的一些模型,有些是比較基礎的算法,例如bm25。有些模型是基於深度學習的架構,比如說deepMatch模型。個人認爲文本匹配的任務有兩種實現方式,一個是學習不同

原创 tensorflow serving服務器安裝過程總結

1.安裝環境 centos cuda 9 cudnn 7 tensorflow serving r1.12 以及tensorflow1.12通過編譯. 2.非gpu版本tf_serving安裝 tf_serving的安裝(非gpu版

原创 bert模型代碼介紹

關於bert模型的細節記錄 1. Input 1.1. pretrain 輸入包含七個部分,分別爲 input_ids,input_mask,segment_ids,masked_lm_positions,mask_lm_ids,m

原创 tensorflow- tf.reduce_all

函數 tf.reduce_all 示例

原创 tensorflow-tile_batch

函數tensorflow.contrib.seq2seq.tile_batch 作用 主要是對tensor複製 import tensorflow.contrib.seq2seq as seq2seq 示例

原创 tensoflow-unstack

函數unstack 示例

原创 論文總結:Ask Me Anything: Dynamic Memory Networks for Natural Language Processing

論文總結:Ask Me Anything: Dynamic Memory Networks for Natural Language Processing簡介具體結構Input ModuleQuestion ModuleEpisodi

原创 如何將pyspark的rdd數據類型轉化爲DataFrame

簡述   在用pyspark進行開發的時候,經常會遇到如何將pyspark讀取的數據使用xgboost的模型進行訓練,當然,如果是使用scala,可以直接使用xgboost4j,這個庫裏面提供了可以讀取rdd的數據文件的函數接口,通過

原创 關於中英文語料的獲取途徑總結

中文: https://github.com/candlewill/Dialog_Corpus 這個是一個集合,包括之前答主的答案! 包含的語料包括了 1)小黃雞 xiaohuangji50w_nofenci.conv.zip

原创 關於RNN相關模型-tensorflow源碼理解

本文主要是對tensorflow中lstm模型中的c,h進行解析。rnn_cell_impl.py 1.關於RNN模型 在rnn_cell_impl.py的tensorflow源碼中,關於RNN部分實現的類主要是BasicRNNCell,

原创 Normalization Technique總結

1.相關介紹: 神經網絡在多個領域取得了非凡的成就,例如,語音識別,圖像識別等。所以,訓練神經網絡是個重要的任務,gradient descent常被用來尋來拿神經網絡。但在網絡比較深時,gradient descent容易出現梯度消失或

原创 grid lstm模型簡介

理論介紹 主要通過論文《Grid Long short-Term Memory》。 grid LSTM沿着任何或所有維度(包括網絡深度)部署cell。 一個Grid LSTM網絡的block有N個hidden vector h1,

原创 關於transformer模型總結(源碼)

本文主要是對transfermer模型的源碼進行解析: transfermer主要結構是由encoder和decoder構成。其中,encoder是由embedding + positional_encoding作爲輸入,然後加

原创 SRU介紹

1.背景介紹     RNN模型在機器翻譯,語言模型,問答系統中取得了非凡的成就,由於RNN的結構,當前的層輸入爲前一層的輸出,所有RNN比較適合時間序列問題,但也正是由於這種串行結構,限制了RNN模型的訓練速度,與CNN相比,RNN並不