原创 【Natural Language Processing】基於CRF++的中文分詞

一、任務簡介         中文分詞是中文信息處理領域中的最重要的任務,它對於智能信息處理技術具有重要的意義,當前的各種漢語分詞技術都可以取得不錯的結果。 本任務做的是繁體中文分詞,將訓練語料的30%作爲驗證集,70%作爲訓練集,按通常

原创 【Machine Learning】通過網格搜索進行調參

        在我們日常的進行超參數優化工作時,可以手動去試,也可以使用隨機搜索、批量隨機搜索和網格搜索等方法調到好的參數,關於網格搜索,sklearn中GridSearchCV用於系統地遍歷多種參數組合,通過交叉驗證確定最佳效果參數。

原创 【Machine Learning】特徵工程之獨熱編碼(One-hot Encoding)

一、獨熱編碼         當我們在機器學習做特徵工程時,如果某個categorical特徵具有多個符號值,則不可能對具有這種特徵的數據進行訓練,而獨熱編碼是解決這個問題的一種方法。比如我們有一個特徵是protocol_type有三個值

原创 【Deep Learning】LSTM(Long Short-Term Memory)及變體

        通過對RNN理解的基礎上(具體可見:【Deep Learning】循環神經網絡推導和實現),可以進一步瞭解LSTM(LongShort-Term Memory,其出現的原因是爲了解決RNN對長依賴的句子上表現不好的情況。其

原创 【論文筆記】An End-to-End Model for QA over KBs with Cross-Attention Combining Global Knowledge

版權聲明:本文爲博主原創文章,未經博主允許不得轉載。 https://blog.csdn.net/LAW_130625/article/details/78484866 一、概要   該文章發於ACL 201

原创 【論文筆記】Adversarial Multi-task Learning for Text Classification

版權聲明:本文爲博主原創文章,未經博主允許不得轉載。 https://blog.csdn.net/LAW_130625/article/details/78841665 一、概要   該文章發於ACL 201

原创 【Natural Language Processing】語言模型訓練工具Srilm的安裝及使用簡介

版權聲明:本文爲博主原創文章,未經博主允許不得轉載。 https://blog.csdn.net/LAW_130625/article/details/78507882   實習做了一段時間的語言模型,使用到了

原创 【論文筆記】Question Answering over Freebase with Multi-Column Convolutional Neural Networks

版權聲明:本文爲博主原創文章,未經博主允許不得轉載。 https://blog.csdn.net/LAW_130625/article/details/78447156 一、概要   該文章發於ACL 201

原创 【論文筆記】Question Answering with Subgraph Embeddings

版權聲明:本文爲博主原創文章,未經博主允許不得轉載。 https://blog.csdn.net/LAW_130625/article/details/78409742 一、概要   該文章發於EMNLP 2

原创 【論文筆記】Semantic Parsing on Freebase from Question-Answer Pairs

版權聲明:本文爲博主原創文章,未經博主允許不得轉載。 https://blog.csdn.net/LAW_130625/article/details/78385514 一、概要   該文章發於EMNLP 2

原创 【其他】Tensorflow分佈式使用簡介

版權聲明:本文爲博主原創文章,未經博主允許不得轉載。 https://blog.csdn.net/LAW_130625/article/details/78711103 一、 單機多GPU訓練   深度

原创 【C++學習筆記】函數基礎和參數傳遞

版權聲明:本文爲博主原創文章,未經博主允許不得轉載。 https://blog.csdn.net/LAW_130625/article/details/78929776 一、函數基礎   一個函數(funct

原创 【C++學習筆記】標準庫類型string

版權聲明:本文爲博主原創文章,未經博主允許不得轉載。 https://blog.csdn.net/LAW_130625/article/details/78629062   標準庫類型string表示可變長的字

原创 【C++學習筆記】函數返回和函數重載

版權聲明:本文爲博主原創文章,未經博主允許不得轉載。 https://blog.csdn.net/LAW_130625/article/details/79003165 一、返回類型和return語句   r

原创 【Machine Learning】模型融合之Stacking

版權聲明:本文爲博主原創文章,未經博主允許不得轉載。 https://blog.csdn.net/LAW_130625/article/details/78573736 一、Stacking簡介   Stac