原创 經典統計語言模型

HAL, LSA, 與COALS 本文介紹三個經典統計語言模型, HAL,LSA, 與COALS. 拍拍腦袋想, 可以怎樣表示一個詞語? 1. 級級遞增 e.g 表示百合 百合<花<植物<物體 2.

原创 Makefile 速成

終於答辯結束,有空來水水博客,今天總結一下Makefile中的常用規則,技巧,基本涵蓋了日常應用, 如有不全希望大家留言添加~ 本文主要內容:一. Makefile/makefile規則及舉例二. make的工作方式三、makefile中

原创 解決 Mac OS SSH 登陸 Linux 出現中文亂碼問題

原理: 都用utf-8. 方法: terminal中: LANG=zh_CN.UTF-8 export LANG terminal preference 中的encoding改成utf-8 關掉terminal, 重新連接

原创 CUDA系列學習(五)GPU基礎算法: Reduce, Scan, Histogram

喵~不知不覺到了CUDA系列學習第五講,前幾講中我們主要介紹了基礎GPU中的軟硬件結構,內存管理,task類型等;這一講中我們將介紹3個基礎的

原创 雙系統 linux開機加載windows硬盤

環境:windows7 + ubuntu雙系統, 用wubi裝的linux問題:默認打開linux, 不加載win7的硬盤;1. GUI下倒是方便, 設備裏點一下就可以加載上, 但是遠程的時候點擊顯示“無法加載硬盤 Not Authori

原创 word2vec——高效word特徵求取

繼上次分享了經典統計語言模型,最近公衆號中有很多做NLP朋友問到了關於word2vec的相關內容, 本文就在這裏整理一下做以分享。 本文分爲 概括word2vec 相關工作 模型結構 Count-based方法 vs. Di

原创 基於MFC和OpenCV實現角點檢測

這篇文章主要爲大家詳細介紹了基於MFC和OpenCV實現角點檢測,具有一定的參考價值,感興趣的小夥伴們可以參考一下 本文實例爲大家分享了MFC和OpenCV實現角點檢測的具體代碼,供大家參考,具體內容如下

原创 CUDA(六). 從並行排序方法理解並行化思維——冒泡、歸併、雙調排序的GPU實現

在第五講中我們學習了GPU三個重要的基礎並行算法: Reduce, Scan 和 Histogram,分析了 其作用與串並行實現方法。 在第六講中,本文以冒泡排序 Bubble Sort、歸併排序 Merge Sort 和排序網絡中的雙

原创 12 papers to understand QA system with Deep Learning

由於最近入手NLP任務,需要看一些paper,本文對最近兩週看的paper做個總結,適用於有deep learning背景,希望瞭解NLP應用的同學,主要針對NLP方向: 問答系統(QA)和翻譯(Machine Translation)。

原创 Dialog System 總結

本文包括對話系統分類、數據彙總、和一些目前對話系統paper的總結、評價。 以下paper的“一句話評論”均爲個人觀念,評價標準苛刻,也有可能誇大了論文的缺點,希望與持不同意見的各位有識之士共同討論。 對話系統分類 Data Pap

原创 C++調用python

本文以實例code講解 C++ 調用 python 的方法。 本文在util.h中實現三個函數: 1. init_log: 用google log(glog)初始化log 2. exe_command: 由 C+

原创 python多線程threading

本文通過 4個example 介紹python中多線程package —— threading的常用用法, 包括調用多線程, 同步隊列類Queue, Ctrl+c結束多線程。 example1. 調用10個線程, 分別打印0~4, 每

原创 Residual Networks <2015 ICCV, ImageNet 圖像分類Top1>

本文介紹一下2015 ImageNet中分類任務的冠軍——MSRA何凱明團隊的Residual Networks。實際上,MSRA是今年Imagenet的大贏家,不單在分類任務,MSRA還用residual networks贏了 Imag

原创 python 調用 C++ code

本文以實例code講解python 調用 C++的方法。 1. 如果沒有參數傳遞從python傳遞至C++,python調用C++的最簡單方法是將函數聲明爲C可用函數,然後作爲C code被python調用,如這裏三樓所示; 2.

原创 php實現Bloom Filter

 Bloom Filter(BF) 是由Bloom在1970年提出的一種多哈希函數映射的快速查找算法,用於快速查找某個元素是否屬於集合, 但不要求百分百的準確率。 Bloom filter通常用於爬蟲的url去重,即判斷某個url是否已經