原创 關於xilinx調試過程中的問題

在調試關於物體檢測的程序,用ISE14.7編譯時出現以下問題 發現14.7不能支持xc7v2000t 在Xilinx官網發現以下信息 General Information The ISE 14.7 design tool re

原创 MLLT(最大似然線性變換)

主要目的是:在最大似然(ML)準則下使用一個線性變換矩陣對參數特徵矢量進行解相關。 在ML準則下,評價一個模型‘好壞’的標準是訓練數據與模型匹配的似然度,如果似然度越高的話,我們說這個模型越好。MLLT的作者給出了在最大似然準則下(ML)

原创 kaldi特徵和模型空間轉換

kaldi特徵和模型空間轉換 博主話:這篇博客是對kaldi官網中Feature and model-space transforms in Kaldi 的翻譯,因爲不是專業翻譯人士,接觸kaldi時間也不長,所以難免有

原创 中星微 星光智能一號

在人機大戰中,AlphaGo依靠模仿人腦生物機理的深度學習算法而擊敗李世石。深度學習,是源於對生物人腦機理的仿生學研究而形成的一種人工智能算法。作爲深度學習神經網絡的一種,卷積神經網絡CNN (Convolutional Neural N

原创 關於人就是不斷學習,才能稱之爲人

上篇博文是轉載的CSDN排名第三的大牛的文章,雖然在他的博客已經刪掉了,我還是通過朋友的博客看到了。文章很長,我是懷着越看越激動,越看越覺得自己需要反思的心情看到了最後。最後的自己像充了很多氣的皮球,鼓鼓的,甚至都不知道那些氣體從哪兒來,

原创 聲學模型概述

這篇博客是關於聲學模型的簡單介紹。 輸出概率 聲學模型的輸入是由特徵提取模塊提取的特徵(比如mfcc特徵)。一般來說,這些特徵是多維的向量,並且其取值可以是離散或連續的。 早期的聲學模型常常採用矢量聚類(Vector Quantif

原创 兩小時回顧c++基礎

回顧一下,容易忘記的c++的一些需要注意,而往往會忽視的點。 標識符 C++ 標識符內不允許出現標點字符,比如 @、$ 和 %。C++ 是區分大小寫的編程語言。 標識符以字母 A-Z 或 a-z 或下劃線 _ 開始,後跟零個或多個字

原创 淺談視頻監控行業編解碼技術的發展與應用

本文轉自 浙江大華技術股份有限公司產品經理 張龍彪 視頻監控技術經過多年的發展,監控畫面正經歷着從最初的D1標清圖像,向4K高清、8K超清時代前進。由於CCD與CMOS技術的發展,前端攝像機的像素越來越高,成本也在逐漸的降低,高清

原创 c++匿名函數與日期時間

講一下c++不常見的一些知識點,以後遇到了可以查看。 匿名函數 C++11 提供了對匿名函數的支持,稱爲 Lambda 函數(也叫 Lambda 表達式)。 [](int x, int y) -> int { int z = x + y

原创 kaldi安裝及yesno實例

Kaldi是一個非常強大的語音識別工具庫,主要由Daniel Povey開發和維護。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多種語音識別的模型的訓練和預測。其中DNN-HMM中的神經網絡還可以由配置文件自定義,DNN、C

原创 kaldi timit實例運行全過程

第一步:準備timit的數據包 1.下載timit數據包,我已經上傳到百度雲盤—鏈接http://pan.baidu.com/s/1qYkDora 2.將timit數據包TIMIT.zi

原创 GPU CPU NPU

隨着人工智能和深度學習逐漸進入人們視野,中科院、谷歌、IBM、英偉達等中美科研機構和商業公司也紛紛推出了用於深度學習的處理器。在上述產品中,既有CPU、GPU、DSP這樣的傳統芯片,也有專門爲深度學習而生的NPU。那麼,CPU、GPU、D

原创 yuv轉成matlab可讀的rgb格式

YUV(亦稱YCrCb)是被歐洲電視系統所採用的一種顏色編碼方法(屬於PAL,PAL是指色彩系統,經常被配以625線、每秒25格畫面、隔行掃描的電視廣播格式)。 YUV主要用於優化彩色視頻信號的傳輸,使其向後兼容老式黑白電視。與RGB視

原创 音視頻編碼從小白開始(1)

視頻序列中的每一幅圖像,都是有NxM個像素組成的,每個像素都有具體的數值,視頻序列可以表示爲三維矩陣,其中NxM這兩個維度表示每幅圖的像素值,形成視頻的空間域,另一個維度代表視頻的時間域。 彩色視頻需要三個矩陣,分別代表三個基本都色彩分

原创 mencoder.exe在win10下將y4m轉換成yuv文件

最近在做有關視頻編解碼的工作,雖然還是小白,但是有一些進展可以和大家分享一下。 分享一個下載HEVC test sequence 的網址https://media.xiph.org/video/derf/ 但是下載下來的序列都是y4m