原创 基於聽覺特性的Mel頻率倒譜分析

基於聽覺特性的Mel頻率倒譜分析 心理學研究表明:人類對於聲音音調的感覺其實都不是線性的 客觀上:用頻率表示 主觀上:音調的單位用Mel標度 公式 根據人耳對低頻信號比對高頻信號更敏感這一原則,研究者根據心理學實驗得到了類

原创 語音信號的倒譜域分析

語音信號的倒譜域分析 倒譜的概念 定義:倒譜定義爲信號短時振幅譜(功率譜)的對數傅里葉反變換 特點:具有可近似地分離並能提取出頻譜包絡信息和細微結構信息的特點。 倒譜的分析流程 IDFT:離散傅里葉逆變換 A:短時信號 B:短

原创 數字圖像的表示

數字圖像的表示 圖像是由像素構成的 圖像分類 二值圖像(0/1) 灰度圖像(0:黑;255:白;other:灰) RGB圖像(R:red,G:green,B:blue) 注意: openCV順序:BGR 讀取圖像:r

原创 語音信號的頻域分析

語音信號的頻域分析 語音的感知過程與人類聽覺系統具有頻譜分析功 能緊密相關。因此,對語音信號進行頻譜分析, 是認識語音信號和處理語音信號的重要方法 聲音從頻率上可以分爲純音和複合音。純音只含 一種頻率的聲音(基音),而沒有倍音。複

原创 相機模型與標定(學習筆記)

相機模型與標定 內外參定義 相機中有四個座標系,分別是{world}、{camera}、{image}、{pixel} {world}:世界座標系,可以任意指定xw和yw軸 {camera}:相機座標系,原點位於小孔,z軸與光軸

原创 交互式前景提取GrabCut

交互式前景提取GrabCut GrabCut算法的具體實施過程 在圖片中定義含有(一個或多個)物體的矩形框 矩形框外的區域被自動認爲是“確定背景” 對於用戶自定義的矩形區域,可用背景中的數據來區別矩形框區域內的前景和背景區域 用

原创 順序表基本操作的代碼實現

順序表基本操作的代碼實現 初始化 靜態分配方式 #include <stdio.h> #define MaxSize 10 //定義最大長度 typedef struct{ int data[MaxSize]; //存放數據

原创 模板匹配

模板匹配 模板匹配原理 定義:模板匹配就是在整個圖像區域發現與給定字圖像匹配的最小區域 條件:需要有一個模板圖像T,一個待檢測的圖像——源圖像 I 工作方法:在待檢測圖像I上,從左到右,從上向下計算模板圖像與重疊字圖像的匹配度,匹

原创 語音信號的預處理

概述 語音信號是一種非平穩的時變信號,它攜帶着大量信息。在語音編碼、語音合成、語音識別和語音增強等語音處理中,都需要提取語音中包含的各種信息 語音處理的目的 對語音信號進行分析,提取特徵參數,用於後續處理 加工語音信息,如語音增

原创 濾波和卷積

濾波和卷積 圖像閾值處理 原始圖像 其中 紅色線爲閾值 二進制閾值化 小於閾值的——0 大於閾值的——255 反二進制閾值化 小於閾值的——255 大於閾值的——0 截斷閾值化 小於閾值的——本身 大於閾值的——取閾值 反

原创 傅里葉變換

傅里葉變換 理論基礎 時間域與頻域相互轉換來看信號 使用Numpy實現傅里葉變換 numpy.fft.fft2 實現傅里葉變換 返回一個複數數組(complex ndarray) numpy.fft.fftshift 將零頻

原创 常見的圖像變換

常見的圖像變換 直方圖處理 基本概念 直方圖 橫座標:圖像中各個像素點的灰度級 縱座標:具有該灰度級的像素個數 歸一化直方圖 橫座標:圖像中各個像素點的灰度級 縱座標:出現這個灰度級的概率 DIMS:使用參數的數量 di

原创 如何連接上springcloud搭建的網關

如何連接上springcloud搭建的網關 需求描述 由於小程序的發佈需要用域名訪問,不能直接裸ip,所以需要綁定域名 環境說明 使用springboot搭建的後端項目 使用springcloud搭建的網關 例如,域名爲 htt

原创 操作小記(圖像梯度處理)

圖像梯度處理 描述:使用sobel算子、scharr算子和Laplacian算子處理同一幅圖像(核的大小相同),觀察其結果的不同 代碼 import cv2 import numpy as np import matplotlib

原创 操作小記(圖像平滑處理)

圖像平滑處理 描述:使用均值濾波、中值濾波、高斯濾波、雙邊濾波和自定義卷積覈對同一幅圖像進行處理,觀察其結果的不同 代碼 import cv2 import numpy as np import matplotlib.pyplot