原创 基於聽覺特性的Mel頻率倒譜分析
基於聽覺特性的Mel頻率倒譜分析 心理學研究表明:人類對於聲音音調的感覺其實都不是線性的 客觀上:用頻率表示 主觀上:音調的單位用Mel標度 公式 根據人耳對低頻信號比對高頻信號更敏感這一原則,研究者根據心理學實驗得到了類
原创 語音信號的倒譜域分析
語音信號的倒譜域分析 倒譜的概念 定義:倒譜定義爲信號短時振幅譜(功率譜)的對數傅里葉反變換 特點:具有可近似地分離並能提取出頻譜包絡信息和細微結構信息的特點。 倒譜的分析流程 IDFT:離散傅里葉逆變換 A:短時信號 B:短
原创 數字圖像的表示
數字圖像的表示 圖像是由像素構成的 圖像分類 二值圖像(0/1) 灰度圖像(0:黑;255:白;other:灰) RGB圖像(R:red,G:green,B:blue) 注意: openCV順序:BGR 讀取圖像:r
原创 語音信號的頻域分析
語音信號的頻域分析 語音的感知過程與人類聽覺系統具有頻譜分析功 能緊密相關。因此,對語音信號進行頻譜分析, 是認識語音信號和處理語音信號的重要方法 聲音從頻率上可以分爲純音和複合音。純音只含 一種頻率的聲音(基音),而沒有倍音。複
原创 相機模型與標定(學習筆記)
相機模型與標定 內外參定義 相機中有四個座標系,分別是{world}、{camera}、{image}、{pixel} {world}:世界座標系,可以任意指定xw和yw軸 {camera}:相機座標系,原點位於小孔,z軸與光軸
原创 交互式前景提取GrabCut
交互式前景提取GrabCut GrabCut算法的具體實施過程 在圖片中定義含有(一個或多個)物體的矩形框 矩形框外的區域被自動認爲是“確定背景” 對於用戶自定義的矩形區域,可用背景中的數據來區別矩形框區域內的前景和背景區域 用
原创 順序表基本操作的代碼實現
順序表基本操作的代碼實現 初始化 靜態分配方式 #include <stdio.h> #define MaxSize 10 //定義最大長度 typedef struct{ int data[MaxSize]; //存放數據
原创 模板匹配
模板匹配 模板匹配原理 定義:模板匹配就是在整個圖像區域發現與給定字圖像匹配的最小區域 條件:需要有一個模板圖像T,一個待檢測的圖像——源圖像 I 工作方法:在待檢測圖像I上,從左到右,從上向下計算模板圖像與重疊字圖像的匹配度,匹
原创 語音信號的預處理
概述 語音信號是一種非平穩的時變信號,它攜帶着大量信息。在語音編碼、語音合成、語音識別和語音增強等語音處理中,都需要提取語音中包含的各種信息 語音處理的目的 對語音信號進行分析,提取特徵參數,用於後續處理 加工語音信息,如語音增
原创 濾波和卷積
濾波和卷積 圖像閾值處理 原始圖像 其中 紅色線爲閾值 二進制閾值化 小於閾值的——0 大於閾值的——255 反二進制閾值化 小於閾值的——255 大於閾值的——0 截斷閾值化 小於閾值的——本身 大於閾值的——取閾值 反
原创 傅里葉變換
傅里葉變換 理論基礎 時間域與頻域相互轉換來看信號 使用Numpy實現傅里葉變換 numpy.fft.fft2 實現傅里葉變換 返回一個複數數組(complex ndarray) numpy.fft.fftshift 將零頻
原创 常見的圖像變換
常見的圖像變換 直方圖處理 基本概念 直方圖 橫座標:圖像中各個像素點的灰度級 縱座標:具有該灰度級的像素個數 歸一化直方圖 橫座標:圖像中各個像素點的灰度級 縱座標:出現這個灰度級的概率 DIMS:使用參數的數量 di
原创 如何連接上springcloud搭建的網關
如何連接上springcloud搭建的網關 需求描述 由於小程序的發佈需要用域名訪問,不能直接裸ip,所以需要綁定域名 環境說明 使用springboot搭建的後端項目 使用springcloud搭建的網關 例如,域名爲 htt
原创 操作小記(圖像梯度處理)
圖像梯度處理 描述:使用sobel算子、scharr算子和Laplacian算子處理同一幅圖像(核的大小相同),觀察其結果的不同 代碼 import cv2 import numpy as np import matplotlib
原创 操作小記(圖像平滑處理)
圖像平滑處理 描述:使用均值濾波、中值濾波、高斯濾波、雙邊濾波和自定義卷積覈對同一幅圖像進行處理,觀察其結果的不同 代碼 import cv2 import numpy as np import matplotlib.pyplot