ESC-50數據集的分析(1)

原創

2020-05-26 19:54

單個音頻波形圖和對應聲譜圖的可視化|特徵可視化

原始資料來自原作者的jupyter notebook^[jupyter]

這裏的一些可視化工具，可能可以用來新的數據集分析，以及算法性能比較。

本人謄寫的代碼在這裏^[source]

單個音頻波形圖和對應聲譜圖的可視化

特徵可視化

這裏是用來分析所使用的音頻特徵的區分度（有效性）。可視化的方法有很多，但是背後其實是降維。以常用的音頻特徵MFCC爲例，首先看一下在單個音頻clip上的分佈表現。這裏用的seaborn的boxplot實現了一個特徵分佈的箱圖。箱圖是一個看起來高大上的統計指標，主要用來表徵數據的分佈情況。和簡單的使用均值和方差相比，箱圖可以反映更多的信息。seaborn是matplotlib的高級封裝版，僅此而已。

注意 $MFCC_0$ 的意思不大，因爲它的分佈實在是有點平凡。但是注意到 $MFCC_1$ 和 $MFCC_2$ 的分佈差異很明顯。（在特徵表示裏，特徵的各個維度區分度diversity越明顯越好）

我們可以進一步分析 $MFCC_1$ 在不同clips之間的表現。同樣帶上過零率。過零率的區分度和MFCCs還是很大的。

上面是第20類（Crying baby）的特徵可視化，再看一看Rain這個類的特徵可視化：

兩張圖一比較，就能發現這兩類聲音的特徵 $MFCC_{1}$ 分佈差異還是很明顯的。

最後來一張50類的全家福：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Opal 機器學習平臺：愛奇藝數智一體化實踐

01 綜述 Opal 是愛奇藝大數據團隊研發的機器學習平臺，包含特徵生產、樣本構建、模型訓練、模型部署在內的多環節 Bigdata + AI 開發服務，內置多種訓練鏡像、

愛奇藝技術產品團隊

2024-06-01 02:21:16

愛奇藝公有云對賬標準化實踐

01 背景雲成本系統化管理公有云作爲基礎架構部核心資源之一，其成本佔比逐年上升，企業對於公有云成本實施精細化管理的需求越來越高。相較於私有化部署主要關注服務器、網設、帶

愛奇藝技術產品團隊

2024-06-08 02:19:16

低代碼：加速企業數字化轉型的利器

隨着企業數字化轉型步伐的加快，低代碼開發平臺迅速成爲市場的焦點。**憑藉其能簡化開發流程、縮短交付時間和降低成本等優勢，**低代碼已經贏得了企業和開發人員的廣泛認可，已成爲推動企業數字化轉型、提高企業創新效率、競爭力的關鍵工具。本文將詳細介

2024-06-07 21:18:49

史上最強 AI 翻譯誕生了！拳打穀歌，腳踢 DeepL

CoT 推理範式默認情況下，大語言模型通常是直接給出問題的最終答案，中間推理過程是隱含的、不透明的，無法發揮出大模型最極致的理解能力。如果你用它來充當翻譯，可能效果和傳統的機器翻譯也差不了太多。如果我們給大模型設計一個合理的提示詞，控制

2024-06-07 21:16:43

國內首場 Unstructured Data Meetup 收官！GenAI 如何連接非結構化數據？

近日，國內首場 Unstructured Data Meetup 圓滿收官！本次 Meetup 由向量數據庫領軍者 Zilliz 創辦的，同時還邀請到來自 MOSS & OpenMOSS、螞蟻集團、LangChain 中國社區的技術專

2024-06-06 14:16:06

界面控件DevExpress WinForms的流程圖組件 - 可完美複製Visio功能（二）

DevExpress WinForms的Diagram（流程圖）組件允許您複製Microsoft Visio中的許多功能，並能在下一個Windows Forms項目中引入信息豐富的圖表、流程圖和組織圖。 P.S：DevExpress Win

2024-06-04 12:32:12

暗水印——變換域DCT水印算法（一種通用性強，能有抵禦攻擊的手段）

引言隨着計算機和網絡技術的飛速發展，信息的安全保護問題日益突出。數字圖像、音頻和視頻等多媒體數字產品愈來愈需要一種有效的版權保護方法——水印技術，通常用於保護知識產權、防止未經授權的訪問、作弊等。廣義上可以把水印技術劃分爲四大類：

2024-06-04 12:09:29

爲何都在談低代碼？快速瞭解低代碼技術在 ITSM 中的應用

直達原文：【ITSM系列】爲何都在談低代碼？快速瞭解低代碼技術在ITSM中的應用還記得早期的 Dreamweaver 嗎？爲了提高網頁的開發效率，Dreamweaver 提供了可視化拖拽的能力來生成網頁代碼。可見，低代碼、無代碼的探索和

2024-06-04 02:44:11

數據驅動製造：EMQX ECP 指標監測功能增強生產透明度

邁向未來的工業生產，需要的不僅是自動化，更是智能化。如果工業企業的管理者能夠實時監測每一生產環節的設備運行狀態，每一數據點位情況，洞察和優化每一步生產流程，他們將能夠做出更精準的決策，提高生產效率和產品質量。通過集成先進的指標監測工具，

2024-06-03 22:11:10

要得要得！Zabbix Meetup重慶站精彩回顧

Zabbix Meetup 重慶站精彩回顧 5月25日，Zabbix城市行首次來到重慶，這場盛會集合了講師們的經驗心得、案例分享，60多位嘉賓都享受其中，收穫頗豐！感謝Oce

2024-05-31 22:33:02

一文搞懂DevOps、DataOps、MLOps、AIOps：所有“Ops”的比較

引言近年來，"Ops"一詞在 IT 運維領域的使用迅速增加。IT 運維正在向自動化過程轉變，以改善客戶交付。傳統的應用程序開發採用 DevOps 實施持續集成（CI）和持續部署（CD）。但對於數據密集型的機器學習和人工智能（AI）應用，精

2024-06-07 14:08:38

首批！Zilliz 獲得亞馬遜雲科技生成式 AI 合作伙伴能力認證

Zilliz 正式宣佈通過亞馬遜雲科技生成式 AI 能力認證！這一認證不僅肯定了 Zilliz 在人工智能和非結構化數據領域的卓越能力，也標誌着 Zilliz 在推動 AI 技術創新和應用的道路上邁出了重要一步。亞馬遜雲科技生

2024-06-06 14:16:04

基於對比稀疏擾動技術的時間序列解釋框架 ContraLSP

開篇近日，由阿里雲計算平臺大數據基礎工程技術團隊主導，與南京大學、賓夕法尼亞州立大學、清華大學等高校合作，解釋時間序列預測模型的論文《Explaining Time Series via Contrastive and Locally

2024-06-01 00:25:50

大模型在推薦系統中的精準推薦策略與實踐

引言推薦系統在現代互聯網應用中佔據了極其重要的位置。無論是電商平臺、社交媒體、音樂和視頻流媒體服務，還是新聞和內容推薦系統，推薦系統都在提高用戶體驗和平臺收益方面發揮着關鍵作用。近年來，隨着人工智能和機器學習技術的迅猛發展，大模型（如G

2024-06-06 23:55:10

讓應用會說話：智能語音助手全流程揭祕

親愛的朋友們，今天我要帶你走進一個充滿魔法的世界——手搓一個語音智能助手。這個智能助手不僅僅是簡單的自動化工具，它們能夠通過自然語言與你進行流暢的對話，理解你的需求，並提供個性化的服務。它們是如何做到的呢？讓我們一探究竟！

2024-06-01 00:12:24

24小時熱門文章

最新文章

最新評論文章