国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

工具學習——使用OpenSmile提取音頻特征

2年前作者：客院載論分類：Toy博客閱讀(30)違法舉報

這篇具有很好參考價值的文章主要介紹了工具學習——使用OpenSmile提取音頻特征。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

OpenSmile介紹

openSMILE（open-source Speech and Music Interpretation by Large-space Extraction）是一個開源工具包，用于語音和音樂信號的音頻特征提取和分類。openSMILE廣泛應用于情感計算的自動情感識別。openSMILE完全免費用于研究目的。

下載和安裝

在下述網(wǎng)頁下載opensmile的安裝包，鏈接
然后進入“/home/public/gl/MultiDetection/alzheimers-dementia-master/opensmile-master/”
輸入如下指令

bash build.sh

運行結果如下
將這個二進制執(zhí)行文件在環(huán)境路徑中添加。

export PATH="/home/public/gl/MultiDetection/alzheimers-dementia-master/opensmile-master/build/progsrc/smilextract:$PATH"

工具學習——使用OpenSmile提取音頻特征,AD檢測分類,學習,音視頻

使用如下指令進行設置測試，輸出如下

SMILExtract -h

工具學習——使用OpenSmile提取音頻特征,AD檢測分類,學習,音視頻

提取特征

格式轉換

我需要處理的是mp3文件，而opensmile僅僅支持處理wav文件，所以這里需要將wav文件轉為mp3文件
這里需要調用ffmpeg進行格式轉換，對應的腳本如下

#!/bin/bash

# 定義搜索和轉換的根目錄
SEARCH_DIR="/home/public/gl/Dataset/ADDReSS-M/"

# 使用 find 命令查找所有的 .mp3 文件
# 然后使用 while 循環(huán)和 read 命令逐一處理它們
find "$SEARCH_DIR" -type f -name "*.mp3" | while IFS= read -r mp3file; do
    # 使用參數(shù)替換來生成新的 .wav 文件名
    wavfile="${mp3file%.mp3}.wav"

    # 檢查MP3文件是否存在
    if [ ! -f "$mp3file" ]; then
        echo "The file $mp3file does not exist, skipping."
        continue
    fi

    # 調用 ffmpeg 進行轉換
    ffmpeg -i "$mp3file" "$wavfile" < /dev/null && echo "Converted $mp3file to $wavfile"

    # 如果不需要保留原MP3文件，取消下面一行的注釋
    # rm "$mp3file"
done

echo "All MP3 files have been converted to WAV format."

輸出效果如下

工具學習——使用OpenSmile提取音頻特征,AD檢測分類,學習,音視頻

特征提取

嘗試一

這里直接運行了下述腳本，遍歷所有的wav文件，并將特征進行保存，腳本代碼如下

#!/bin/bash

# openSMILE的配置文件路徑
SMILE_CONFIG="/home/public/gl/MultiDetection/alzheimers-dementia-master/opensmile-master/config/is09-13/IS13_ComParE.conf"
# 原始數(shù)據(jù)集的根目錄
SOURCE_DIR="/home/public/gl/Dataset/ADDReSS-M/"
# 特征文件保存的根目錄
FEATURE_DIR="./ADDReSS-M_features"

# 創(chuàng)建特征文件的保存目錄
mkdir -p "$FEATURE_DIR"

# 遞歸地查找所有的WAV文件
find "$SOURCE_DIR" -type f -name "*.wav" | while read -r wavfile; do
  # 計算相對路徑
  relative_path="${wavfile#$SOURCE_DIR}"
  # 獲取不帶擴展名的文件名
  base_name="$(basename "$relative_path" .wav)"
  # 獲取不帶文件名的目錄路徑
  dir_path="$(dirname "$relative_path")"

  # 在特征文件目錄中創(chuàng)建相同的目錄結構
  mkdir -p "$FEATURE_DIR/$dir_path"

  # 設置輸出文件的完整路徑
  output_file="$FEATURE_DIR/${dir_path}/${base_name}.csv"

  # 使用openSMILE處理WAV文件
  SMILExtract -C "$SMILE_CONFIG" -I "$wavfile" -O "$output_file"
  echo "Features extracted for $wavfile and saved to $output_file"
done

echo "Feature extraction complete for all WAV files."

輸出結果如下
比較害怕及格diable對結果有什么影響，這里仔細地搜索相關資料進行學習
- 這個東西是用來設置輸出文件樣式的，如果我只需要csv的數(shù)據(jù)并不需要使用

正常使用手段

需要指定提取音頻特征的配置文件、輸入文件和輸出文件，具體使用樣例如下

SMILExtract -C config/demo/demo1_energy.conf（配置文件） -I example-audio/opensmile.wav（輸入文件） -O opensmile.energy.csv（輸出文件）

運行結果如下
- 僅僅收到了MSG，運行成功
- 收到ERROR表示提取失敗

工具學習——使用OpenSmile提取音頻特征,AD檢測分類,學習,音視頻

創(chuàng)建自己的配置文件

我們將使用此函數(shù)生成我們的第一個配置文件，該文件將能夠讀取波形文件、計算幀能量并將輸出保存到 CSV 文件。
具體指令如下

SMILExtract -cfgFileTemplate -cfgFileDescriptions -configDflt cWaveSource,cFramer,cEnergy,cCsvSink -l 1 2> myconfig/demo1_descriptions.conf

工具學習——使用OpenSmile提取音頻特征,AD檢測分類,學習,音視頻

配置文件分析

第一部分是基本的配置
第二部分是當前配置文件所對應的不同的組件信息
- 可以在這里修改不同組件的參數(shù)，比如說每一幀的長度等

常見的特征

Chroma features for key and chord recognition
用于鍵和和弦識別的色度功能
MFCC for speech recognition
用于語音識別的 MFCC
PLP for speech recognition
用于語音識別的 PLP
Prosody (Pitch and loudness)
韻律（音高和響度）
The INTERSPEECH 2009 Emotion Challenge feature set
INTERSPEECH 2009 情感挑戰(zhàn)賽功能集
The INTERSPEECH 2010 Paralinguistic Challenge feature set
INTERSPEECH 2010 副語言挑戰(zhàn)賽功能集
The INTERSPEECH 2011 Speaker State Challenge feature set
INTERSPEECH 2011 Speaker State Challenge 功能集
The INTERSPEECH 2012 Speaker Trait Challenge feature set
INTERSPEECH 2012 Speaker Trait Challenge 功能集
The INTERSPEECH 2013 ComParE feature set
INTERSPEECH 2013 ComParE 功能集
The MediaEval 2012 TUM feature set for violent scenes detection.
用于暴力場景檢測的 MediaEval 2012 TUM 功能集。
Three reference sets of features for emotion recognition (older sets, obsoleted by the new INTERSPEECH challenge sets)
用于情感識別的三個參考功能集（較舊的功能集，已被新的 INTERSPEECH 挑戰(zhàn)集淘汰）
Audio-visual features based on INTERSPEECH 2010 Paralinguistic Challenge audio features.
基于INTERSPEECH 2010副語言挑戰(zhàn)賽音頻特征的視聽特征。
這里不同特征需要自己去了解，相關說明文檔鏈接\文章來源地址http://www.zghlxwxcb.cn/news/detail-828888.html

使用Gnuplot可視化特征

安裝

為了使用 gnuplot 可視化特征輪廓，您必須安裝 gnuplot 4.6 或更高版本。在 Linux 上，gnuplot 既可以通過發(fā)行版的包管理器安裝（在 Ubuntu 上：）， sudo apt-get install gnuplot-nox 也可以從源代碼編譯（http://www.gnuplot.info）。對于 Windows，gnuplot 二進制文件可從項目網(wǎng)頁獲得。

使用

這里需要寫對應的plt腳本，然后調用gnuplot進行執(zhí)行。具體就給了三個樣例，分別是色度、頻譜圖還有響度曲線等，具體看官網(wǎng)就行。如果要自己畫圖，還是需要自己寫的。

總結

關于音頻特征，使用opensmile進行提取，還是挺快的，而且使用cpu就行，不需要使用gpu，下面就是嘗試不同的音頻特征就行。

到了這里，關于工具學習——使用OpenSmile提取音頻特征的文章就介紹完了。如果您還想了解更多內容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。如若轉載，請注明出處：如若內容造成侵權/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領支付寶紅包贊助服務器費用

【python】基于librosa庫提取音頻特征
librosa.amplitude_to_db 是一個音頻處理庫librosa中的一個函數(shù)，用于將音頻信號的幅度轉換為分貝（dB）單位的值。在音頻處理中，分貝是一種常用的單位，用于表示信號的相對強度。該函數(shù)的輸入?yún)?shù)是音頻信號的幅度值，可以是單個值或者一個數(shù)組。它會將輸入的幅度值轉換為
2024年04月17日
瀏覽(23)
python之pyAudioAnalysis:音頻特征提取分析文檔示例詳解
PyAudioAnalysis是一個開源的Python庫，用于從音頻文件中提取特征并進行分析。它提供了一系列音頻處理函數(shù)，可以幫助開發(fā)者實現(xiàn)音頻分類、情感識別、語音分析等多種任務。在本文中，我們將詳細介紹如何使用PyAudioAnalysis進行音頻特征提取和分析。音頻特征提取 PyAudioAnalys
2024年02月16日
瀏覽(21)
使用python中的pymrmr模塊來進行特征提取，深入學習mRMR（最大相關最小冗余準則）
文章目錄系列文章目錄前言一、最大相關最小冗余準則（mRMR）在python對應的庫？二、如何安裝和使用prmrmr？ 1. 新建一個環(huán)境 2. 安裝pymrmr庫 3.如何使用pymrmr？ pymrmr實驗結果總結最大相關最小冗余準則(maximal relevance andminimal redundancy，mRMR)，其核心思想是從給定的特征集
2024年02月06日
瀏覽(72)
計算機視覺：通過邊緣檢測探究卷積的特征提取功能
在前面的課程中，我們學習了卷積核的運算，同時我們也學習了卷積核的含義，我們可以將卷積核理解為特征提取器，也就是說一個卷積核就是一個特征提取器，很多人對這種說法不了解，下面我們就通過一個邊緣檢測的例子來看一下卷積核是如何進行邊緣特征的提取的。
2024年02月13日
瀏覽(33)
OpenCV中的人臉關鍵點檢測和人臉特征提取如何實現(xiàn)？
在OpenCV中，人臉關鍵點檢測和人臉特征提取是常見的計算機視覺任務。OpenCV提供了一些用于實現(xiàn)這些任務的函數(shù)和算法。下面將介紹如何在OpenCV中實現(xiàn)人臉關鍵點檢測和人臉特征提取。 1. 人臉關鍵點檢測人臉關鍵點檢測是指識別和定位人臉上的關鍵點，如眼睛、鼻子、嘴巴
2024年02月03日
瀏覽(27)
【目標檢測】(8) ASPP改進加強特征提取模塊，附Tensorflow完整代碼
各位同學好，最近想改進一下YOLOV4的SPP加強特征提取模塊，看到很多論文中都使用語義分割中的ASPP模塊來改進，今天用Tensorflow復現(xiàn)一下代碼。 YOLOV4的主干網(wǎng)絡代碼可見我上一篇文章：https://blog.csdn.net/dgvv4/article/details/123818580 將本節(jié)的ASPP代碼替換原來的SPP模塊代碼即可 YO
2024年02月06日
瀏覽(27)
【計算機視覺】圖像分割與特征提取——基于Log、Canny的邊緣檢測
個人簡介：? ??個人主頁：趙四司機 ??學習方向：JAVA后端開發(fā)? ?往期文章：SpringBoot項目整合微信支付 ??博主推薦網(wǎng)站：?？途W(wǎng) 刷題|面試|找工作神器 ??種一棵樹最好的時間是十年前，其次是現(xiàn)在！ ??喜歡的話麻煩點點關注喔，你們的支持是我的最大動力。前言：
2024年02月03日
瀏覽(91)
機器學習圖像特征提取—SIFT特征提取原理及代碼實現(xiàn)
目錄 1 SIFT簡介 2 SIFT原理及特點 2.1 SIFT算法特點 2.2 SIFT特征檢測 3 SIFT代碼實現(xiàn) ? ? ? ?SIFT，即尺度不變特征變換（Scale-invariant feature transform，SIFT），是用于圖像處理領域的一種描述。這種描述具有尺度不變性，可在圖像中檢測出關鍵點，是一種局部特征描述子。 ? ? ? SIF
2024年02月06日
瀏覽(50)
【機器學習】特征工程 - 字典特征提取
「作者主頁」：士別三日wyx 「作者簡介」： CSDN top100、阿里云博客專家、華為云享專家、網(wǎng)絡安全領域優(yōu)質創(chuàng)作者「推薦專欄」：對網(wǎng)絡安全感興趣的小伙伴可以關注專欄《網(wǎng)絡安全入門到精通》特征工程就是從「原始數(shù)據(jù)」中提取「特征」，以供「算法」和「模型
2024年02月11日
瀏覽(29)
opencv基礎57-模板匹配cv2.matchTemplate()-＞(目標檢測、圖像識別、特征提取)
OpenCV 提供了模板匹配（Template Matching）的功能，它允許你在圖像中尋找特定模板（小圖像）在目標圖像中的匹配位置。模板匹配在計算機視覺中用于目標檢測、圖像識別、特征提取等領域。以下是 OpenCV 中使用模板匹配的基本步驟：加載圖像：首先，加載目標圖像和要匹配
2024年02月13日
瀏覽(17)

<ul id="emy4s"><dl id="emy4s"></dl></ul>