国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

音視頻學(xué)習(xí)—音視頻理論基礎(chǔ)(2)

這篇具有很好參考價(jià)值的文章主要介紹了音視頻學(xué)習(xí)—音視頻理論基礎(chǔ)(2)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。


1、音頻的基本概念

??音頻是一種模擬信號(hào),它是由聲波轉(zhuǎn)化而來的電信號(hào)。聲波是通過氣體、液體或固體傳播的機(jī)械波,代表了聲音的震動(dòng)。在錄制過程中,聲音被轉(zhuǎn)換成電信號(hào),然后被儲(chǔ)存在數(shù)字格式中。

2、聲音的三要素

??聲音的三要素是頻率、振幅和波形

??頻率是指聲波的振動(dòng)次數(shù),通常使用赫茲(Hz)來表示。人類能夠聽到的聲音的頻率范圍是20Hz20kHz。頻率越高,聲音越尖銳;頻率越低,聲音越低沉。

??振幅是指聲波的振動(dòng)幅度,也就是聲音的響度或音量。振幅越大,聲音越響亮;振幅越小,聲音越微弱。

??波形是指聲波的形狀。不同的聲波形狀會(huì)對(duì)聲音的音色產(chǎn)生影響。例如,正弦波是一種最簡單的波形,它產(chǎn)生的聲音音色清晰、純正;而復(fù)雜波形則產(chǎn)生的聲音音色更具有豐富性和復(fù)雜性。

??在數(shù)字音頻領(lǐng)域,頻率、振幅和波形被轉(zhuǎn)化為數(shù)字信號(hào),然后存儲(chǔ)和傳輸。對(duì)于數(shù)字音頻,頻率通常表示采樣率,振幅表示采樣精度,波形則是由采樣數(shù)據(jù)重建出來的。

3、聲音的本質(zhì)

??聲音的本質(zhì)包括音調(diào)、音量和音色。

??音調(diào)是指聲音的高低、頻率。較高的頻率產(chǎn)生的聲音音調(diào)更高,較低的頻率產(chǎn)生的聲音音調(diào)更低。例如,鋼琴和小提琴演奏同樣的音符,由于它們頻率不同,所以發(fā)出的聲音音調(diào)也不同。

??音量是指聲音的響度、強(qiáng)弱。通常使用分貝(dB)衡量聲音的音量大小。人類能夠聽到的聲音范圍是0dB140dB,其中0dB表示最小聽力閾值,而140dB表示極度嘈雜的聲音。音量的大小與振幅相關(guān),振幅越大,聲音就越響亮。

??音色是指聲音的特征,它決定了聲音的品質(zhì)和風(fēng)格。每個(gè)樂器的音色都是獨(dú)特的,這也是為何我們可以輕松地區(qū)分小提琴和鋼琴的聲音。音色的不同源于聲波的波形特征,這種特征被稱為諧波。不同的諧波組合形成了不同的音色。

4、奈奎斯特采樣定律

??奈奎斯特采樣定律,也稱為奈氏定理,指在進(jìn)行模擬/數(shù)字信號(hào)的轉(zhuǎn)換過程中,當(dāng)采樣頻率fs.max大于信號(hào)中最高頻率fmax的2倍時(shí)(fs.max>2fmax),采樣之后的數(shù)字信號(hào)完整地保留了原始信號(hào)中的信息,一般實(shí)際應(yīng)用中保證采樣頻率為信號(hào)最高頻率的2.56~4倍;采樣定理又稱奈奎斯特定理。

??奈奎斯特采樣定律的表達(dá)式為:Fs > 2 × Fm

??其中,Fs為采樣頻率,Fm為信號(hào)中最高能達(dá)到的頻率。比如,一個(gè)信號(hào)最高頻率為10kHz,那么采樣頻率需要大于20kHz,才能保證信號(hào)能夠被準(zhǔn)確地重建。如果采樣率低于奈奎斯特采樣定律所要求的最小值,信號(hào)就會(huì)發(fā)生混疊失真現(xiàn)象,即信號(hào)的高頻部分被混淆到了低頻部分,導(dǎo)致信號(hào)質(zhì)量下降。

5、采樣和采樣率

??在數(shù)字音頻中,采樣是將模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的過程。模擬音頻信號(hào)是連續(xù)時(shí)間變化的信號(hào),而數(shù)字信號(hào)則是離散時(shí)間的抽樣信號(hào)。具體來說,采樣將連續(xù)的音頻波形在一定時(shí)間間隔內(nèi)進(jìn)行離散化,將其轉(zhuǎn)化為一系列數(shù)字值。

??采樣率是指數(shù)字音頻信號(hào)中的采樣數(shù)量,通常以每秒采樣次數(shù)(Hz或kHz)來表示。它表示將連續(xù)時(shí)間的音頻信號(hào)離散化成數(shù)字信號(hào)的速率。采樣率越高,數(shù)字音頻數(shù)據(jù)就越精確,音質(zhì)也越好,但同時(shí)文件也越大。常見的采樣率包括44.1kHz48kHz、96kHz等。

??例如,CD音質(zhì)的采樣率為44.1kHz,表示每秒鐘錄制了44100個(gè)采樣點(diǎn)來描述聲波。在數(shù)字音頻中,采樣的精度也會(huì)影響到音頻的質(zhì)量,通常使用位深度(比特?cái)?shù))來描述。CD音質(zhì)的采樣精度為16 bits,表示每個(gè)采樣點(diǎn)使用16比特來表示。

6、采樣數(shù)和采樣位數(shù)

??采樣數(shù)指的是每秒鐘對(duì)模擬信號(hào)進(jìn)行采樣的次數(shù),它決定了數(shù)字音頻信號(hào)的頻率范圍,常見的采樣數(shù)有44.1kHz、48kHz、96kHz等。
采樣位數(shù)指的是每個(gè)采樣點(diǎn)對(duì)應(yīng)的二進(jìn)制數(shù)的位數(shù),它決定了數(shù)字音頻信號(hào)的動(dòng)態(tài)范圍和信噪比。通常,采樣位數(shù)越高,數(shù)字音頻信號(hào)的信噪比就會(huì)越高,可以表達(dá)更廣泛的音頻強(qiáng)度范圍。常見的采樣位數(shù)有8位、16位、24位、32位等。

??通道數(shù)指的是數(shù)字音頻信號(hào)中的聲道數(shù)。常見的通道數(shù)有單聲道(mono)和雙聲道(stereo),還有多聲道,如5.1聲道、7.1聲道等。多聲道可以通過在不同的聲道中播放不同的音頻信號(hào)來實(shí)現(xiàn)更加立體的音效。

??需要注意的是,采樣數(shù)、采樣位數(shù)和通道數(shù)三者共同決定了數(shù)字音頻信號(hào)的質(zhì)量和大小。采樣率和采樣位數(shù)越高、通道數(shù)越多,音頻文件的體積就越大,音質(zhì)也會(huì)越好。因此,在實(shí)際應(yīng)用中需要根據(jù)需求來選擇采樣率、采樣位數(shù)和通道數(shù)。

7、量化

??量化是指將連續(xù)的模擬信號(hào)轉(zhuǎn)換成離散的數(shù)字信號(hào)的過程。在數(shù)字信號(hào)處理中,量化是將采樣后的連續(xù)信號(hào)按照一定的準(zhǔn)則映射到離散標(biāo)準(zhǔn)值集合中的過程,其中,這些標(biāo)準(zhǔn)值形成一個(gè)有限制的數(shù)字集合。這些數(shù)字集合就是存儲(chǔ)數(shù)字信號(hào)所用的碼字,它們代表了信號(hào)的離散取值。

??量化的過程是通過量化器來實(shí)現(xiàn)的,量化器將采樣信號(hào)中的每個(gè)樣本映射為最接近的數(shù)字信號(hào)的取值。數(shù)字信號(hào)的每個(gè)碼字都是用二進(jìn)制編碼表示的。一般來說,采樣精度越高,量化器刻度越小,數(shù)字信號(hào)的準(zhǔn)確度就越高,質(zhì)量也越好。

??量化過程中,由于原始的模擬信號(hào)的取值范圍很大,而二進(jìn)制編碼能表示的數(shù)字范圍相對(duì)較小,因此,在量化過程中難免會(huì)出現(xiàn)誤差。這種誤差叫做量化誤差,它是原始模擬信號(hào)與離散化數(shù)字信號(hào)之間的差值。在數(shù)字音頻中,這種誤差會(huì)對(duì)音質(zhì)造成一定的影響。

8、比特率(碼率)

??比特率是指數(shù)字音頻數(shù)據(jù)的傳輸速率,通常使用比特每秒(bps)來衡量。它表示單位時(shí)間內(nèi)傳輸?shù)臄?shù)據(jù)量,也叫作數(shù)據(jù)傳輸速率。比特率越高,音頻質(zhì)量越好,但文件大小也越大。

??在數(shù)字音頻領(lǐng)域中,比特率通常表示為kbps(千比特每秒)或者Mbps(兆比特每秒)。例如,128kbpsMP3音頻表示每秒傳輸128千比特的音頻數(shù)據(jù)。高清音頻通常需要更高的比特率,否則會(huì)因壓縮損失而影響音質(zhì)。

??不同的數(shù)字音頻格式使用不同的比特率。例如,MP3音頻的標(biāo)準(zhǔn)比特率通常為128kbps或者192kbps,而Apple LosslessFLAC等無損音頻格式則需要更高的比特率以保證音頻質(zhì)量??傊忍芈适菙?shù)字音頻的一個(gè)重要指標(biāo),它直接影響到音頻的質(zhì)量和存儲(chǔ)空間。

9、響度和強(qiáng)度

??響度和強(qiáng)度都是聲音的感知特性,但它們描述的是不同的方面:

??響度是人類主觀感受到的聲音強(qiáng)度,用分貝(dB)表示。通常,人們對(duì)于聽覺上的相同強(qiáng)度,低頻和高頻聲音的響度是不同的。響度與聲音的物理特性、頻率、振幅等都有關(guān)系。相同的振幅,低頻聲音的響度要高于高頻聲音的響度。相同的頻率,振幅更大的聲音響度更高,但人類對(duì)于高強(qiáng)度聲音的響度感受不如低強(qiáng)度聲音強(qiáng)烈。

??強(qiáng)度是聲波能量傳遞的測量值,表示單位時(shí)間內(nèi)通過單位面積的能量。強(qiáng)度與聲音源的振幅成正比,與聲音的傳播距離的平方成反比。強(qiáng)度同樣也可用分貝表示。它是聲波在空氣中傳播帶來的物理現(xiàn)象,與人類聽覺感知不同。

10、編碼

??每個(gè)量化值都是一個(gè)樣本,將所有這些樣本進(jìn)行存儲(chǔ)的過程稱為編碼。

??在音視頻領(lǐng)域中,編碼是指將音頻信號(hào)或視頻信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),以便于在數(shù)字系統(tǒng)中儲(chǔ)存、傳輸、處理和回放。音頻編碼主要包括有損編碼和無損編碼兩種方式。有損音頻編碼可以壓縮數(shù)據(jù)的大小,但會(huì)丟失一些信息,比如MP3、AAC、WMA等。無損音頻編碼則可以達(dá)到無失真的壓縮,數(shù)據(jù)大小相對(duì)較大,比如FLAC、ALAC等。視頻編碼也存在有損和無損兩種編碼方式,但更多是有損編碼。常用的有損視頻編碼標(biāo)準(zhǔn)有MPEG-1、MPEG-2、MPEG-4、H.264/AVC、H.265/HEVC等,其中H.264/AVCH.265/HEVC是目前應(yīng)用最廣泛的兩種視頻編碼標(biāo)準(zhǔn)。視頻編碼主要使用了運(yùn)動(dòng)估計(jì)、變換編碼、量化和熵編碼等技術(shù)來對(duì)視頻進(jìn)行壓縮編碼。

通常所說的音頻裸數(shù)據(jù)格式就是脈沖編碼調(diào)制(PCM)數(shù)據(jù)。PCM是一種用于數(shù)字音頻編碼的標(biāo)準(zhǔn)方法,它將模擬音頻信號(hào)進(jìn)行采樣,并將每個(gè)采樣值量化為離散的數(shù)字值。這些數(shù)字值表示音頻信號(hào)在每個(gè)采樣點(diǎn)上的振幅,然后以二進(jìn)制形式存儲(chǔ)。PCM數(shù)據(jù)是一種常見的音頻數(shù)據(jù)格式,它可以通過將數(shù)字值轉(zhuǎn)換為模擬信號(hào)來恢復(fù)原始的音頻信號(hào)。

11、音頻幀

??音頻幀是指一段連續(xù)的音頻數(shù)據(jù),包含多個(gè)采樣點(diǎn)。通常音頻幀的長度與采樣率和采樣位數(shù)有關(guān)。

12、音頻文件大小的計(jì)算

??文件大小 = 采樣率 * 錄音時(shí)間 * 采樣位數(shù) / 8 * 通道數(shù)


總結(jié)

??本文概述了音頻的基本概念,如頻率、振幅、采樣等。并詳細(xì)介紹了數(shù)字音頻處理中的一些重要概念,如采樣率、采樣位數(shù)、量化、編碼等。后續(xù)我會(huì)繼續(xù)跟進(jìn)的。

??為了方便交流,我創(chuàng)建了一個(gè)后端和音視頻技術(shù)的qq群,群號(hào):333138957(可以掃下面的碼加群)。

??如果你對(duì)音視頻和后端開發(fā)感興趣,歡迎加入我們進(jìn)行深入交流。共同學(xué)習(xí),攜手推進(jìn)行業(yè)發(fā)展!

qq群:
音視頻學(xué)習(xí)—音視頻理論基礎(chǔ)(2),音視頻,音視頻,學(xué)習(xí)

微信群:文章來源地址http://www.zghlxwxcb.cn/news/detail-861442.html

到了這里,關(guān)于音視頻學(xué)習(xí)—音視頻理論基礎(chǔ)(2)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 音視頻基礎(chǔ)概念(5)——音頻基礎(chǔ)說明

    現(xiàn)實(shí)生活中,音頻(Audio)主要用在兩大場景中,包括語音(Voice)和音樂(Music)。語音主要用于溝通,如打電話等。目前由于語音識(shí)別技術(shù)的發(fā)展,人機(jī)語音交互也是語音的一個(gè)應(yīng)用方向,很多大廠推出智能音箱、語音助手等。音樂主要用于欣賞和陶冶情操,如播放音樂。

    2023年04月08日
    瀏覽(22)
  • 音視頻之旅 - 基礎(chǔ)知識(shí)

    音視頻之旅 - 基礎(chǔ)知識(shí)

    像素 像素是圖像的基本單元,一個(gè)個(gè)像素就組成了圖像。你可以認(rèn)為像素就是圖像中的一個(gè)點(diǎn)。在下面這張圖中,你可以看到一個(gè)個(gè)方塊,這些方塊就是像素 分辨率 圖像(或視頻)的分辨率是指圖像的大小或尺寸。我們一般用像素個(gè)數(shù)來表示圖像的尺寸。比如說一張1920x1

    2024年02月04日
    瀏覽(21)
  • 音視頻基礎(chǔ)知識(shí)——素材理解

    音視頻基礎(chǔ)知識(shí)——素材理解

    素材是媒體內(nèi)容生產(chǎn)中一切生產(chǎn)資料的集合,包括不限于視頻、音頻、圖片、字幕等形式。 素材通過統(tǒng)一的協(xié)議把原始的數(shù)據(jù)有序組織起來,便于編輯與管理。比如一般的素材是由一個(gè)物理文件及其各類屬性構(gòu)成,在對(duì)素材進(jìn)行剪輯處理時(shí),不用改變源文件中的任何內(nèi)容,通

    2024年02月01日
    瀏覽(29)
  • 音視頻BUG學(xué)習(xí)

    音視頻BUG學(xué)習(xí)

    1、首先看出現(xiàn)概率是偶現(xiàn)還是必現(xiàn) 2、如果是必現(xiàn),則復(fù)現(xiàn)整個(gè)bug過程,看Bug是否出現(xiàn) 如果是偶現(xiàn),則分析問題視頻 在復(fù)現(xiàn)問題過程中,剛開始沒下載到本地,直接點(diǎn)擊播放發(fā)生慢放,因?yàn)榱髁烤W(wǎng)速較低,15s,40Mb 平均網(wǎng)速要超過2.7Mb/s,因此誤以為復(fù)現(xiàn)了bug 0 問題復(fù)現(xiàn) 找設(shè)

    2024年02月11日
    瀏覽(17)
  • 學(xué)習(xí)筆記/音視頻面試

    學(xué)習(xí)筆記/音視頻面試

    1.DTS/PTS 如果沒有B幀,那么DTS一般與PTS相同 DTS(Decoding Time Stamp):即解碼時(shí)間戳,這個(gè)時(shí)間戳的意義在于告訴播放器該在什么時(shí)候解碼這一幀的數(shù)據(jù)。(解碼I-P-B) PTS(Presentation Time Stamp):即顯示時(shí)間戳,這個(gè)時(shí)間戳用來告訴播放器該在什么時(shí)候顯示這一幀的數(shù)據(jù)。 2.GOP 就是將

    2023年04月12日
    瀏覽(28)
  • 音視頻基礎(chǔ)知識(shí)-時(shí)間戳的理解

    問題背景: 凡是和流媒體和音視頻打交道,時(shí)間戳基本是一個(gè)必須深刻理解的概念。你會(huì)在各種各樣的傳輸協(xié)議和封裝格式中看到這個(gè)東西,而且表現(xiàn)形式還不一樣。其次這個(gè)概念會(huì)涉及到音視頻播放的同步問題,也會(huì)影響音視頻播放的控制問題。前者說的是音畫同步,后者

    2023年04月08日
    瀏覽(32)
  • FFmpeg基礎(chǔ):獲取音視頻的各種編碼參數(shù)

    FFmpeg基礎(chǔ):獲取音視頻的各種編碼參數(shù)

    獲取視頻編碼參數(shù) 視頻編碼參數(shù)主要包括:幀率、分辨率、編碼格式、碼率等,對(duì)應(yīng)的概念如下。 幀率(Frame Rate) 每秒顯示幀數(shù)(Frames Per Second)。電影的幀率一般是25fps和29.97fps,3D游戲要保持流暢則需要30fps以上的效果。 分辨率 指視頻寬高的像素?cái)?shù)值。標(biāo)準(zhǔn)1080P的分辨率為1920×

    2024年02月03日
    瀏覽(18)
  • 音視頻學(xué)習(xí)之ffmpeg常用基礎(chǔ)命令整理

    音視頻學(xué)習(xí)之ffmpeg常用基礎(chǔ)命令整理

    基于windows環(huán)境安裝好必要的ffmpeg后,對(duì)ffmpeg基礎(chǔ)命令進(jìn)行一些了解: ? 有時(shí)候?qū)懭隡P4文件會(huì)不成功,改成flv就好 1:視頻裁剪: ? 2:文字水印: 編譯的時(shí)候需要支持 FreeType、FontConfig、iconv,系統(tǒng)中需要有相關(guān)的子庫, 在 FFmpeg 中增加純字母水印可以使用 drawtext 濾鏡進(jìn)行支持

    2024年02月12日
    瀏覽(25)
  • 音視頻入門知識(shí)學(xué)習(xí)

    音視頻入門知識(shí)學(xué)習(xí)

    1920x1080的屏幕,32位,30幀的fps。一秒鐘需要1920x1080x32x30字節(jié),所以需要壓縮 壓縮的核心思想就是去除冗余信息 空間冗余 空間冗余 == 相鄰像素重復(fù):圖像內(nèi)部相鄰像素之間存在較強(qiáng)的相關(guān)性多造成的冗余 比如一張圖片中間的一個(gè)位置大小20x20,它的表現(xiàn)肉眼看起來其實(shí)是一

    2024年02月12日
    瀏覽(17)
  • 前端基礎(chǔ)(三十六):讀取本地音視頻設(shè)備并進(jìn)行播放

    前端基礎(chǔ)(三十六):讀取本地音視頻設(shè)備并進(jìn)行播放

    請(qǐng)求媒體輸入和輸出設(shè)備的列表,例如麥克風(fēng),攝像機(jī),耳機(jī)設(shè)備等 會(huì)提示用戶給予使用媒體輸入的許可,媒體輸入會(huì)產(chǎn)生一個(gè)MediaStream,里面包含了請(qǐng)求的媒體類型的軌道。此流可以包含一個(gè)視頻軌道(來自硬件或者虛擬視頻源,比如相機(jī)、視頻采集設(shè)備和屏幕共享服務(wù)等

    2024年02月15日
    瀏覽(32)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包