国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

音視頻學(xué)習(xí)—音視頻理論基礎(chǔ)（2）

1年前作者：寫B(tài)ug那些事分類：Toy博客閱讀(32)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了音視頻學(xué)習(xí)—音視頻理論基礎(chǔ)（2）。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1、音頻的基本概念

??音頻是一種模擬信號(hào)，它是由聲波轉(zhuǎn)化而來的電信號(hào)。聲波是通過氣體、液體或固體傳播的機(jī)械波，代表了聲音的震動(dòng)。在錄制過程中，聲音被轉(zhuǎn)換成電信號(hào)，然后被儲(chǔ)存在數(shù)字格式中。

2、聲音的三要素

??聲音的三要素是頻率、振幅和波形

??頻率是指聲波的振動(dòng)次數(shù)，通常使用赫茲（Hz）來表示。人類能夠聽到的聲音的頻率范圍是20Hz到20kHz。頻率越高，聲音越尖銳；頻率越低，聲音越低沉。

??振幅是指聲波的振動(dòng)幅度，也就是聲音的響度或音量。振幅越大，聲音越響亮；振幅越小，聲音越微弱。

??波形是指聲波的形狀。不同的聲波形狀會(huì)對(duì)聲音的音色產(chǎn)生影響。例如，正弦波是一種最簡單的波形，它產(chǎn)生的聲音音色清晰、純正；而復(fù)雜波形則產(chǎn)生的聲音音色更具有豐富性和復(fù)雜性。

??在數(shù)字音頻領(lǐng)域，頻率、振幅和波形被轉(zhuǎn)化為數(shù)字信號(hào)，然后存儲(chǔ)和傳輸。對(duì)于數(shù)字音頻，頻率通常表示采樣率，振幅表示采樣精度，波形則是由采樣數(shù)據(jù)重建出來的。

3、聲音的本質(zhì)

??聲音的本質(zhì)包括音調(diào)、音量和音色。

??音調(diào)是指聲音的高低、頻率。較高的頻率產(chǎn)生的聲音音調(diào)更高，較低的頻率產(chǎn)生的聲音音調(diào)更低。例如，鋼琴和小提琴演奏同樣的音符，由于它們頻率不同，所以發(fā)出的聲音音調(diào)也不同。

??音量是指聲音的響度、強(qiáng)弱。通常使用分貝（dB）衡量聲音的音量大小。人類能夠聽到的聲音范圍是0dB到140dB，其中0dB表示最小聽力閾值，而140dB表示極度嘈雜的聲音。音量的大小與振幅相關(guān)，振幅越大，聲音就越響亮。

??音色是指聲音的特征，它決定了聲音的品質(zhì)和風(fēng)格。每個(gè)樂器的音色都是獨(dú)特的，這也是為何我們可以輕松地區(qū)分小提琴和鋼琴的聲音。音色的不同源于聲波的波形特征，這種特征被稱為諧波。不同的諧波組合形成了不同的音色。

4、奈奎斯特采樣定律

??奈奎斯特采樣定律，也稱為奈氏定理，指在進(jìn)行模擬/數(shù)字信號(hào)的轉(zhuǎn)換過程中，當(dāng)采樣頻率fs.max大于信號(hào)中最高頻率fmax的2倍時(shí)(fs.max>2fmax)，采樣之后的數(shù)字信號(hào)完整地保留了原始信號(hào)中的信息，一般實(shí)際應(yīng)用中保證采樣頻率為信號(hào)最高頻率的2.56～4倍；采樣定理又稱奈奎斯特定理。

??奈奎斯特采樣定律的表達(dá)式為：Fs > 2 × Fm

??其中，Fs為采樣頻率，Fm為信號(hào)中最高能達(dá)到的頻率。比如，一個(gè)信號(hào)最高頻率為10kHz，那么采樣頻率需要大于20kHz，才能保證信號(hào)能夠被準(zhǔn)確地重建。如果采樣率低于奈奎斯特采樣定律所要求的最小值，信號(hào)就會(huì)發(fā)生混疊失真現(xiàn)象，即信號(hào)的高頻部分被混淆到了低頻部分，導(dǎo)致信號(hào)質(zhì)量下降。

5、采樣和采樣率

??在數(shù)字音頻中，采樣是將模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的過程。模擬音頻信號(hào)是連續(xù)時(shí)間變化的信號(hào)，而數(shù)字信號(hào)則是離散時(shí)間的抽樣信號(hào)。具體來說，采樣將連續(xù)的音頻波形在一定時(shí)間間隔內(nèi)進(jìn)行離散化，將其轉(zhuǎn)化為一系列數(shù)字值。

??采樣率是指數(shù)字音頻信號(hào)中的采樣數(shù)量，通常以每秒采樣次數(shù)（Hz或kHz）來表示。它表示將連續(xù)時(shí)間的音頻信號(hào)離散化成數(shù)字信號(hào)的速率。采樣率越高，數(shù)字音頻數(shù)據(jù)就越精確，音質(zhì)也越好，但同時(shí)文件也越大。常見的采樣率包括44.1kHz、48kHz、96kHz等。

??例如，CD音質(zhì)的采樣率為44.1kHz，表示每秒鐘錄制了44100個(gè)采樣點(diǎn)來描述聲波。在數(shù)字音頻中，采樣的精度也會(huì)影響到音頻的質(zhì)量，通常使用位深度（比特?cái)?shù)）來描述。CD音質(zhì)的采樣精度為16 bits，表示每個(gè)采樣點(diǎn)使用16比特來表示。

6、采樣數(shù)和采樣位數(shù)

??采樣數(shù)指的是每秒鐘對(duì)模擬信號(hào)進(jìn)行采樣的次數(shù)，它決定了數(shù)字音頻信號(hào)的頻率范圍，常見的采樣數(shù)有44.1kHz、48kHz、96kHz等。
采樣位數(shù)指的是每個(gè)采樣點(diǎn)對(duì)應(yīng)的二進(jìn)制數(shù)的位數(shù)，它決定了數(shù)字音頻信號(hào)的動(dòng)態(tài)范圍和信噪比。通常，采樣位數(shù)越高，數(shù)字音頻信號(hào)的信噪比就會(huì)越高，可以表達(dá)更廣泛的音頻強(qiáng)度范圍。常見的采樣位數(shù)有8位、16位、24位、32位等。

??通道數(shù)指的是數(shù)字音頻信號(hào)中的聲道數(shù)。常見的通道數(shù)有單聲道（mono）和雙聲道（stereo），還有多聲道，如5.1聲道、7.1聲道等。多聲道可以通過在不同的聲道中播放不同的音頻信號(hào)來實(shí)現(xiàn)更加立體的音效。

??需要注意的是，采樣數(shù)、采樣位數(shù)和通道數(shù)三者共同決定了數(shù)字音頻信號(hào)的質(zhì)量和大小。采樣率和采樣位數(shù)越高、通道數(shù)越多，音頻文件的體積就越大，音質(zhì)也會(huì)越好。因此，在實(shí)際應(yīng)用中需要根據(jù)需求來選擇采樣率、采樣位數(shù)和通道數(shù)。

7、量化

??量化是指將連續(xù)的模擬信號(hào)轉(zhuǎn)換成離散的數(shù)字信號(hào)的過程。在數(shù)字信號(hào)處理中，量化是將采樣后的連續(xù)信號(hào)按照一定的準(zhǔn)則映射到離散標(biāo)準(zhǔn)值集合中的過程，其中，這些標(biāo)準(zhǔn)值形成一個(gè)有限制的數(shù)字集合。這些數(shù)字集合就是存儲(chǔ)數(shù)字信號(hào)所用的碼字，它們代表了信號(hào)的離散取值。

??量化的過程是通過量化器來實(shí)現(xiàn)的，量化器將采樣信號(hào)中的每個(gè)樣本映射為最接近的數(shù)字信號(hào)的取值。數(shù)字信號(hào)的每個(gè)碼字都是用二進(jìn)制編碼表示的。一般來說，采樣精度越高，量化器刻度越小，數(shù)字信號(hào)的準(zhǔn)確度就越高，質(zhì)量也越好。

??量化過程中，由于原始的模擬信號(hào)的取值范圍很大，而二進(jìn)制編碼能表示的數(shù)字范圍相對(duì)較小，因此，在量化過程中難免會(huì)出現(xiàn)誤差。這種誤差叫做量化誤差，它是原始模擬信號(hào)與離散化數(shù)字信號(hào)之間的差值。在數(shù)字音頻中，這種誤差會(huì)對(duì)音質(zhì)造成一定的影響。

8、比特率（碼率）

??比特率是指數(shù)字音頻數(shù)據(jù)的傳輸速率，通常使用比特每秒（bps）來衡量。它表示單位時(shí)間內(nèi)傳輸?shù)臄?shù)據(jù)量，也叫作數(shù)據(jù)傳輸速率。比特率越高，音頻質(zhì)量越好，但文件大小也越大。

??在數(shù)字音頻領(lǐng)域中，比特率通常表示為kbps（千比特每秒）或者Mbps（兆比特每秒）。例如，128kbps的MP3音頻表示每秒傳輸128千比特的音頻數(shù)據(jù)。高清音頻通常需要更高的比特率，否則會(huì)因壓縮損失而影響音質(zhì)。

??不同的數(shù)字音頻格式使用不同的比特率。例如，MP3音頻的標(biāo)準(zhǔn)比特率通常為128kbps或者192kbps，而Apple Lossless和FLAC等無損音頻格式則需要更高的比特率以保證音頻質(zhì)量?？傊忍芈适菙?shù)字音頻的一個(gè)重要指標(biāo)，它直接影響到音頻的質(zhì)量和存儲(chǔ)空間。

9、響度和強(qiáng)度

??響度和強(qiáng)度都是聲音的感知特性，但它們描述的是不同的方面：

??響度是人類主觀感受到的聲音強(qiáng)度，用分貝（dB）表示。通常，人們對(duì)于聽覺上的相同強(qiáng)度，低頻和高頻聲音的響度是不同的。響度與聲音的物理特性、頻率、振幅等都有關(guān)系。相同的振幅，低頻聲音的響度要高于高頻聲音的響度。相同的頻率，振幅更大的聲音響度更高，但人類對(duì)于高強(qiáng)度聲音的響度感受不如低強(qiáng)度聲音強(qiáng)烈。

??強(qiáng)度是聲波能量傳遞的測量值，表示單位時(shí)間內(nèi)通過單位面積的能量。強(qiáng)度與聲音源的振幅成正比，與聲音的傳播距離的平方成反比。強(qiáng)度同樣也可用分貝表示。它是聲波在空氣中傳播帶來的物理現(xiàn)象，與人類聽覺感知不同。

10、編碼

??每個(gè)量化值都是一個(gè)樣本，將所有這些樣本進(jìn)行存儲(chǔ)的過程稱為編碼。

??在音視頻領(lǐng)域中，編碼是指將音頻信號(hào)或視頻信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)，以便于在數(shù)字系統(tǒng)中儲(chǔ)存、傳輸、處理和回放。音頻編碼主要包括有損編碼和無損編碼兩種方式。有損音頻編碼可以壓縮數(shù)據(jù)的大小，但會(huì)丟失一些信息，比如MP3、AAC、WMA等。無損音頻編碼則可以達(dá)到無失真的壓縮，數(shù)據(jù)大小相對(duì)較大，比如FLAC、ALAC等。視頻編碼也存在有損和無損兩種編碼方式，但更多是有損編碼。常用的有損視頻編碼標(biāo)準(zhǔn)有MPEG-1、MPEG-2、MPEG-4、H.264/AVC、H.265/HEVC等，其中H.264/AVC和H.265/HEVC是目前應(yīng)用最廣泛的兩種視頻編碼標(biāo)準(zhǔn)。視頻編碼主要使用了運(yùn)動(dòng)估計(jì)、變換編碼、量化和熵編碼等技術(shù)來對(duì)視頻進(jìn)行壓縮編碼。

通常所說的音頻裸數(shù)據(jù)格式就是脈沖編碼調(diào)制（PCM）數(shù)據(jù)。PCM是一種用于數(shù)字音頻編碼的標(biāo)準(zhǔn)方法，它將模擬音頻信號(hào)進(jìn)行采樣，并將每個(gè)采樣值量化為離散的數(shù)字值。這些數(shù)字值表示音頻信號(hào)在每個(gè)采樣點(diǎn)上的振幅，然后以二進(jìn)制形式存儲(chǔ)。PCM數(shù)據(jù)是一種常見的音頻數(shù)據(jù)格式，它可以通過將數(shù)字值轉(zhuǎn)換為模擬信號(hào)來恢復(fù)原始的音頻信號(hào)。

11、音頻幀

??音頻幀是指一段連續(xù)的音頻數(shù)據(jù)，包含多個(gè)采樣點(diǎn)。通常音頻幀的長度與采樣率和采樣位數(shù)有關(guān)。

12、音頻文件大小的計(jì)算

??文件大小 = 采樣率 * 錄音時(shí)間 * 采樣位數(shù) / 8 * 通道數(shù)

總結(jié)

??本文概述了音頻的基本概念,如頻率、振幅、采樣等。并詳細(xì)介紹了數(shù)字音頻處理中的一些重要概念,如采樣率、采樣位數(shù)、量化、編碼等。后續(xù)我會(huì)繼續(xù)跟進(jìn)的。

??為了方便交流，我創(chuàng)建了一個(gè)后端和音視頻技術(shù)的qq群,群號(hào):333138957（可以掃下面的碼加群）。

??如果你對(duì)音視頻和后端開發(fā)感興趣,歡迎加入我們進(jìn)行深入交流。共同學(xué)習(xí),攜手推進(jìn)行業(yè)發(fā)展!

qq群:
音視頻學(xué)習(xí)—音視頻理論基礎(chǔ)（2）,音視頻,音視頻,學(xué)習(xí)

微信群:文章來源地址http://www.zghlxwxcb.cn/news/detail-861442.html

到了這里，關(guān)于音視頻學(xué)習(xí)—音視頻理論基礎(chǔ)（2）的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

音視頻基礎(chǔ)概念(5)——音頻基礎(chǔ)說明
現(xiàn)實(shí)生活中，音頻（Audio）主要用在兩大場景中，包括語音（Voice）和音樂（Music）。語音主要用于溝通，如打電話等。目前由于語音識(shí)別技術(shù)的發(fā)展，人機(jī)語音交互也是語音的一個(gè)應(yīng)用方向，很多大廠推出智能音箱、語音助手等。音樂主要用于欣賞和陶冶情操，如播放音樂。
2023年04月08日
瀏覽(22)
音視頻之旅 - 基礎(chǔ)知識(shí)
像素像素是圖像的基本單元，一個(gè)個(gè)像素就組成了圖像。你可以認(rèn)為像素就是圖像中的一個(gè)點(diǎn)。在下面這張圖中，你可以看到一個(gè)個(gè)方塊，這些方塊就是像素分辨率圖像（或視頻）的分辨率是指圖像的大小或尺寸。我們一般用像素個(gè)數(shù)來表示圖像的尺寸。比如說一張1920x1
2024年02月04日
瀏覽(21)
音視頻基礎(chǔ)知識(shí)——素材理解
素材是媒體內(nèi)容生產(chǎn)中一切生產(chǎn)資料的集合，包括不限于視頻、音頻、圖片、字幕等形式。素材通過統(tǒng)一的協(xié)議把原始的數(shù)據(jù)有序組織起來，便于編輯與管理。比如一般的素材是由一個(gè)物理文件及其各類屬性構(gòu)成，在對(duì)素材進(jìn)行剪輯處理時(shí)，不用改變源文件中的任何內(nèi)容，通
2024年02月01日
瀏覽(29)
音視頻BUG學(xué)習(xí)
1、首先看出現(xiàn)概率是偶現(xiàn)還是必現(xiàn) 2、如果是必現(xiàn)，則復(fù)現(xiàn)整個(gè)bug過程，看Bug是否出現(xiàn) 如果是偶現(xiàn)，則分析問題視頻在復(fù)現(xiàn)問題過程中，剛開始沒下載到本地，直接點(diǎn)擊播放發(fā)生慢放，因?yàn)榱髁烤W(wǎng)速較低，15s，40Mb 平均網(wǎng)速要超過2.7Mb/s，因此誤以為復(fù)現(xiàn)了bug 0 問題復(fù)現(xiàn) 找設(shè)
2024年02月11日
瀏覽(17)
學(xué)習(xí)筆記/音視頻面試
1.DTS/PTS 如果沒有B幀,那么DTS一般與PTS相同 DTS（Decoding Time Stamp）：即解碼時(shí)間戳，這個(gè)時(shí)間戳的意義在于告訴播放器該在什么時(shí)候解碼這一幀的數(shù)據(jù)。(解碼I-P-B) PTS（Presentation Time Stamp）：即顯示時(shí)間戳，這個(gè)時(shí)間戳用來告訴播放器該在什么時(shí)候顯示這一幀的數(shù)據(jù)。 2.GOP 就是將
2023年04月12日
瀏覽(28)
音視頻基礎(chǔ)知識(shí)-時(shí)間戳的理解
問題背景：凡是和流媒體和音視頻打交道，時(shí)間戳基本是一個(gè)必須深刻理解的概念。你會(huì)在各種各樣的傳輸協(xié)議和封裝格式中看到這個(gè)東西，而且表現(xiàn)形式還不一樣。其次這個(gè)概念會(huì)涉及到音視頻播放的同步問題，也會(huì)影響音視頻播放的控制問題。前者說的是音畫同步，后者
2023年04月08日
瀏覽(32)
FFmpeg基礎(chǔ):獲取音視頻的各種編碼參數(shù)
獲取視頻編碼參數(shù) 視頻編碼參數(shù)主要包括:幀率、分辨率、編碼格式、碼率等，對(duì)應(yīng)的概念如下。幀率(Frame Rate) 每秒顯示幀數(shù)(Frames Per Second)。電影的幀率一般是25fps和29.97fps,3D游戲要保持流暢則需要30fps以上的效果。分辨率指視頻寬高的像素?cái)?shù)值。標(biāo)準(zhǔn)1080P的分辨率為1920×
2024年02月03日
瀏覽(18)
音視頻學(xué)習(xí)之ffmpeg常用基礎(chǔ)命令整理
基于windows環(huán)境安裝好必要的ffmpeg后，對(duì)ffmpeg基礎(chǔ)命令進(jìn)行一些了解： ? 有時(shí)候?qū)懭隡P4文件會(huì)不成功，改成flv就好 1：視頻裁剪： ? 2：文字水印: 編譯的時(shí)候需要支持 FreeType、FontConfig、iconv，系統(tǒng)中需要有相關(guān)的子庫，在 FFmpeg 中增加純字母水印可以使用 drawtext 濾鏡進(jìn)行支持
2024年02月12日
瀏覽(25)
音視頻入門知識(shí)學(xué)習(xí)
1920x1080的屏幕，32位，30幀的fps。一秒鐘需要1920x1080x32x30字節(jié)，所以需要壓縮壓縮的核心思想就是去除冗余信息空間冗余空間冗余 == 相鄰像素重復(fù)：圖像內(nèi)部相鄰像素之間存在較強(qiáng)的相關(guān)性多造成的冗余比如一張圖片中間的一個(gè)位置大小20x20，它的表現(xiàn)肉眼看起來其實(shí)是一
2024年02月12日
瀏覽(17)
前端基礎(chǔ)（三十六）：讀取本地音視頻設(shè)備并進(jìn)行播放
請(qǐng)求媒體輸入和輸出設(shè)備的列表，例如麥克風(fēng)，攝像機(jī)，耳機(jī)設(shè)備等會(huì)提示用戶給予使用媒體輸入的許可，媒體輸入會(huì)產(chǎn)生一個(gè)MediaStream，里面包含了請(qǐng)求的媒體類型的軌道。此流可以包含一個(gè)視頻軌道（來自硬件或者虛擬視頻源，比如相機(jī)、視頻采集設(shè)備和屏幕共享服務(wù)等
2024年02月15日
瀏覽(32)