国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

音視頻基礎(chǔ)知識-時間戳的理解

這篇具有很好參考價值的文章主要介紹了音視頻基礎(chǔ)知識-時間戳的理解。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

問題背景:

凡是和流媒體和音視頻打交道,時間戳基本是一個必須深刻理解的概念。你會在各種各樣的傳輸協(xié)議和封裝格式中看到這個東西,而且表現(xiàn)形式還不一樣。其次這個概念會涉及到音視頻播放的同步問題,也會影響音視頻播放的控制問題。前者說的是音畫同步,后者說的是類似快進,隨機點播放等。如果要理解好這個概念,需要掌握下面幾個名詞的含義。

基本概念:

采樣率

音視頻現(xiàn)在采用的數(shù)字編碼方法,簡單說就是把音視頻這種波形和圖像進行采集,量化,編碼,傳輸,解碼。所以采樣率就是每秒鐘抽取圖像或者聲波幅度樣本的次數(shù)。比如音頻采樣率8k,就是表示把波形進行每秒8000次采樣。

我們看到一秒的采樣頻率其實挺大的,至于這個值是多少合理,其實無論視頻還是音頻都和人的視覺特征和聽覺特征有關(guān)系。

對于人的視覺而言,只要1秒鐘播放的視頻達到25幀以上,我們就看到了連續(xù)的圖像即為視頻。如果低于這個值,我們?nèi)搜劬湍芨杏X出來卡頓。

對于人的聽覺而言,正常的聽覺頻率范圍在20Hz-20kHz,根據(jù)奎斯特采樣理論,為了保證音頻不失真,我們的采樣頻率應(yīng)該在40kHz左右。為什么采樣率不是越高越好呢,因為采樣率越高意味著你傳輸?shù)臄?shù)據(jù)量越多,這樣給編碼和傳輸都帶了極大的負擔(dān),成本也是個重要考慮因素。

幀率

幀率就是每秒顯示的幀數(shù),比如30fps就是1秒顯示30幀圖像。但是對于音頻可能理解幀率不太好理解,這有點抽象。對于音頻,不同的編碼方式比如AAC和mp3分別就規(guī)定1024采樣sample,mp3每幀為1152采樣,如果一個采樣用一個字節(jié)表示,那就是1024字節(jié)AAC編碼音頻為一幀,1152字節(jié)為MP3編碼方式的音頻一幀。

時間戳單位

前面我們提到采樣率,感覺到采樣率是個很大的單位,一般標準的音頻AAC采樣率達到了44kHz,視頻采樣率也規(guī)定在90000Hz.所以我們衡量時間的單位不能再是秒,毫秒這種真實的時間單位,我們的單位應(yīng)該轉(zhuǎn)換為采樣率,也就是一個采樣的時間為音視頻的時間單位,這就是時間戳的真實值。當(dāng)我們要播放和控制時,我們再將時間戳根據(jù)采樣率轉(zhuǎn)換為真實的時間即可。

一句話,時間戳不是真實的時間是采樣次數(shù)。比如時間戳是160,我們不能認為是160秒或者160毫秒,應(yīng)該是160個采樣。要換算真實時間,我們必須知道采樣率,比如8000,那么說明1秒被劃分成8000分之一,如果你要明確160個采樣占用的時間,則160*(1/8000)即可,即20毫秒。

時間戳增量

就是一幀圖像和另外一幀圖像之間的時間戳差值,或者一幀音頻和一幀音頻的時間戳差值。同理時間戳增量也是采樣個數(shù)的差值不是真實時間差值,還是要根據(jù)采樣率才能換算成真實時間。

所以對于視頻和音頻的時間戳計算要一定明確幀率是多少,采樣率是多少。

比如視頻而言,幀率25,那么對于90000的采樣率來說,一幀占用的采樣數(shù)就是90000/25也就是3600,說明每幀圖像的時間戳增量應(yīng)該是3600,換算成實際時間就是3600*(1/90000)=0.04秒=40毫秒,這也和1/25=0.04秒=40毫秒一致。

對于AAC音頻,一幀1024個采樣,采樣頻率是44kHz,所以一幀的播放時間應(yīng)該是1024*(1/44100)=0.0232秒=23.22毫秒。

同步方法:

上面說了時間戳重要的功能就是來為了音視頻的同步,那么這個時間戳到底是如何讓音視頻同步的呢?

播放器本地需要建立一個系統(tǒng)時鐘,這個時鐘一般是根據(jù)CPU時間計算出來的,當(dāng)播放開始時時鐘時間為0,時間戳決定了一幀解碼和渲染的時刻。當(dāng)播放開始,時鐘時間會進行增加,播放器會用系統(tǒng)時鐘和當(dāng)前視頻和音頻的時間戳進行比較,如果音視頻的時間戳小于當(dāng)前系統(tǒng)時鐘,那么就要晚點進行解碼和渲染播放。

可以看到播放能否準確進行需要編碼器打的時間戳必須精確,同時播放器端的系統(tǒng)時鐘也精確,因為播放時要基于時間戳和這個系統(tǒng)時鐘對數(shù)據(jù)流進行控制,也就是對數(shù)據(jù)塊要根據(jù)時間戳來采取不同的處理方法。實際無論編碼器還是本地播放器都不能非常精確,所以我們說固定幀率25,也有可能編碼器一遍打24幀的現(xiàn)象出現(xiàn)。為了解決這個累計誤差問題,一般我們需要在播放端有一套反饋機制,能夠消除這種誤差。其實,同步是一個動態(tài)的過程,是一個有人等待、有人追趕的過程。同步只是暫時的,而不同步才是常態(tài)。人們總是在同步的水平線上振蕩波動,但不會偏離這條基線太遠。文章來源地址http://www.zghlxwxcb.cn/news/detail-400193.html

到了這里,關(guān)于音視頻基礎(chǔ)知識-時間戳的理解的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 音視頻學(xué)習(xí)-音視頻基礎(chǔ)

    音視頻學(xué)習(xí)-音視頻基礎(chǔ)

    ` ? 像素:像素是一個圖片的基本單位,pix是英語單詞picture的簡寫,加上英語單詞“元素element”,就得到了“pixel”,簡稱px,所以“像素”有“圖像元素”之意。 ? 分辨率:是指圖像的大小或尺寸。比如1920x1080。 ? 位深:是指在記錄數(shù)字圖像的顏色時,計算機實際上是用

    2024年02月12日
    瀏覽(169)
  • 音視頻學(xué)習(xí)—音視頻理論基礎(chǔ)(2)

    音視頻學(xué)習(xí)—音視頻理論基礎(chǔ)(2)

    ??音頻是一種模擬信號,它是由聲波轉(zhuǎn)化而來的電信號。聲波是通過氣體、液體或固體傳播的機械波,代表了聲音的震動。在錄制過程中,聲音被轉(zhuǎn)換成電信號,然后被儲存在數(shù)字格式中。 ??聲音的三要素是頻率、振幅和波形 ??頻率是指聲波的振動次數(shù),通常使用赫

    2024年04月29日
    瀏覽(33)
  • 音視頻基礎(chǔ)概念(6)——視頻基礎(chǔ)

    音視頻基礎(chǔ)概念(6)——視頻基礎(chǔ)

    網(wǎng)上沖浪時,我們會接觸到網(wǎng)絡(luò)流媒體和本地視頻文件。常見的視頻文件格式有MP4、MKV、AVI等。在流媒體網(wǎng)站上看見視頻常用的協(xié)議有HTTP、RTSP、RTMP、HLS等。視頻技術(shù)較為復(fù)雜,包括視頻封裝、視頻編解碼、視頻播放和視頻轉(zhuǎn)碼等內(nèi)容。 當(dāng)下市場常見的視頻APP很多,其中10

    2024年02月04日
    瀏覽(31)
  • 「Python|場景案例」如何獲取音視頻中聲音片段的起止時間?

    「Python|場景案例」如何獲取音視頻中聲音片段的起止時間?

    本文主要介紹如何使用python的第三方庫moviepy找出音視頻中聲音開始出現(xiàn)的位置以及聲音結(jié)束的位置。 假設(shè)我們有一段音頻,音頻開始有一段無聲片段,音頻結(jié)束也有一段無聲片段,我們需要知道開頭無聲片段的結(jié)束位置和結(jié)束無聲片段的開始位置,或者換句話說, 我們需要

    2023年04月14日
    瀏覽(71)
  • 音視頻基礎(chǔ)

    音視頻基礎(chǔ)

    本篇文章我們來講一下音視頻基礎(chǔ) 像素點: 將以下圖片的美女眼睛放大 能夠看到一個一個的小方塊 這就是像素點 照片像素=寬像素點*高像素點 像素點 代碼實例: ? ?分辯率: 圖像或者視頻的分辨率是指圖像的大小或者尺寸 我們通常用像素表示圖像的尺寸 圖像的分辨率越高

    2024年02月20日
    瀏覽(21)
  • 音視頻基礎(chǔ)概念(5)——音頻基礎(chǔ)說明

    現(xiàn)實生活中,音頻(Audio)主要用在兩大場景中,包括語音(Voice)和音樂(Music)。語音主要用于溝通,如打電話等。目前由于語音識別技術(shù)的發(fā)展,人機語音交互也是語音的一個應(yīng)用方向,很多大廠推出智能音箱、語音助手等。音樂主要用于欣賞和陶冶情操,如播放音樂。

    2023年04月08日
    瀏覽(22)
  • 音視頻知識:MPEG-4、H264、MP4、AAC之間的關(guān)系

    MPEG-4 一種編碼標準。是國際標準化組織 (ISO) 主要針對消費類應(yīng)用,已經(jīng)針對運動圖像壓縮定義的標準。MPEG(Moving Picture Experts Group)標準包括 MPEG1、MPEG2與 MPEG4。 MPEG-4標準目前分為27個部分,統(tǒng)稱為ISO/IEC14496國際標準。其中第10部分(ISO/IEC 14496-10)就是熟悉的高級視頻編碼

    2024年02月14日
    瀏覽(40)
  • 音視頻學(xué)習(xí)之ffmpeg常用基礎(chǔ)命令整理

    音視頻學(xué)習(xí)之ffmpeg常用基礎(chǔ)命令整理

    基于windows環(huán)境安裝好必要的ffmpeg后,對ffmpeg基礎(chǔ)命令進行一些了解: ? 有時候?qū)懭隡P4文件會不成功,改成flv就好 1:視頻裁剪: ? 2:文字水印: 編譯的時候需要支持 FreeType、FontConfig、iconv,系統(tǒng)中需要有相關(guān)的子庫, 在 FFmpeg 中增加純字母水印可以使用 drawtext 濾鏡進行支持

    2024年02月12日
    瀏覽(26)
  • FFmpeg基礎(chǔ):獲取音視頻的各種編碼參數(shù)

    FFmpeg基礎(chǔ):獲取音視頻的各種編碼參數(shù)

    獲取視頻編碼參數(shù) 視頻編碼參數(shù)主要包括:幀率、分辨率、編碼格式、碼率等,對應(yīng)的概念如下。 幀率(Frame Rate) 每秒顯示幀數(shù)(Frames Per Second)。電影的幀率一般是25fps和29.97fps,3D游戲要保持流暢則需要30fps以上的效果。 分辨率 指視頻寬高的像素數(shù)值。標準1080P的分辨率為1920×

    2024年02月03日
    瀏覽(18)
  • 前端基礎(chǔ)(三十六):讀取本地音視頻設(shè)備并進行播放

    前端基礎(chǔ)(三十六):讀取本地音視頻設(shè)備并進行播放

    請求媒體輸入和輸出設(shè)備的列表,例如麥克風(fēng),攝像機,耳機設(shè)備等 會提示用戶給予使用媒體輸入的許可,媒體輸入會產(chǎn)生一個MediaStream,里面包含了請求的媒體類型的軌道。此流可以包含一個視頻軌道(來自硬件或者虛擬視頻源,比如相機、視頻采集設(shè)備和屏幕共享服務(wù)等

    2024年02月15日
    瀏覽(32)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包