??博客主頁??:??https://blog.csdn.net/wkd_007??
??博客內(nèi)容??:??嵌入式開發(fā)、Linux、C語言、C++、數(shù)據(jù)結(jié)構(gòu)、音視頻??
??本文內(nèi)容??:??介紹AAC格式音頻文件解析??
??金句分享??:??你不能選擇最好的,但最好的會(huì)來選擇你——泰戈?duì)??
本文未經(jīng)允許,不得轉(zhuǎn)發(fā)?。?!
??一、概述
現(xiàn)在較常使用的AAC文件格式是使用ADTS幀來保存的,本文介紹以ADTS格式的AAC文件的解析過程。主要分為兩個(gè)部分,第一部分是用編輯器直接打開一個(gè)AAC文件來分析;第二部分是引用一個(gè)C語言代碼來解析ADTS格式的AAC文件。
關(guān)于AAC格式的一些基礎(chǔ)知識(shí),可以看上篇文章:【音視頻 | AAC】AAC音頻編碼詳解 。
??二、AAC文件分析
本節(jié)使用編輯器打開一個(gè)AAC文件分析,分析前,先簡單了解一下ADTS幀。
?2.1 ADTS幀
ADTS格式是AAC編碼的其中一種格式,將整個(gè)AAC文件分成一個(gè)個(gè)ADTS幀,ADTS幀頭一般是7個(gè)字節(jié)(沒有CRC)或者9個(gè)字節(jié)(有CRC)。
ADTS頭部又分為固定頭部、可變頭部,下面簡單介紹ADTS頭部的各個(gè)字段含義:
固定頭部各個(gè)字段解析:
- syncword(12bit):所有的bit位都是1??偸?xFFF,代表一個(gè)ADTS幀的開始,作為分界符,用于同步每幀起始位置。
- ID(1 bit):表示MPEG版本,0代表MPEG-4, 1代表MPEG-2,一般用 0,因?yàn)槎际菍儆?MPEG 的規(guī)范.。
- layer:占用 2 bit;一直是0;
- protection_absent:占用 1 bit;設(shè)置 1 表示沒有CRC,整個(gè)ADST頭為7字節(jié);0 表示有CRC,整個(gè)ADST頭為9字節(jié)。
- profile_ObjectType:占用 2 bit,表示使用的AAC規(guī)格(profile);
該字段的解釋取決于ID位的值。如果ID等于1,則該字段包含與ISO/IEC 13818-7中定義的ADTS流中的配置文件字段相同的信息,也就是MPEG-2的規(guī)格;當(dāng)ID為0是表示的是MPEG-4的規(guī)格,該字段的值等于 Audio Object Type 的值減1。字段取值如下面圖片的表格。![]()
- sampling_frequency_index:占用 4 bit;表示采樣率下標(biāo),字段取值及解釋如下圖:
![]()
- private_bit:占用 1 bit,編碼時(shí)設(shè)置為0,解碼時(shí)忽略;
- channel_configuration:占用 3 bit;
通道配置即聲道數(shù),一般 2 表示立體聲雙聲道。更多的值參考下圖:- original_copy:占用 1 bit,編碼時(shí)設(shè)置為0,解碼時(shí)忽略;
- home:占用 1 bit,編碼時(shí)設(shè)置為0,解碼時(shí)忽略。
可變頭部字段解析:
字段解析:
- copyright_identification_bit:占用 1 bit,編碼時(shí)設(shè)置為0,解碼時(shí)忽略;
- copyright_identification_start:占用 1 bit,編碼時(shí)設(shè)置為0,解碼時(shí)忽略;
- frame_length:占用 13 bit,當(dāng)前 ADTS 幀的長度,包括 ADTS 頭(固定+可變)和 AAC 原始流,單位byte;
- adts_buffer_fullness:占用 11 bit,0x7FF 表示碼率可變的碼流,0x000 表示固定碼率的碼流;
- number_of_raw_data_blocks_in_frame:占用 2 bit;
該字段表示當(dāng)前ADST幀中所包含的AAC幀的個(gè)數(shù)減一。為了最大的兼容性通常每個(gè)ADTS frame 包含一個(gè)AAC frame,所以該值一般為0。一個(gè)AAC原始幀包含一段時(shí)間內(nèi)1024個(gè)采樣及相關(guān)數(shù)據(jù)
?2.2 AAC文件解析
下圖是用編輯器打開一個(gè)AAC文件,用十六進(jìn)制查看的截圖:
沒有CRC的情況下,文件開頭的7個(gè)字節(jié)是ADTS幀頭部,這里7個(gè)字節(jié)的數(shù)據(jù)是:0xff 0xf1 0x4c 0x80 0x20 0x02 0x80
,我們按照ADTS幀的頭部數(shù)據(jù)來解析看看這7個(gè)字節(jié)表示什么?
- 前面
1-12
bit為0xff 0xf
,對(duì)應(yīng)了ADTS頭部的 syncword 字段,表示ADTS幀的開始。 -
13-16
bit為0x01
,二進(jìn)制是 0001,也就是說ID
的1bit為0(MPEG-4);layer
的2bit為00;protection_absent
的1bit為1,表示沒有CRC,整個(gè)頭部7個(gè)字節(jié)。 -
17-24
bit為0x4c
,二進(jìn)制是 0100 1100,意思是profile_ObjectType
的2bit為 01,結(jié)合前面ID為0,表示MPEG-4 AAC LC 規(guī)格;sampling_frequency_index
的4bit為0011,也就是0x3,表示采樣率為48000;private_bit
的1bit為0;
剩余1bit,結(jié)合后面的再看; -
25-32
bit為0x80
,二進(jìn)制是 1000 0000,意思是channel_configuration
的3bit(結(jié)合前面剩下的1bit)為 010,表示雙聲道;original_copy
的1bit為0;home
的1bit為0;copyright_identification_bit
的1bit為0;copyright_identification_start
的1bit為0;
剩余2bit,結(jié)合下個(gè)字段再看; -
33-44
bit為0x200
,二進(jìn)制是 0010 0000 0000,加上前面剩下的2bit,就是00 0010 0000 0000:frame_length
的13bit為00 0010 0000 000,也就是0x100,表示這個(gè)ADTS幀的長度是0x100;那么下個(gè)ADTS就是0x100開始的;
剩余1bit,留到下個(gè)字段再看; -
45-56
bit為0x280
,二進(jìn)制是 0010 1000 0000,加上前面剩下的1bit,就是 0 0010 1000 0000:adts_buffer_fullness
的11bit為 0 0010 1000 00,十六進(jìn)制0xa0;(目前不知道有什么作用2023-12-20 19:34:07)number_of_raw_data_blocks_in_frame
的2bit為 00,表示包含一個(gè)AAC frame。
后面的ADTS幀也可以類似上面的過程去解析。frame_length是代表了整個(gè)ADTS的大小。
??三、解析AAC文件的C語言代碼
代碼來源于:視音頻數(shù)據(jù)處理入門:AAC音頻碼流解析
/**
* 最簡單的視音頻數(shù)據(jù)處理示例
* Simplest MediaData Test
*
* 雷霄驊 Lei Xiaohua
* leixiaohua1020@126.com
* 中國傳媒大學(xué)/數(shù)字電視技術(shù)
* Communication University of China / Digital TV Technology
* http://blog.csdn.net/leixiaohua1020
*
* 本項(xiàng)目包含如下幾種視音頻測試示例:
* (1)像素?cái)?shù)據(jù)處理程序。包含RGB和YUV像素格式處理的函數(shù)。
* (2)音頻采樣數(shù)據(jù)處理程序。包含PCM音頻采樣格式處理的函數(shù)。
* (3)H.264碼流分析程序??梢苑蛛x并解析NALU。
* (4)AAC碼流分析程序。可以分離并解析ADTS幀。
* (5)FLV封裝格式分析程序??梢詫LV中的MP3音頻碼流分離出來。
* (6)UDP-RTP協(xié)議分析程序。可以將分析UDP/RTP/MPEG-TS數(shù)據(jù)包。
*
* This project contains following samples to handling multimedia data:
* (1) Video pixel data handling program. It contains several examples to handle RGB and YUV data.
* (2) Audio sample data handling program. It contains several examples to handle PCM data.
* (3) H.264 stream analysis program. It can parse H.264 bitstream and analysis NALU of stream.
* (4) AAC stream analysis program. It can parse AAC bitstream and analysis ADTS frame of stream.
* (5) FLV format analysis program. It can analysis FLV file and extract MP3 audio stream.
* (6) UDP-RTP protocol analysis program. It can analysis UDP/RTP/MPEG-TS Packet.
*
*/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int getADTSframe(unsigned char* buffer, int buf_size, unsigned char* data ,int* data_size){
int size = 0;
if(!buffer || !data || !data_size ){
return -1;
}
while(1){
if(buf_size < 7 ){
return -1;
}
//Sync words
if((buffer[0] == 0xff) && ((buffer[1] & 0xf0) == 0xf0) ){
size |= ((buffer[3] & 0x03) <<11); //high 2 bit
size |= buffer[4]<<3; //middle 8 bit
size |= ((buffer[5] & 0xe0)>>5); //low 3bit
break;
}
--buf_size;
++buffer;
}
if(buf_size < size){
return 1;
}
memcpy(data, buffer, size);
*data_size = size;
return 0;
}
int simplest_aac_parser(char *url)
{
int data_size = 0;
int size = 0;
int cnt=0;
int offset=0;
//FILE *myout=fopen("output_log.txt","wb+");
FILE *myout=stdout;
unsigned char *aacframe=(unsigned char *)malloc(1024*5);
unsigned char *aacbuffer=(unsigned char *)malloc(1024*1024);
FILE *ifile = fopen(url, "rb");
if(!ifile){
printf("Open file error\n");
return -1;
}
printf("-----+- ADTS Frame Table -+------+\n");
printf(" NUM | Profile | Frequency| Size |\n");
printf("-----+---------+----------+------+\n");
while(!feof(ifile)){
data_size = fread(aacbuffer+offset, 1, 1024*1024-offset, ifile);
unsigned char* input_data = aacbuffer;
while(1)
{
int ret=getADTSframe(input_data, data_size, aacframe, &size);
if(ret==-1){
break;
}else if(ret==1){
memcpy(aacbuffer,input_data,data_size);
offset=data_size;
break;
}
char profile_str[10]={0};
char frequence_str[10]={0};
unsigned char profile=aacframe[2]&0xC0;
profile=profile>>6;
switch(profile){
case 0: sprintf(profile_str,"Main");break;
case 1: sprintf(profile_str,"LC");break;
case 2: sprintf(profile_str,"SSR");break;
default:sprintf(profile_str,"unknown");break;
}
unsigned char sampling_frequency_index=aacframe[2]&0x3C;
sampling_frequency_index=sampling_frequency_index>>2;
switch(sampling_frequency_index){
case 0: sprintf(frequence_str,"96000Hz");break;
case 1: sprintf(frequence_str,"88200Hz");break;
case 2: sprintf(frequence_str,"64000Hz");break;
case 3: sprintf(frequence_str,"48000Hz");break;
case 4: sprintf(frequence_str,"44100Hz");break;
case 5: sprintf(frequence_str,"32000Hz");break;
case 6: sprintf(frequence_str,"24000Hz");break;
case 7: sprintf(frequence_str,"22050Hz");break;
case 8: sprintf(frequence_str,"16000Hz");break;
case 9: sprintf(frequence_str,"12000Hz");break;
case 10: sprintf(frequence_str,"11025Hz");break;
case 11: sprintf(frequence_str,"8000Hz");break;
default:sprintf(frequence_str,"unknown");break;
}
fprintf(myout,"%5d| %8s| %8s| %5d|\n",cnt,profile_str ,frequence_str,size);
data_size -= size;
input_data += size;
cnt++;
}
}
fclose(ifile);
free(aacbuffer);
free(aacframe);
return 0;
}
int main()
{
simplest_aac_parser((char*)"./audio_chn0.aac");
return 0;
}
保存后, gcc simplest_mediadata_aac.cpp
編譯,運(yùn)行結(jié)果:
??四、總結(jié)
??本文介紹用編輯器打開aac文件,怎樣去分析,了解后,可以對(duì)aac文件有更深的認(rèn)識(shí)。最后,借鑒了一份解析aac文件的源碼。
如果文章有幫助的話,點(diǎn)贊??、收藏?,支持一波,謝謝 ??????文章來源:http://www.zghlxwxcb.cn/news/detail-760274.html
參考資料:
視音頻數(shù)據(jù)處理入門:AAC音頻碼流解析文章來源地址http://www.zghlxwxcb.cn/news/detail-760274.html
到了這里,關(guān)于【音視頻 | AAC】AAC格式音頻文件解析的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!