售前電話
135-3656-7657
售前電話 : 135-3656-7657
在現(xiàn)代通信技術(shù)中,信息處理的硬件大部分都是數(shù)字邏輯電路或數(shù)字計(jì)算機(jī),因此音視頻信息進(jìn)入系統(tǒng)必須進(jìn)行數(shù)字化處理。模擬信號(hào)在時(shí)間上是連續(xù)的,而數(shù)字音視頻則對(duì)應(yīng)一個(gè)時(shí)間離散的數(shù)字序列。為用數(shù)字形式傳輸和處理音視頻信息,首先要解決的問題是音視頻信息的數(shù)字化,這包括兩方面的內(nèi)容:
•音頻信息時(shí)間上的離散化和圖像信息空間位置的離散化。
•音頻信息電平值和圖像灰度電平值的離散化。
上述過程涉及音視頻信號(hào)的采樣,量化和編碼。對(duì)于音頻信號(hào)而言,采樣就是使音頻信號(hào)在時(shí)間軸上離散化,每隔一個(gè)時(shí)間間隔在模擬聲音波形上取一個(gè)幅度值,采樣的時(shí)間間隔稱之為采樣周期。根據(jù)采樣定理,只要采樣頻率等于或大于音頻信號(hào)中最高頻率成份的兩倍,信息量就不會(huì)丟失,也就是說可以由采樣后的離散信號(hào)不失真地重建原始的模擬音頻信號(hào),否則就會(huì)產(chǎn)生不同程度的失真。因此采樣頻率的選擇是音頻信息數(shù)字化的關(guān)鍵技術(shù)之一?,F(xiàn)代通信技術(shù)中通常選用的音頻采樣頻率有8kHz,11.025kHz,16kHz,22.05kHz,32kHz,44.1kHz和48kHz等。音頻信號(hào)通常采用8~20bit量化編碼。一般在允許失真條件下,盡可能選擇較低的采樣頻率,以免使數(shù)據(jù)速率過高。
對(duì)于視頻信號(hào)而言,采樣就是使圖像信號(hào)在空間位置上離散化。設(shè)F1(x、y)表示一個(gè)實(shí)際圖像的光強(qiáng)度函數(shù),x、y為空間坐標(biāo),它是一個(gè)連續(xù)的圖像場(chǎng),在空間上覆蓋無窮大的區(qū)域,對(duì)于一個(gè)理想的抽樣函數(shù),將F1(x、y)乘上一個(gè)空間抽樣函數(shù)S(x、y),則得抽樣后的離散圖像。
FP(x,y)=F1(x,y)S(x,y) (1)
式(1)中
而△x及△y是δ函數(shù)無窮陣列的空間間隔。
對(duì)抽樣后離散圖像進(jìn)行二維傅里葉變換,得到其頻譜表達(dá)式為
其中
由圖1可見:抽樣后圖像的頻率是在頻率軸上分別以間隔△u及△v將原圖像的頻譜無限重復(fù)構(gòu)成的,當(dāng)抽樣頻率滿足奈奎斯特準(zhǔn)則,且原圖像的頻譜是有限帶寬時(shí),抽樣后圖像的頻譜就不會(huì)出觀混疊。
圖1 抽樣前后圖像的頻譜
為了防止混疊失真的出現(xiàn),通常情況下在抽樣前要對(duì)視頻圖像信號(hào)進(jìn)行低通濾波來限制帶寬。從抽樣后圖像的頻譜可以看出,利用一個(gè)低通濾波器將原圖像頻譜濾出,則可無失真地重建原圖像。
經(jīng)過抽樣后的音視頻信號(hào),只是一系列時(shí)間或空間上的離散樣值,而每個(gè)樣值的取值仍是連續(xù)的,要想進(jìn)行數(shù)字化表示必須將它轉(zhuǎn)換為有限個(gè)離散值,這個(gè)過程稱為量化。如果樣值等間隔分層量化,則稱之為均勻量化,若使用非等間隔進(jìn)行量化,則稱為非均勻量化。在量化過程中,一個(gè)模擬信號(hào)樣本與一組判決電平作比較,如果樣本落在兩個(gè)判決電平之間,則它被量化到這個(gè)量化區(qū)內(nèi)的一個(gè)固定電平上去,模擬值與量化值間的誤差稱之為量化誤差或量化失真。對(duì)圖像信號(hào)而言,在圖像亮度平坦區(qū)域這種量化噪聲看起來像顆粒狀,故稱之為顆粒噪聲;圖像量化帶來的另一種失真稱為偽輪廓現(xiàn)象。顯然,量化噪聲與偽輪廓現(xiàn)象都與量化精度有關(guān),量化越精細(xì)量化噪聲越小,偽輪廓現(xiàn)象就會(huì)減輕,但這是以增加電平數(shù)(碼率)為代價(jià)的。在數(shù)字系統(tǒng)中被量化之后的音視頻信號(hào)其每個(gè)量化電平最終被賦予一個(gè)二進(jìn)制碼字。因此音視頻信號(hào)數(shù)字編碼的實(shí)質(zhì)是:在保證一定圖像或聲音質(zhì)量(信噪比要求和主觀評(píng)價(jià)得分)的前提下,以最小比特?cái)?shù)來表示音視頻信號(hào)。視頻信號(hào)通常采用6~10bit量化編碼。