售前電話
135-3656-7657
售前電話 : 135-3656-7657
在現(xiàn)代通信系統(tǒng)中盡管數(shù)據(jù)業(yè)務(wù)與多媒體通信業(yè)務(wù)發(fā)展非常迅速,但模擬與數(shù)字視音頻業(yè)務(wù)在所有通信業(yè)務(wù)中仍然占有主要地位。在此類業(yè)務(wù)中包括普通電話、IP電話、移動(dòng)電話、數(shù)字電話、可視電話、會(huì)議電視、廣播電視、數(shù)字視頻廣播、點(diǎn)播電視等各種視音頻業(yè)務(wù)。
視音頻信息基本概念
在現(xiàn)代通信技術(shù)中音頻信息主要是指由自然界中各種音源發(fā)出的可聞聲和由計(jì)算機(jī)通過(guò)專門設(shè)備合成的語(yǔ)音或音樂(lè)。按表示媒體的不同,此類聲音主要有三類,即語(yǔ)音、音樂(lè)聲和效果聲等。音頻信號(hào)是隨時(shí)間變化的連續(xù)媒體,對(duì)音頻信號(hào)的處理要求有比較強(qiáng)的時(shí)序性,即較小的延時(shí)和時(shí)延抖動(dòng)。對(duì)音頻信號(hào)的處理涉及音頻信號(hào)的獲取、編解碼、傳輸、語(yǔ)音的識(shí)別與理解、語(yǔ)音與音樂(lè)的合成等內(nèi)容。
視頻信息即活動(dòng)或運(yùn)動(dòng)的圖像信息,它由一系列周期呈現(xiàn)的畫(huà)面所組成,每幅畫(huà)面稱為一幀,幀是構(gòu)成視頻信息的最基本單元。視頻信息在現(xiàn)代通信系統(tǒng)所傳輸?shù)男畔⒅姓加兄匾牡匚唬驗(yàn)槿祟惤邮艿男畔⒓s有70%來(lái)自視覺(jué),視頻信息具有準(zhǔn)確、直觀、具體生動(dòng)、高效、應(yīng)用廣泛、信息容量大等特點(diǎn)。
1.聽(tīng)覺(jué)特性與音頻信號(hào)
(1)人的聽(tīng)覺(jué)特性
①人對(duì)聲音強(qiáng)弱的感覺(jué)
通過(guò)對(duì)大量人群的測(cè)量發(fā)現(xiàn),當(dāng)聲音信號(hào)的強(qiáng)度按指數(shù)規(guī)律增長(zhǎng)時(shí),人會(huì)大體上感到聲音在均勻地增強(qiáng),即將聲音聲強(qiáng)取對(duì)數(shù)后,才與人對(duì)聲音的強(qiáng)弱感相對(duì)應(yīng)。根據(jù)人類聽(tīng)覺(jué)的這一特點(diǎn),通常用聲強(qiáng)值或聲壓有效值的對(duì)數(shù)來(lái)表示聲音的強(qiáng)弱.稱為聲強(qiáng)級(jí)L1或聲壓級(jí)Lp單位為分貝(dB)。
②人對(duì)聲音頻率的感覺(jué)
人對(duì)聲音頻率的感覺(jué)表現(xiàn)為音調(diào)的高低,且當(dāng)聲音的頻率按指數(shù)規(guī)律上升時(shí),音調(diào)的感覺(jué)線性升高。這意味著只有對(duì)聲音信號(hào)的頻率取對(duì)數(shù),才會(huì)與人的音高感覺(jué)成線性關(guān)系。
為了適應(yīng)人類聽(tīng)覺(jué)的音高感規(guī)律,在聲學(xué)和音樂(lè)當(dāng)中表示頻率的坐標(biāo)經(jīng)常采用對(duì)數(shù)刻度。音樂(lè)里為了使音階的排列使聽(tīng)起來(lái)音高的變化是均勻的,音階的劃分是在頻率的對(duì)數(shù)刻度上取等分得到的。
③人類聽(tīng)覺(jué)的頻響特性
人類聽(tīng)覺(jué)對(duì)聲音頻率的感覺(jué)不僅表現(xiàn)為音調(diào)的高低,而且在聲音強(qiáng)度相同條件下聲音主觀感覺(jué)的強(qiáng)弱也是不同的,即人類聽(tīng)覺(jué)的頻率響應(yīng)不是平坦的。此外,人的聽(tīng)覺(jué)頻響還隨聲壓級(jí)的變化而變化。人類聽(tīng)覺(jué)頻響的特點(diǎn)是:聲壓級(jí)越高,聽(tīng)覺(jué)頻響越平直;隨聲音聲壓級(jí)的降低,聽(tīng)覺(jué)頻響變壞,低頻響應(yīng)下降明顯。對(duì)于高于20kHz和低于20Hz的聲音信號(hào),不論聲壓級(jí)多高,一般人也不會(huì)聽(tīng)到,即人的聽(tīng)覺(jué)頻帶為20Hz?20kHz,在此頻率范圍內(nèi)的聲音稱為“可聞聲氣高于20kHz的聲音稱為“超聲”,低于20Hz的聲音的稱為“次聲”。不論聲壓級(jí)高低,人對(duì)3kHz?5kHz頻率的聲音最敏感。
④人類聽(tīng)覺(jué)的掩蔽效應(yīng)
在人類聽(tīng)覺(jué)系統(tǒng)中的另一個(gè)現(xiàn)象是一個(gè)聲音的存在會(huì)影響人們對(duì)其他聲音的聽(tīng)覺(jué)能力,使一個(gè)聲音在聽(tīng)覺(jué)上掩蔽了另一個(gè)聲音,即所謂的“掩蔽效應(yīng)”。掩蔽效應(yīng)常在電聲系統(tǒng)中被加以利用,使有用聲音信號(hào)掩蔽掉那些不需要的聲音信號(hào),并根據(jù)有用信號(hào)的強(qiáng)度來(lái)規(guī)定允許的最大噪聲強(qiáng)度。此外,在音頻信號(hào)數(shù)字編碼技術(shù)中,還可利用人類聽(tīng)覺(jué)系統(tǒng)的掩蔽效應(yīng)實(shí)現(xiàn)高效率的壓縮編碼。
(2)音頻信號(hào)特性
對(duì)于不同類型的發(fā)聲體來(lái)說(shuō),其聲音信號(hào)的頻譜分布各不相同。一般人講話聲音的主要能量分布較窄,以頻帶下降25dB計(jì)大概為100Hz?5kHz,因此在電話通信中每一話路的頻帶一般限制在30()Hz?3.4kHz即可將語(yǔ)聲信號(hào)中的大部分能量發(fā)送出去.同時(shí)保持一定的可懂度和聲色的平衡。相對(duì)于語(yǔ)音頻譜,歌唱聲的頻譜要寬得多,一般男低音可唱到比中央C低十三度的E音,其基頻為82.407Hz,而女高音可唱到比中央C高兩個(gè)八度的C音或更高,其基頻為1046.5Hz,它的第十次諧波已經(jīng)超過(guò)10kHz。與人的發(fā)聲器官相比,各種樂(lè)器發(fā)聲的頻譜范圍則明顯要寬的多,從完美傳送和記錄音樂(lè)的角度,電聲設(shè)備的頻帶下限一般要到20Hz以下,而其頻帶上限一般要到20kHz以上。