售前電話
135-3656-7657
售前電話 : 135-3656-7657
眾所周知,安防視頻監(jiān)控系統(tǒng)不僅需要對(duì)前端實(shí)時(shí)監(jiān)控,還需要對(duì)已存儲(chǔ)的海量視頻進(jìn)行檢索和回放。視頻內(nèi)容檢索技術(shù)包括對(duì)監(jiān)控視頻運(yùn)動(dòng)目標(biāo)檢測(cè)、特征提取、相似度匹配等多項(xiàng)技術(shù),是通過(guò)計(jì)算機(jī)對(duì)視頻的內(nèi)容進(jìn)行自動(dòng)分析、提取特征信息制成索引等處理。當(dāng)用戶查詢所需的內(nèi)容時(shí),系統(tǒng)自動(dòng)返回與檢索需求最相近的圖像或者視頻片段。例如,可以通過(guò)檢索目標(biāo)照片,方便地檢索到該目標(biāo)在監(jiān)控區(qū)域內(nèi)的所有活動(dòng)的錄像;或基于目標(biāo)的重要特征(如顏色、大小、形狀等)檢索指定時(shí)間、活動(dòng)范圍內(nèi)的錄像資料,從而大大提高安防視頻監(jiān)控系統(tǒng)的檢索效率和應(yīng)用效能。
視頻在現(xiàn)有的各種數(shù)據(jù)形式中,具有巨大的數(shù)據(jù)量、復(fù)雜的數(shù)據(jù)結(jié)構(gòu)以及獨(dú)有的時(shí)空特性。時(shí)空特性可以用來(lái)表征內(nèi)容屬性:空間上,視頻可以區(qū)分為各個(gè)獨(dú)立的物件;時(shí)間上,則表現(xiàn)為各自的運(yùn)動(dòng)特性。
視頻數(shù)據(jù)包含低層次的視覺特性信息,以及高層次的語(yǔ)義內(nèi)容屬性,其中視覺特性信息包含有顏色、形狀、紋理及運(yùn)動(dòng)等屬性:而語(yǔ)義內(nèi)容屬性包含有人物、地點(diǎn)、事件及情節(jié)等方面。此外,低層次的視覺特性可以通過(guò)模型知識(shí)庫(kù)的推理過(guò)程,自動(dòng)生成高層次的語(yǔ)義內(nèi)容信息,其關(guān)系如圖7-6所示。
圖7-6視頻數(shù)據(jù)特性
安防視頻監(jiān)控產(chǎn)生的視覺資源是海量的,這些持續(xù)膨脹的視覺資源帶來(lái)了相當(dāng)嚴(yán)重的問題,大量的數(shù)字資源因無(wú)法對(duì)其進(jìn)行及時(shí)有效的處理,而致使采集到的視頻資源閑置。在大視頻數(shù)據(jù)集合中,選擇滿足某些約束的視頻子集是視頻檢索中的一個(gè)中心問題,也是安防視頻監(jiān)控系統(tǒng)必須具備的關(guān)鍵功能之一。本節(jié)介紹視頻內(nèi)容檢索技術(shù)的基本概念、視頻內(nèi)容檢索系統(tǒng)結(jié)構(gòu),以及視頻內(nèi)容檢索的幾個(gè)關(guān)鍵技術(shù)。
視頻內(nèi)容檢索技術(shù)的基本概念 1.視頻內(nèi)容檢索的含義所謂檢索,是指存儲(chǔ)與檢索檔案信息的過(guò)程。視頻檢索主要包含兩層含義。
(1)檢查搜索,即從廣泛的存儲(chǔ)信息中查找相應(yīng)信息。視頻檢索的這第一層意義,就是計(jì)算機(jī)接收用戶輸入的查詢數(shù)據(jù),并在視頻數(shù)據(jù)庫(kù)中查詢相匹配的數(shù)據(jù),它和文本、圖像、音頻等的檢索基本在過(guò)程上是相同的,但是由于查詢的數(shù)據(jù)和被查詢的數(shù)據(jù)的差異,在相應(yīng)檢索技術(shù)上有很大差別。
(2)索引,為大量的存儲(chǔ)信息建立索引,以便于瀏覽。視頻檢索的這第二層意義,就是計(jì)算機(jī)自動(dòng)或手動(dòng)載入視頻數(shù)據(jù)庫(kù),并且自動(dòng)或半自動(dòng)地為視頻數(shù)據(jù)庫(kù)建立索引,從而可以進(jìn)行視頻數(shù)據(jù)瀏覽的過(guò)程。
2.常用的視頻檢索方法常用的視頻檢索方法有基于文本標(biāo)注信息的視頻檢索和基于內(nèi)容的視頻檢索兩種。
(1)基于文本標(biāo)注信息的視頻檢索?;谖谋緲?biāo)注信息的視頻檢索是一種基于關(guān)鍵詞的檢索方法,其過(guò)程或步驟如下。
該搜索方式能夠有效地檢索結(jié)構(gòu)化的文本信息,但是應(yīng)用于視頻檢索會(huì)存在以下幾個(gè)方面的問題。
①視頻數(shù)據(jù)自身包含有大量信息,用手工的方法來(lái)標(biāo)注視頻數(shù)據(jù)的關(guān)鍵詞費(fèi)時(shí)費(fèi)力。
②因視頻數(shù)據(jù)具有相當(dāng)復(fù)雜的低層視覺特征和高層語(yǔ)義特征,從不同的人對(duì)同一視頻語(yǔ)義的認(rèn)識(shí)存在有相當(dāng)大的差別,這樣就會(huì)導(dǎo)致關(guān)鍵詞標(biāo)注存在多義性。
(2)基于內(nèi)容的視頻檢索?;趦?nèi)容的視頻檢索(Content Based Video Retrieval,CBVR)是指利用對(duì)視頻數(shù)據(jù)從低層到高層的處理、分析和理解等手段獲得視頻內(nèi)容,并根據(jù)視頻數(shù)據(jù)中的場(chǎng)景、幀、鏡頭和運(yùn)動(dòng)對(duì)象和圖像數(shù)據(jù)中的顏色、形狀、紋理等特征在大規(guī)模數(shù)據(jù)庫(kù)中找到滿足特定的視覺特征描述的圖像的過(guò)程。它需要利用圖像處理、模式識(shí)別、計(jì)算機(jī)視覺、圖像理解、信息檢索、數(shù)據(jù)挖掘、認(rèn)知科學(xué)、人工智能、人機(jī)交互等領(lǐng)域的相關(guān)研究成果。
3.視頻內(nèi)容檢索的幾個(gè)基本詞概念及特點(diǎn)(1)視頻內(nèi)容檢索的幾個(gè)基本詞的概念。
①幀。幀指代一副靜態(tài)圖像,是構(gòu)成視頻的最小視覺單位。