- 相關推薦
基于顏色特征的藏毯圖像檢索研究與實現
摘要:針對國內外還沒有可供研究人員和公眾使用的藏毯類非物質文化遺產數字化資源平臺這一狀況,分析了在藏毯圖像中運用基于內容的圖像檢索系統技術的可行性。通過對藏毯圖像的顏色特征分析,針對傳統HSV顏色空間量化的缺陷,使量化更為有效,把HSV顏色空間量化成188維,實現了在基于JAVA的框架中計算顏色直方圖的方法,采用相似距離衡量直方圖的相似度。考慮時間消耗并通過查準率的比較,藏毯圖像檢索的查準率明顯提高。
關鍵詞:藏毯;量化;特征;圖像
引言
藏毯在藏族傳統藝術的基礎上,吸收、融合了漢族、國外宗教藝人的精華,并且形成了具有自己獨特的藏族藝術風格的工藝美術品,其圖案設計和色彩源于藏傳佛教文化,藝術價值極高,是珍貴的非物質文化遺產。隨著近年來非物質文化遺產保護工作的不斷深入,以及非物質文化遺產數字化、信息化的科技進步,全國各地非物質文化遺產數據庫建設步伐不斷加快,在分析藏毯的紋理特征、色彩分布和形狀特征的基礎上,即可以支持基于文字以及圖像屬性的查詢,又可以提取藏毯圖像的關鍵特征值來實現基于內容的圖像檢索。本文在研究基于內容的圖像檢索方法的基礎上,經過改進,提出了一種針對藏毯圖像基于HSV顏色空間量化的圖像檢索實現方法,為藏毯這一非物質文化遺產的保護和繼承提供了技術支撐平臺。
一、基于內容的圖像檢索方法
傳統的基于文本的圖像檢索技術,主要利用數據庫管理系統對圖像采用人工描述并進行管理和檢索,通過圖像的描述文字和用戶輸入的關鍵字進行比較,但由于人工標注效率低和自身的主觀偏差性,比較的結果不僅效果差,而且不能對圖像中所包含的顏色、紋理等不能用文本信息標注的特征進行檢索。基于內容的圖像檢索(Content-Based ImageRetrieval,CBIR)近年來已成為提高圖像檢索的有效手段。基于CBIR技術的圖像檢索系統,采用相似性匹配算法計算關鍵圖像特征與特征庫中圖像特征的相似度,然后按照相似度從大到小的順序將匹配圖像反饋給用戶。用戶可根據自己的滿意程度,選擇是否修改查詢條件,繼續查詢,以達到令人滿意的查詢。CBIR的實現依賴于兩個關鍵技術:圖像特征提取和匹配,圖像特征提取分為低層視覺和語義內容,比較成熟的檢索算法大部分是基于圖像的低層特征,即利用圖像的顏色、紋理、形狀、空間關系特征來檢索。在基于內容的圖像檢索中,顏色作為圖像的重要視覺信息已成為圖像內容組成的基本要素,顏色特征成為在基于內容的圖像檢索中最早、最廣泛使用的視覺特征,目前常用的顏色特征包括顏色直方圖、顏色距、顏色聚合向量、顏色協方差矩陣等。紋理是物體表面的結構模式,反映了圖像中同質現象的視覺特征,它體現了物體表面的具有緩慢變化或者周期性變化的表面結構組織排列屬性,其本質是刻畫像素的鄰域灰度空間分布規律,典型的分析方法有:空間域紋理分析、頻率域紋理分析、空間/頻率域聯合紋理分析和基于分形模型的紋理分析方法。對于某些紋理和顏色信息不夠豐富的圖像來說,基于顏色和紋理的方法就無法滿足檢索需要,這是可借助于形狀特征來描述,形狀是最難描述的圖像特征,它不隨周圍環境,如顏色的變化而變化,是物體的穩定特征。基于形狀特征的圖像檢索主要是檢測或分割出目標輪廓,并針對其進行形狀特征的提取或直接針對圖像尋找適當的矢量特征,目前基于形狀特征的圖像檢索主要有基于輪廓和基于區域的方法。空間關系指圖像中分割出來的多個目標之間相互的空間位置或相對方向關系,通常分為兩類:相對空間位置信息和絕對空間位置信息。提取圖像空間關系特征有兩種方法:一種方法是對圖像進行自動分割,根據劃分出的對象或顏色區域提取圖像特征,并建立索引;另一種方法是簡單將圖像均勻地劃分為若干規則區域后分別提取特征,并建立索引。
二、顏色特征
顏色是彩色圖像最底層、最直觀的物理特征,是一種全局特征,它描述了圖像或圖像區域所對應的景物的表面性質。作為圖像最直觀而明顯的特征,顏色特征是基于像素點的特征,所有屬于圖像或圖像區域的像素都有各自的貢獻。相對于其它的圖像特征如紋理和形狀來講,顏色特征非常穩定,不局限于圖像的大小和方向,并且對于旋轉、平移、尺度變化,甚至各種變形都不敏感,表現出相當強的魯棒性,因此在基于內容的圖像檢索中發揮著重要的作用,這也使得顏色特征成為圖像檢索中應用最為廣泛的底層視覺特征。
2.1 顏色模型
顏色空間也稱彩色模型, 它的用途是在某些標準下用通常可接受的方式對彩色加以說明。本質上,彩色模型是坐標系統和子空間的闡述。RGB色彩模式是工業界的一種顏色標準,在RGB模型中,RGB即是代表紅、綠、藍三個通道的顏色,通過對紅(R)、綠(G)、藍(B)三個顏色通道的變化以及它們相互之間的疊加來構成了所有顏色,是目前運用最廣的顏色系統之一。將這三種顏色劃分成256(0-255)個等級,這三原色光以不同的比例復合后,對人的眼睛可以形成與各種頻率的可見光等效的色覺。目前大部分的數字圖像都是用這種顏色空間表達的,然而,RGB空間結構并不符合人們對顏色相似性的主觀判斷,故而采用符合人們對顏色主觀認識的HSV模型。HSV(hue,saturation,value)模型對用戶來說是一種直觀的顏色模型,直接對應于人眼的視覺特征,H表示色度、S表示飽和度、V表示亮度。HSV模型對應于一個圓錐形子集,包含RGB模型中的R、G、B三個面。色度H定義為繞圓錐中心軸的角度,取值范圍為0°~ 360°,從紅色開始按逆時針方向計算,紅色為0°,綠色為120°,藍色為240°。飽和度S定義為橫截面圓心到橫截面圓周點的距離,取值范圍為0~1,S取值越大,表示色彩越純,取值越小,表示色彩越灰。亮度V定義為圓錐橫截面的圓心到圓錐頂點的距離,表示色彩的明亮程度,取值范圍為0~1。HSV對用戶來說是一種直觀的顏色模型。我們可以從一種純色彩開始,即指定色彩角H,并讓V=S=l,然后我們可以通過向其中加入黑色和白色來得到我們需要的顏色。
2.2 顏色特征提取
常用的顏色特征提取方法都建立在顏色直方圖的基礎上,計算顏色直方圖需要將顏色空間劃分成若干個小的顏色區間,每個小區間成為直方圖的一個bin。然后統計圖像中各種顏色出現的頻數,在統計的過程中不關心顏色所處的空間位置,每一種顏色出現的頻數對應在相應的bin中,最終得到顏色直方圖。在顏色直方圖坐標中,橫坐標表示顏色柄的劃分值,縱坐標表示每個bin區間中包含的圖像像素總和。一般來說,bin的數目越多,直方圖對顏色的分辨能力就越強,檢索效果也會越強。但有時bin數目越多的顏色空間劃分方法不一定能夠提高檢索效果,那是因為在有的實際應用中,表示主要顏色的bin能夠表達圖像中大部分像素的顏色,所以,過多的顏色空間對主體顏色的貢獻較少,反而加大了計算負擔。除此之外,bin的數目增加后的顏色直方圖即增加了計算負擔,又不利于在大型圖像庫中建立索引,同時也帶來了數據庫中存儲空間的容量問題。直方圖均衡主要用于處理圖像由于過度曝光或者曝光不足造成的前景背景過量或過暗的情況,可以增強圖像的對比度,擴展圖像灰度范圍。本文結合藏毯圖像的顏色特點,在劃分合適數量的顏色空間基礎上實現顏色特征的提取,最終提高圖像的檢索效果。
三、傳統的HSV顏色空間非均勻量化
HSV的顏色空間包含三個分量:H、S、V,對H、S、V三個分量進行非均勻分割。將色調H分成8份,飽和度S的范圍由圓心向圓周過渡,將其分為三份,亮度V劃分為Black,Gray,White三份,各自量化區間為:
HSV顏色空間被劃分為72個不同的空間區域,再將三個簡化后的顏色分量合成一維特征向量值,就將整個HSV顏色空間量化為72種顏色,減少了HSV顏色空間的有效顏色數量,簡化了顏色特征提取的復雜度。通過量化公式I=9H+3S+V計算,最終得到72柄的一維顏色直方圖,I的取值范圍為[0,71]。
四、一種改進的HSV顏色空間量化方法
4.1 HSV顏色空間188維量化
通常而言,在圖像的生成、傳輸、變換過程中,由于受到噪聲的干擾,會導致圖像輸出質量失真,影響對于圖像的識別,因此在圖像識別之前要對其進行預處理。藏毯圖案較鮮艷且復雜,考慮到藏毯圖像顏色特征在整個空間中的分布狀況,采用顏色量化中的聚類方法,用少量的代表色代表整個藏毯圖像。雖然采用比較大維的量化可以提高檢索效果,但考慮到計算量和存儲容量的限制問題,所以使用量化降維方法。為了避免出現某些空間中像素數量非常稀疏的情況,使量化更為有效,把HSV顏色空間量化成188維,根據圖像顏色在HSV空間188維中的相同或不同的分布特點,均勻地選取若干個量化點,然后將其他量化點按顏色相似距離最短的原則組合為一個聚類,從而達到既能聚類出代表圖像的顏色又能減少顏色數目的目的。具體處理方法為:
在實驗中提取圖像中每一個像素點的RGB值并轉化為HSV顏色空間后,簡單聚類如下:
H:H空間分為45類,取值為0~44,h均勻間隔為8,即h=(0,8,16,……,360),
S:S空間分為4類,S取值為0~3,S均勻間隔步距0.3(0.07,0.37, 0.67, 0.97),
V:V空間分為4類,V取值為0~3,V均勻間隔步距0.3(0,0.3,0.6,0.9),
然后按照以上的量化級構造一維特征矢量,把3個顏色分量合成一維特征矢量:L=4H+3S+V,這樣,H、S、V3個分量在一維矢量上分布開來.根據上述公式,計算L的取
值范圍為[0, 187],最終獲得188柄的一維直方圖。
4.2 在Java EE框架下利用OpenCV對藏毯圖像實現相似度的檢索
對188柄的一維直方圖的計算過程,通過Opencv的calcHist()方法計算出圖像的顏色直方圖。
h_bins=45,s_bins=4;
hist_size[]={h_bins,s_bins};
h_ranges[]={0, 180};
s_ranges[]={0, 255};
Ipllmage* src=cvLoadlmage ("image");
Ipllmage* hsv=cvCreateImage(cvGetSize(src),8,3); ;
Ipllmage* h_plane=cvCreateImage(cvGetSize(src),8,1);
Ipllmage* s_plane=cvCreateImage(cvGetSize(src),8,1);
Ipllmage* v_plane=cvCreateImage(cvGetSize(src),8,1);
pllmage* planes[]={h_plane, s_plane};
float* ranges[]={h_ranges, s_ranges};
float* ranges[]={h_ranges, s_ranges, v_ranges};
cvCvtColor(src, hsv, CV_BGR2HSV);
cvCvtPixToPlane(hsv, h_plane, s_plane, v_plane, 0);
CvHistogram * hist=cvCreateHist(2, hist_size, CV_HIST_ARRAY, ranges,2)
cvCalcHist(planes, hist,0,0);
cvGetMinMaxHistValue(hist,0,&max_value,0,0);
int height=120;
int width=(h_bins*s_bins*v_bins*5);
IplImage*hist_img=cvCreateImage(cvSize(width, height),8,3);
cvZero(hist_img);
在OpenCV庫中調用cvcompareHIst()方法計算顏色特征向量相似度,經過試驗,發現用此方法使用直方圖模型比對兩張藏毯圖像圖片,比對的結果越接近于1,兩張圖片的相似性就越高。具體方法如下:
Double compareHist(const CvHistoram* histl, const CvHistoram* hist2, CV_COMP_CORREL Correlation)
4.3 實驗結果
綜合以上查準結果并結合時間消耗、存儲空間和計算量的大小,說明采用188維量化方法的檢索查準率較高,并且時間消耗也不大,故本文提出改進的方法較為可行。
五、結語
通過對藏毯圖像的顏色特征分析,各種典型的基于顏色特征的提取技術,分析了在藏毯圖像中運用基于內容的圖像檢索系統技術的可行性。針對傳統HSV顏色空間量化的缺陷,使量化更為有效,把HSV顏色空間量化成188維,實現了在基于JAVA的框架中計算顏色直方圖的方法,采用Correlation相似距離衡量直方圖的相似度,根據相似度大小匹配待查詢的圖像,最終返回與待查詢藏毯圖像相同或相似的圖像結果集,藏毯圖像檢索的查全率與查準率明顯提高,為非物質文化遺產的保護和繼承提供了技術支撐平臺。
【基于顏色特征的藏毯圖像檢索研究與實現】相關文章:
舞蹈藝術的特征研究10-26
基于minigui的網真機界面的實現08-05
基于戰略治理的企業環境風險研究08-28
電影色彩藝術的美學特征研究論文08-21
基于BP網遙感影像分類研究與應用08-10
基于軍網的雷達遠程診斷技術研究08-10
基于web的異地并行設計與制造系統研究06-02
基于知網的翻譯研究方向碩士畢業論文寫作06-25
基于價值網的企業集群式供給鏈治理模式研究04-28