視頻幀中的文本檢測與提取技術
隨著計算機和通信技術、寬帶網絡技術、音視頻壓縮技術以及計算機硬件技術的發展,圖像和視頻中的文本信息對索引、檢索及高層語義的自動理解等具有重要價值。本文主要研究如何從視頻幀中檢測、提取與識別人工添加的文本信息。論文的主要工作如下: 首先,根據文本的特征以及目前存在視頻圖像的文本定位和提取算法,實現了一種基于邊緣檢測的文本定位方法。實現主要流程包括:對選取的視頻幀圖像進行灰度化處理、邊緣檢測、邊緣圖像二值化及數學形態學操作,最后定位文本區域。實驗表明該方法實現簡單,并且可以定位出大部分的文本區域,但當圖像或視頻幀中背景本身包含了豐富的邊緣信息時,則定位文本區域就不夠準確。 其次,對定位好的文本區域進行提取與識別,本文應用基于閾值分割方法來提取文本。在處理簡單或者單一背景色的文字圖像時,使用經典的閾值分割算法中的最大類間方差法(OTSU),該方法計算簡單、穩定有效。在復雜背景下提取文字時,本文使用了局部自適應的閾值化方法。經過實驗測試,得到了很好的分割效果。 最后,對提取出的文本進行去噪聲等處理,最大限度地去除文本的背景,為OCR識別系統提供完整清晰的二值輸入文本圖像。經“尚書七號”文字識別軟件對文本圖像進行識別后,結果證明文字的正確識別率能達到80%左右。
【視頻幀中的文本檢測與提取技術】相關文章:
實驗檢測技術在公路工程中的應用11-22
論食品檢測中紅外光譜技術的運用11-20
樁基檢測技術在高層建筑工程中的應用論文03-24
巖土工程中深基坑檢測技術的應用探究論文03-17
計算機技術在建筑材料檢測中的應用03-25
時政文本翻譯中的文化自主意識11-15
無人機檢測技術在橋梁檢測工程的應用論文03-15
文本圖像信息隱藏技術研究提綱12-04
- 相關推薦