亚洲av无码专区色爱天堂老鸭 ,97久人人做人人妻人人玩精品,无码熟妇人妻AV影音先锋,日韩一区精品视频一区二区

  • 用戶名
  • 密碼
  • 產(chǎn)品
供應(yīng)
求購
公司
資訊
展會
評論訪談專題話題印搜動態(tài)
國內(nèi)國際環(huán)保視頻產(chǎn)品導(dǎo)購
活動展會設(shè)備印品世界
行業(yè)動態(tài)企業(yè)動態(tài)營銷電子商務(wù)政策法規(guī)統(tǒng)計商機
印前印中印后包裝器材耗材油墨
膠印數(shù)碼標簽CTP紙箱創(chuàng)意絲印柔印其他
展會專題企業(yè)專題資訊專題技術(shù)專題
文化人物社會
展會預(yù)告會議預(yù)告展會資訊國內(nèi)展會國際展會推薦展會
印刷包裝絲印
印刷包裝絲印
印刷包裝絲印
您當前位置: CPP114首頁> 正文

印刷體文字的識別研究方法分類介紹

2010-12-06 15:17 來源:中國中部印刷網(wǎng) 責編:江佳

摘要:
 識別方法是整個系統(tǒng)的核心。用于漢字識別的模式識別方法可以大致分為結(jié)構(gòu)模式識別、統(tǒng)計模式識別及兩者的結(jié)合。下面分別進行介紹。
   【CPP114】訊:識別方法是整個系統(tǒng)的核心。用于漢字識別的模式識別方法可以大致分為結(jié)構(gòu)模式識別、統(tǒng)計模式識別及兩者的結(jié)合。下面分別進行介紹。

  結(jié)構(gòu)模式識別

  漢字是一種特殊的模式,其結(jié)構(gòu)雖然比較復(fù)雜,但具有相當嚴格的規(guī)律性。換言之,漢字圖形含有豐富的結(jié)構(gòu)信息,可以設(shè)法提取含有這種信息的結(jié)構(gòu)特征及其組字規(guī)律,作為識別漢字的依據(jù),這就是結(jié)構(gòu)模式識別。

  結(jié)構(gòu)模式識別是早期漢字識別研究的主要方法。其主要出發(fā)點是漢字的組成結(jié)構(gòu)。從漢字的構(gòu)成上講,漢字是由筆劃(點橫豎撇捺等)、偏旁部首構(gòu)成的;還可以認為漢字是由更小的結(jié)構(gòu)基元構(gòu)成的。由這些結(jié)構(gòu)基元及其相互關(guān)系完全可以精確地對漢字加以描述,就像一篇文章由單字、詞、短語和句子按語法規(guī)律所組成一樣。所以這種方法也叫句法模式識別。識別時,利用上述結(jié)構(gòu)信息及句法分析的方法進行識別,類似一個邏輯推理器。

  用這種方法來描述漢字字形結(jié)構(gòu)在理論上是比較恰當?shù),其主要?yōu)點在于對字體變化的適應(yīng)性強,區(qū)分相似字能力強;但是,在實際應(yīng)用中,面臨的主要問題是抗干擾能力差,因為在實際得到的文本圖象中存在著各種干擾,如傾斜,扭曲,斷裂,粘連,紙張上的污點,對比度差等等。這些因素直接影響到結(jié)構(gòu)基元的提取,假如結(jié)構(gòu)基元不能準確地得到,后面的推理過程就成了無源之水。此外結(jié)構(gòu)模式識別的描述比較復(fù)雜,匹配過程的復(fù)雜度因而也較高。所以在印刷體漢字識別領(lǐng)域中,純結(jié)構(gòu)模式識別方法已經(jīng)逐漸衰落,句法識別的方法正日益受到挑戰(zhàn)。

  統(tǒng)計模式識別

  統(tǒng)計決策論發(fā)展較早,理論也較成熟。其要點是提取待識別模式的的一組統(tǒng)計特征,然后按照一定準則所確定的決策函數(shù)進行分類判決。

  漢字的統(tǒng)計模式識別是將字符點陣看作一個整體,其所用的特征是從這個整體上經(jīng)過大量的統(tǒng)計而得到的。統(tǒng)計特征的特點是抗干擾性強,匹配與分類的算法簡單,易于實現(xiàn)。不足之處在于細分能力較弱,區(qū)分相似字的能力差一些。常見的統(tǒng)計模式識別方法有:

  (1) 模板匹配。模板匹配并不需要特征提取過程。字符的圖象直接作為特征,與字典中的模板相比,相似度最高的模板類即為識別結(jié)果。這種方法簡單易行,可以并行處理;但是一個模板只能識別同樣大小、同種字體的字符,對于傾斜、筆劃變粗變細均無良好的適應(yīng)能力。

  (2)利用變換特征的方法。對字符圖象進行二進制變換(如Walsh, Hardama變換)或更復(fù)雜的變換(如Karhunen-Loeve, Fourier,Cosine,Slant變換等),變換后的特征的維數(shù)大大降低。但是這些變換不是旋轉(zhuǎn)不變的,因此對于傾斜變形的字符的識別會有較大的偏差。二進制變換的計算雖然簡單,但變換后的特征沒有明顯的物理意義。K-L變換雖然從最小均方誤差角度來說是最佳的,但是運算量太大,難以實用?傊,變換特征的運算復(fù)雜度較高。

  (3)投影直方圖法。利用字符圖象在水平及垂直方向的投影作為特征。該方法對傾斜旋轉(zhuǎn)非常敏感,細分能力差。

  (4)幾何矩(Geometric Moment)特征。M. K. Hu提出利用矩不變量作為特征的想法,引起了研究矩的熱潮。研究人員又確定了數(shù)十個移不變、比例不變的矩。我們都希望找到穩(wěn)定可靠的、對各種干擾適應(yīng)能力很強的特征,在幾何矩方面的研究正反映了這一愿望。以上所涉及到的幾何矩均在線性變換下保持不變。但在實際環(huán)境中,很難保證線性變換這一前提條件。

  (5)Spline曲線近似與傅立葉描繪子(Fourier Descriptor)。兩種方法都是針對字符圖象輪廓的。Spline曲線近似是在輪廓上找到曲率大的折點,利用Spline曲線來近似相鄰折點之間的輪廓線。而傅立葉描繪子則是利用傅立葉函數(shù)模擬封閉的輪廓線,將傅立葉函數(shù)的各個系數(shù)作為特征的。前者對于旋轉(zhuǎn)很敏感。后者對于輪廓線不封閉的字符圖象不適用,因此很難用于筆劃斷裂的字符的識別。

  (6)筆劃密度特征。筆劃密度的描述有許多種,這里采用如下定義:字符圖象某一特定范圍的筆劃密度是在該范圍內(nèi),以固定掃描次數(shù)沿水平、垂直或?qū)蔷方向掃描時的穿透次數(shù)。這種特征描述了漢字的各部分筆劃的疏密程度,提供了比較完整的信息。在圖象質(zhì)量可以保證的情況下,這種特征相當穩(wěn)定。在脫機手寫體的識別中也經(jīng)常用到這種特征。但是在字符內(nèi)部筆劃粘連時誤差較大。

  (7)外圍特征。漢字的輪廓包含了豐富的特征,即使在字符內(nèi)部筆劃粘連的情況下,輪廓部分的信息也還是比較完整的。這種特征非常適合于作為粗分類的特征。

  (8)基于微結(jié)構(gòu)特征的方法。這種方法的出發(fā)點在于,漢字是由筆劃組成的,而筆劃是由一定方向,一定位置關(guān)系與長寬比的矩形段組成的。這些矩形段則稱為微結(jié)構(gòu)。利用微結(jié)構(gòu)及微結(jié)構(gòu)之間的關(guān)系組成的特征對漢字進行識別,尤其是對于多體漢字的識別,獲得了良好的效果。其不足之處是,在內(nèi)部筆劃粘連時,微結(jié)構(gòu)的提取會遇到困難。
分享到: 下一篇:2011年中國印工協(xié)重要活動信息發(fā)布
  • 【我要印】印刷廠與需方印務(wù)對接,海量印刷訂單供您任意選擇。
  • 【cpp114】印刷機械、零配件供求信息對接,讓客戶方便找到您。
  • 【我的耗材】采購低于市場價5%-20%的印刷耗材,為您節(jié)省成本。
  • 【印東印西】全國領(lǐng)先的印刷品網(wǎng)上采購商城,讓印刷不花錢。