
一、原始憑證真實性識別現(xiàn)狀
會計原始憑證的基本要求就是真實。在手工會計條件下,會計人員根據(jù)原始憑證編制記賬憑證,根據(jù)記賬憑證登記明細(xì)賬和總賬,期未根據(jù)賬簿編制會計報表。審計人員通過調(diào)閱紙面信息,加上自己的經(jīng)驗判斷,審計線索十分清楚。然而,在會計信息化工作方式下,紙面信息變成了磁性介質(zhì)上的代碼。在網(wǎng)絡(luò)經(jīng)營條件下,企業(yè)內(nèi)部業(yè)務(wù)的審計線索也發(fā)生了質(zhì)的變化。不僅記錄業(yè)務(wù)的內(nèi)部原始單據(jù),如領(lǐng)料單、入庫單、驗收單等原始憑證將變?yōu)殡姶呕男畔?,而且計算機(jī)信息系統(tǒng)根據(jù)確認(rèn)的經(jīng)濟(jì)業(yè)務(wù)自動編制記賬憑證、登記賬薄、編制報表,實現(xiàn)財會核算自動化。這個轉(zhuǎn)變過程中潛伏的一大問題就是絕大多數(shù)的會計核算軟件并沒有解決對會計事項,即記賬憑證所根據(jù)的原始數(shù)據(jù)是否真實這一至關(guān)重要的問題。一旦憑證轉(zhuǎn)化成電子數(shù)據(jù)輸入計算機(jī),后續(xù)所有工作都建立在這樣一個假設(shè)下。但當(dāng)前的會計電算化并不能有效地防止做假賬和會計信息失真的問題。電算化會計賬表審計的前提是:必須保證電子數(shù)據(jù)的“原始性”,即電子數(shù)據(jù)是真實、可靠的,可以作為有效數(shù)據(jù)來進(jìn)行審計。否則,信息化會計賬表審計就失去意義。在財務(wù)信息化過程中,原始憑證真實性問題會嚴(yán)重影響到財務(wù)報表質(zhì)量。因此,本文試圖將圖像檢索技術(shù)應(yīng)用于識別虛假原始憑證,在財務(wù)處理軟件中增加新的應(yīng)用解決原始憑證真實性識別問題,并給出構(gòu)建該應(yīng)用的技術(shù)難點與實現(xiàn)框架,以期達(dá)到提高審計質(zhì)量,將會計信息失真程度控制到最低。
二、圖像檢索技術(shù)識別虛假原始憑證的可行性分析
財務(wù)人員雖然在長期的實踐中積累了大量的識別憑證真?zhèn)蔚慕?jīng)驗,這些經(jīng)驗的積累需要較長時間的實踐,且難以精確、客觀描述,不利于在行業(yè)人員中開展培訓(xùn)、推廣及使用,風(fēng)險較高。而圖像檢索技術(shù)是近年來隨著多媒體信息爆炸式增長,為了滿足人們快速準(zhǔn)確找到自己所需圖像的一種技術(shù),也是當(dāng)前計算機(jī)領(lǐng)域的研究熱點之一。它利用圖像的物理屬性,如顏色、形狀、紋理、區(qū)域等在圖像數(shù)據(jù)庫中尋找與目標(biāo)圖像相關(guān)或者相似的圖像,稱為基于內(nèi)容的圖像檢索(Content-Based Image Retrieval CBIR),是目前圖像檢索的有效方法之一。原始憑證被掃描進(jìn)電腦,以圖像格式存儲。根據(jù)審計人員經(jīng)驗,把偽造特征轉(zhuǎn)化成數(shù)字圖像特征描述,如文字色差、數(shù)字位置、對模糊重影、印章和票據(jù)用紙由于用稀釋劑泡過而明顯變淺的,字體大小或字形異樣的,復(fù)寫印跡背后深淺度異樣等特征,作為目標(biāo)圖像。待識別票據(jù)或者憑證的特征可與之進(jìn)行匹配,按照相似度做出真?zhèn)巫R別是完全可行的。加入該項應(yīng)用后,在利用財務(wù)軟件進(jìn)行審計時,使用人員可以直接調(diào)出某筆業(yè)務(wù)的原始憑證圖像,由系統(tǒng)進(jìn)行識別,從而提高了工作效率。
三、圖像檢索技術(shù)識別虛假原始憑證的技術(shù)難點
雖然運用圖像檢索技術(shù)可有效識別虛假原始憑證,但其也存在技術(shù)難點,主要有:一是票面污損、破損、折疊、紙質(zhì)磨損等問題會直接影響掃描進(jìn)計算機(jī)中的圖像質(zhì)量,給后續(xù)識別帶來難度,需要綜合運用圖像降噪、增強(qiáng)、恢復(fù)等技術(shù),消除影響,提高識別率;二是票面不同區(qū)域的智能分割。識別真假票據(jù)的前提是提取其中的有效信息,如時間、科目、金額、印章等。這些信息存在于票面的不同區(qū)域,由于發(fā)票尺寸、形狀的不同,需要一種智能識別技術(shù),能夠動態(tài)、自適應(yīng)地分割不同區(qū)域,為進(jìn)一步提取有效信息做準(zhǔn)備;三是OCR與現(xiàn)有系統(tǒng)的融合。OCR已經(jīng)在實踐中獲得了廣泛的應(yīng)用,為避免重復(fù)開發(fā),提高開發(fā)效率,可以直接將該技術(shù)應(yīng)用于票據(jù)內(nèi)文字以及阿拉伯?dāng)?shù)字的識別,如何將其集成到現(xiàn)有系統(tǒng)中,構(gòu)造合適的應(yīng)用接口至關(guān)重要;四是如何結(jié)合審計人員實踐經(jīng)驗,利用圖像檢索技術(shù)提取相應(yīng)票據(jù)特征,尤其是容易被涂改、造假的部位的細(xì)部特征,進(jìn)行真假識別。
四、虛假原始憑證識別系統(tǒng)軟件框架的提出
考慮運用圖像檢索技術(shù)識別虛假原始憑證識別的技術(shù)難點,筆者擬提出虛假憑證識別系統(tǒng)軟件框架。軟件主要由兩部分組成:偽造憑證特征庫與憑證識別過程?;玖鞒倘缦拢菏紫龋杉罅刻摷僭紤{證樣本,掃描進(jìn)電腦,以圖像形式存儲在圖像數(shù)據(jù)庫中,根據(jù)審計人員識別經(jīng)驗,將其中存在偽造的局部特征轉(zhuǎn)化成圖像特征描述。其次,使用各種距離度量算法與偽造特征庫特征進(jìn)行距離比較,如歐氏距離計算二者差別大小,對明顯超出閾值范圍或者某一強(qiáng)制性指標(biāo)有差異的憑證則認(rèn)定為偽造,可以繼續(xù)結(jié)合人工審計確認(rèn)。如果出現(xiàn)了新的偽造特征,還可以對偽造特征數(shù)據(jù)庫及時進(jìn)行更新,以適應(yīng)實際變化。這種原始憑證的處理方法充分利用審計人員長期積累的經(jīng)驗。同時,以電子手段保存原始憑證,有利于進(jìn)一步開展審計工作,從客觀上杜絕各類虛假憑證犯罪。系統(tǒng)實現(xiàn)的關(guān)鍵技術(shù)是:利用直方圖均衡化技術(shù)與拉普拉斯濾波實現(xiàn)圖像增強(qiáng),維納濾波技術(shù)對票據(jù)圖像進(jìn)行降噪處理,經(jīng)過這些預(yù)處理手段后,掃描進(jìn)計算機(jī)的票據(jù)圖像將更加干凈、整潔、規(guī)范,有利于進(jìn)一步提取各種特征信息;利用Hough變換檢測票據(jù)中的垂直與水平線條,從而確定關(guān)鍵信息的空間分布區(qū)域;對獲取的目標(biāo)區(qū)域進(jìn)行OCR識別,獲得其中的文字、阿拉伯?dāng)?shù)字信息;根據(jù)審計人員識別虛假票據(jù)的經(jīng)驗,對獲取的目標(biāo)區(qū)域提取顏色、紋理、線條等特征,從而識別字跡的模糊重影、線條粗細(xì)不均、書寫出格,字體大小或字形異樣以及票據(jù)背面復(fù)寫印跡深淺度等各種可能存在的問題。對一張票據(jù)建立起文字、數(shù)字、書寫特征三個角度的描述,為后續(xù)識別奠定基礎(chǔ)。