
一、原始憑證真實性識別現狀
會計原始憑證的基本要求就是真實。在手工會計條件下,會計人員根據原始憑證編制記賬憑證,根據記賬憑證登記明細賬和總賬,期未根據賬簿編制會計報表。審計人員通過調閱紙面信息,加上自己的經驗判斷,審計線索十分清楚。然而,在會計信息化工作方式下,紙面信息變成了磁性介質上的代碼。在網絡經營條件下,企業內部業務的審計線索也發生了質的變化。不僅記錄業務的內部原始單據,如領料單、入庫單、驗收單等原始憑證將變為電磁化的信息,而且計算機信息系統根據確認的經濟業務自動編制記賬憑證、登記賬薄、編制報表,實現財會核算自動化。這個轉變過程中潛伏的一大問題就是絕大多數的會計核算軟件并沒有解決對會計事項,即記賬憑證所根據的原始數據是否真實這一至關重要的問題。一旦憑證轉化成電子數據輸入計算機,后續所有工作都建立在這樣一個假設下。但當前的會計電算化并不能有效地防止做假賬和會計信息失真的問題。電算化會計賬表審計的前提是:必須保證電子數據的“原始性”,即電子數據是真實、可靠的,可以作為有效數據來進行審計。否則,信息化會計賬表審計就失去意義。在財務信息化過程中,原始憑證真實性問題會嚴重影響到財務報表質量。因此,本文試圖將圖像檢索技術應用于識別虛假原始憑證,在財務處理軟件中增加新的應用解決原始憑證真實性識別問題,并給出構建該應用的技術難點與實現框架,以期達到提高審計質量,將會計信息失真程度控制到最低。
二、圖像檢索技術識別虛假原始憑證的可行性分析
財務人員雖然在長期的實踐中積累了大量的識別憑證真偽的經驗,這些經驗的積累需要較長時間的實踐,且難以精確、客觀描述,不利于在行業人員中開展培訓、推廣及使用,風險較高。而圖像檢索技術是近年來隨著多媒體信息爆炸式增長,為了滿足人們快速準確找到自己所需圖像的一種技術,也是當前計算機領域的研究熱點之一。它利用圖像的物理屬性,如顏色、形狀、紋理、區域等在圖像數據庫中尋找與目標圖像相關或者相似的圖像,稱為基于內容的圖像檢索(Content-Based Image Retrieval CBIR),是目前圖像檢索的有效方法之一。原始憑證被掃描進電腦,以圖像格式存儲。根據審計人員經驗,把偽造特征轉化成數字圖像特征描述,如文字色差、數字位置、對模糊重影、印章和票據用紙由于用稀釋劑泡過而明顯變淺的,字體大小或字形異樣的,復寫印跡背后深淺度異樣等特征,作為目標圖像。待識別票據或者憑證的特征可與之進行匹配,按照相似度做出真偽識別是完全可行的。加入該項應用后,在利用財務軟件進行審計時,使用人員可以直接調出某筆業務的原始憑證圖像,由系統進行識別,從而提高了工作效率。
三、圖像檢索技術識別虛假原始憑證的技術難點
雖然運用圖像檢索技術可有效識別虛假原始憑證,但其也存在技術難點,主要有:一是票面污損、破損、折疊、紙質磨損等問題會直接影響掃描進計算機中的圖像質量,給后續識別帶來難度,需要綜合運用圖像降噪、增強、恢復等技術,消除影響,提高識別率;二是票面不同區域的智能分割。識別真假票據的前提是提取其中的有效信息,如時間、科目、金額、印章等。這些信息存在于票面的不同區域,由于發票尺寸、形狀的不同,需要一種智能識別技術,能夠動態、自適應地分割不同區域,為進一步提取有效信息做準備;三是OCR與現有系統的融合。OCR已經在實踐中獲得了廣泛的應用,為避免重復開發,提高開發效率,可以直接將該技術應用于票據內文字以及阿拉伯數字的識別,如何將其集成到現有系統中,構造合適的應用接口至關重要;四是如何結合審計人員實踐經驗,利用圖像檢索技術提取相應票據特征,尤其是容易被涂改、造假的部位的細部特征,進行真假識別。
四、虛假原始憑證識別系統軟件框架的提出
考慮運用圖像檢索技術識別虛假原始憑證識別的技術難點,筆者擬提出虛假憑證識別系統軟件框架。軟件主要由兩部分組成:偽造憑證特征庫與憑證識別過程。基本流程如下:首先,采集大量虛假原始憑證樣本,掃描進電腦,以圖像形式存儲在圖像數據庫中,根據審計人員識別經驗,將其中存在偽造的局部特征轉化成圖像特征描述。其次,使用各種距離度量算法與偽造特征庫特征進行距離比較,如歐氏距離計算二者差別大小,對明顯超出閾值范圍或者某一強制性指標有差異的憑證則認定為偽造,可以繼續結合人工審計確認。如果出現了新的偽造特征,還可以對偽造特征數據庫及時進行更新,以適應實際變化。這種原始憑證的處理方法充分利用審計人員長期積累的經驗。同時,以電子手段保存原始憑證,有利于進一步開展審計工作,從客觀上杜絕各類虛假憑證犯罪。系統實現的關鍵技術是:利用直方圖均衡化技術與拉普拉斯濾波實現圖像增強,維納濾波技術對票據圖像進行降噪處理,經過這些預處理手段后,掃描進計算機的票據圖像將更加干凈、整潔、規范,有利于進一步提取各種特征信息;利用Hough變換檢測票據中的垂直與水平線條,從而確定關鍵信息的空間分布區域;對獲取的目標區域進行OCR識別,獲得其中的文字、阿拉伯數字信息;根據審計人員識別虛假票據的經驗,對獲取的目標區域提取顏色、紋理、線條等特征,從而識別字跡的模糊重影、線條粗細不均、書寫出格,字體大小或字形異樣以及票據背面復寫印跡深淺度等各種可能存在的問題。對一張票據建立起文字、數字、書寫特征三個角度的描述,為后續識別奠定基礎。