1.組名 瀟灑不是擺爛 2.組員 黃笑然 陳佳瑤 蘇國培 劉玉婷 安游珺 3.項目名 基於模板匹配的票證識別平臺 4.項目介紹 我們的項目是基於模板匹配的票證識別平臺。隨著人工智慧技術的發展,OCR技術有了重大突破,票證管理也逐漸朝著數字化的方向發展。本票證識別平臺採用OCR識別技術,結合預置模板, ...
1.組名
瀟灑不是擺爛
2.組員
黃笑然 陳佳瑤 蘇國培 劉玉婷 安游珺
3.項目名
基於模板匹配的票證識別平臺
4.項目介紹
我們的項目是基於模板匹配的票證識別平臺。隨著人工智慧技術的發展,OCR技術有了重大突破,票證管理也逐漸朝著數字化的方向發展。本票證識別平臺採用OCR識別技術,結合預置模板,實現自動識別票證類別,並保證識別結果以統一格式進行結構化輸出,解決了票證存儲難、錄入難、管理難、效率低的問題,為數據的進一步智能管理及其分析,打下了堅實的基礎。同時本平臺支持任意固定版式卡證、票據的模板製作,用戶可以通過自定義模板來獲取想要的結構化內容,應用場景十分廣泛,可以應用於財務票據,醫療票據,卡證等,進行票證分類、關鍵內容提取、信息統計分析等等,智能識別為結構化的文本,有效降低人工錄入成本,提升信息管理效率。
5.設計過程
我們的項目表分為用戶和模板兩大部分,將用戶存在一個表中,用戶管理記錄存在一個表中;將模板存在一個表中,模板有關的欄位分別存儲三個表種,模板管理也有單獨的一個表,實現了模塊的分離。
設計最初,我們認為應該對每一個模板都建一張表,來存儲表中具體的固定欄位和參考欄位,但是在具體討論之後,發現這是一個不實際的想法,一個是會帶來很大的工作量,再一個是檢索時很不方便,於是我們更換了思路,將所有模板儲存在一個模板表中,將所有模板的固定欄位存儲在一個表中,再將所有模板的參考欄位存儲在一個表中。這樣設計後,表的數量大大減少,功能也明確了很多,檢索效率也可以大大提升。
用戶方面的表格設計也經過了很多討論。一開始我們認為沒有必要創建一個角色表來存放所有角色,而是只將角色名作為用戶表的一個屬性,但是再經過商量,還是認為要將各模塊的耦合程度降低,於是新建了一個角色表,也更加方便之後平臺的許可權管理。
6.E-R圖
全局
7.邏輯結構設計
序號 |
表名 |
功能說明 |
1 |
user |
用戶表 |
2 |
role_power |
角色表 |
3 |
template |
模板表 |
4 |
fixed_field |
固定欄位表 |
5 |
reference_field |
參考欄位表 |
6 |
identify_area |
識別區表 |
7 |
login |
登錄日誌表 |
8 |
preset_template_upload |
預置模板上傳記錄表 |
9 |
user_manage |
用戶管理表 |
10 |
template_use |
用戶使用模板記錄表 |
11 |
template_manage |
模板管理表 |
8.設計心得
- 資料庫設計要解決的第一個問題就是資料庫設計人員如何全面、準確的獲取業務需求,於是本組同學對照用例文檔再次認真進行了分析,最終確定了表的結構和屬性。
- 我們首先確定了一個單位需要有哪些數據項,再確定了哪些欄位構成一個表,最後確定表之間有什麼關係。之後我們使用實體-聯繫建模方法繪製了E-R圖,使業務需求更加精準和消除二義性。
- 我們接受了一定的數據冗餘來保證之後的運行性能,犧牲了空間但是節省了時間,比如將參考欄位和識別區分開儲存。
- 和組員們的討論過程讓我們理解到溝通的重要性,互相之間認真的分析交流可以理清思路,以便設計出更加合理的資料庫。
- 資料庫的設計完成離不開老師和學姐的指導,讓我們明白了做項目要和老師多溝通交流,及時弄懂不清晰的地方。