设为首页 | 收藏本站 | 关于我们 | 广告服务
 
 
当前位置:首页 > 中国信用卡 > 2023年12月
华夏银行首席信息官、龙盈智达(北京)科技有限公司董事长吴永飞:商业银行基于DCU技术的OCR应用研究

华夏银行首席信息官、龙盈智达(北京)科技有限公司董事长 吴永飞

  数字经济时代,以人工智能赋能数字化转型已成为金融机构提升业务能力的必由之路。计算机视觉和自然语言处理作为金融人工智能的重要方向,一直以来都是学界和业界关注的焦点。特别是

  光学符号识别(OCR),由于其横跨计算机视觉和自然语言处理两大领域,且具有广阔金融应用前景,尤为受到关注。鉴于计算机视觉和自然语言处理均需图形处理器(GPU)算力支撑,GPU技术的自主可控无疑已成为业界关注的焦点。本文立足金融应用实践,总结了实现金融OCR应用的全栈自主可控技术迁移替代路径,以期为金融行业数字化转型发展提供借鉴。

  一、OCR技术的起源与发展

  OCR技术主要用于识别文字,其工作原理是通过光学方式将纸质文档上的文字转换成点阵图像,再利用识别软件将图像中的文字转换成电子文本格式,供进一步的编辑与处理。OCR技术的主要目标是利用特征实现精准的文字识别。

  OCR技术的历史可以追溯到1929年,当时德国科学家Gustav Tausheck最先提出了OCR的概念并取得了专利,后来美国科学家Paul W.Handel也在美国获得了相应文字识别方法的专利。经过几十年的研究与实践,文字识别技术逐渐有了实际应用,早期的OCR软件通常只能识别数字和英文字母,20世纪60年代,美国IBM公司首次尝试印刷体汉字识别,20世纪70年代,日本学者也开始研究汉字识别。

  国内的OCR技术研究与应用非常活跃。自1986年以来,国内的OCR技术研究在汉字建模和识别方法上有所创新,研制和开发的很多产品被广泛应用于多个行业。现在的OCR技术已经非常成熟,不仅在识别率上有很大的提高,而且能够处理各种字体、字号、布局等复杂情况。此外,随着人工智能,尤其是深度学习(Deep Learning,DL)技术的发展,OCR技术正在向高识别率、高稳定性、高易用性方向发展,并广泛应用于银行、证券、保险、汽车、物流、医疗、海关等行业的多个业务领域。

  在金融行业,OCR技术可用于对银行卡、身份证、营业执照、发票等证件及票据进行信息识别,通过对图像中的信息进行精准识别,可以快速提取相关数据,提高业务流程效率与合规性,有效防范金融风险,相关技术正在广泛地应用于大量金融业务场景中。

  二、OCR技术应用

  1.OCR技术应用分类

  一般而言,OCR技术应用可以简单分为两大类,即印刷体识别和手写体识别。在金融行业的应用落地探索中,OCR技术应用又可以遵循“5N”框架方法论进行场景细分。遵循“5N”框架的五类OCR识别场景详见表1。

表1 遵循“5N”框架的五类OCR 识别场景

  一是数字识别(Numerical Recognition),是针对图像数据中的数字信息进行识别抽取,主要用于对银行卡号、身份证号、车牌号等信息的识别抽取。

  二是命名实体识别(Named Entity Recognition,NER),是针对图像数据中的自然语言命名实体(又称“专名”)进行识别抽取,主要包括对企业三证、发票、行驶证、驾驶证等证照上具有特定意义实体信息(如人名、地名、专有名词、机构名称等)的识别抽取。值得说明的是,NER原本指自然语言处理(Natural Language Processing,NLP)中的一项基础关键性任务,是信息提取、句法分析、问答系统、机器翻译等应用领域的重要技术基础。一般来说,NER采用基于规则的方法、无监督学习方法和有监督学习方法,从待处理的自然语言文本中判别发现三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体信息;而在OCR任务中,无需涉及对命名实体的判别发现,仅需从图像数据中将相应的信息识别抽取。

  三是纯列表数据识别(Neat Tabulated Data Recognition),是针对图像数据中整洁的表格信息进行识别抽取,主要用于对各类财务报表、统计报表中结构性数据的识别抽取。

  四是自然语言文本识别(Natural Language Text Recognition),是针对图像数据中的自然语言文本信息进行识别抽取,包括对企业年报、尽职调查报告、业务分析报告、绩效评价报告、审计报告、会议纪要及督办通报等材料的全文信息识别抽取。

  五是自然手写识别(Natural Handwriting Recognition),是针对图像数据中的手写文本信息进行识别抽取,值得注意的是其中也包括对手写数字、手写命名实体、手绘表格、手写自然语言文本等信息的识别抽取。除了对标准的文本字符进行识别抽取外,如涉及对手写笔迹特征的识别抽取,则表明此时OCR技术已从纯粹的模式识别任务进入到了生物识别技术应用范畴。

  2. 华夏银行OCR技术应用实践

  遵循前述“5N”框架方法论,华夏银行在相关OCR应用平台中,应用了除自然手写识别技术外的其他全部OCR信息识别与抽取技术。针对现存客户影像资料以及业务申请资料中的各种证件与票据,应用OCR技术可以有效识别出客户证件类、卡证类、票据类等相关信息,还可以对通用文本、通用手写等信息进行有效识别,并对识别出的影像进行信息抽取,生成结构化数据,以便后续存储调用;后期还可以通过技术扩展支持对更多不同类型图像数据的分类、识别和抽取技术应用。

  三、基于GPU技术的OCR系统

  在OCR系统中,人工智能神经网络(Neural Network,NN)主要承担特征提取器和分类器的功能,输入字符图像,输出识别结果。DL方法在OCR领域的应用已经大幅超越传统算法。面向计算机视觉(Computer Vision,CV)和NLP的卷积神经网络(Convolutional Neural Networks,CNN)以及长短期记忆(Long Short-Term Memory,LSTM)等一些新兴技术方法已经开始扩张到OCR领域,且应用效果显著。

  GPU在人工智能领域的广泛应用,为DL模型的训练和推理提供了助力。在训练过程中,GPU可以加速NN的训练。通过并行计算,GPU可以处理大量的数据运算,并且可以在短时间内进行多次迭代,从而使得训练过程更加快速和高效。在推理过程中,GPU可以用于加速NN的推断。一旦训练好模型,GPU可以快速处理输入的字符图像,进行特征提取和分类,从而得到识别结果。在这个过程中,GPU的并行计算能力使得推理过程更加快速和高效。

 四、华夏银行OCR应用全栈自主可控的探索与实践

  华夏银行将金融OCR应用通过适配全栈自主可控智算平台,实现算力可控,确保平滑地完成迁移改造,为人工智能在国内金融行业的深化应用提供有益借鉴。一般而言,金融OCR应用迁移替代工作的技术路线主要围绕着主流操作系统(Operating System,OS)、中央处理器(Central Processing Unit,CPU)和GPU三个核心基础软硬件展开,经过多方调研、比较与验证,华夏银行最终确定了麒麟操作系统、海光X86 CPU和DCU GPU的技术路线。华夏银行通过在信用卡中心赛博智能学习平台的金融OCR应用进行技术攻关,在全栈自主可控技术路线上验证迁移适配。通过结合前述OCR识别场景开展推理验证,全栈自主可控平台的识别能力得到了有效验证,模型性能可达到90%以上。同时,在全模型推理方面,全栈自主可控平台可以在单块GPU上一次性加载并运行所有模型,实现对DCU算力资源的较好利用。

  华夏银行通过自主创新实践,面向金融OCR应用,完成了相关智能学习平台全栈自主可控软硬件系统的迁移替代,在全栈自主可控环境下可兼容需求功能,并达到目标精度等性能指标,为金融领域后续全面推广自主可控人工智能相关软硬件环境提供了成熟的技术方案参考和实施经验借鉴,同时实现可持续系统扩展、升级改造和优化维护,进一步提高应用的高可用性,充分满足金融数字化转型发展相关要求。

  在2023年8月于北京举行的第二届国际互联网产业科技创新大会暨互联网创新产品展览会上,华夏银行凭借华夏银行信用卡客服中心智能学习平台项目荣获2022年度科技创新特等奖。

  随着科技的不断深入发展,尤其是大模型技术的不断进步,相信未来国产GPU将会在金融人工智能场景中发挥更加重要的作用,助力金融机构更好地实现数字化转型发展。华夏银行也将在更广泛的金融科技应用领域,探索落地全栈自主可控GPU的迁移替代解决方案,为金融科技稳健发展贡献力量。

  [本文作者向中科可控信息产业有限公司以及北京易道博识科技有限公司致谢。华夏银行信息科技部李大伟、徐小芳以及龙盈智达(北京)科技有限公司杨璇、张月、陈生、冯骁对本文亦有贡献。]

作者:

  华夏银行首席信息官、龙盈智达(北京)科技有限公司董事长 吴永飞

  华夏银行信息科技部副总经理、龙盈智达(北京)科技有限公司首席数据科学家 王彦博

  华夏银行信息科技部应用技术研究室室经理 陈志豪

  华夏银行信用卡中心 李文轩 康晓博


 
过刊查询
2022年03月 2022年02月 2022年01月
2021年12月 2021年11月 2021年10月
2021年09月 2021年08月 2021年07月
2021年06月 2021年05月 2021年04月
查看所有过刊
本期精选
《中国信用卡》2023年第12期目录
中国工商银行网络金融部副总经理徐晓群:..
中国建设银行网络金融部副总经理殷勇:建..
交通银行网络金融部总经理、金融科技创新..
中国邮政储蓄银行信用卡中心副总经理马琳..
招商银行信用卡中心总经理助理文竹:招商..
中国工商银行软件开发中心副总经理张旻:..
盛京银行信用卡中心风险总监刘源:城商行..
 
企业简介 | 版权声明 | 免责声明 | 频道介绍 | 安全提示 | 法律顾问 | 网上投稿 | 客服电话 | RSS订阅
Copyright © 2005 Fcc.Com.Cn, All Rights Reserved. ,《中国金融电脑》杂志社版权所有
电话:010-51915111-805 传真:010-51915236,网络出版服务许可证(署)网出证(京)字第337号
京ICP备14024077号-1 京公安网备:11010802025321 技术支持:站多多