7月 26 日,业界领先的人工智能企业达观数据在北京召开“达道至简”为主题的产品发布会,正式推出国内首款自主研发集OCR(光学字符识别)与 NLP(自然语言处理)于一体的达观智能RPA。它突破了传统 RPA无法处理的非结构化数据源问题,例如图片验证码识别,证件识别,纸质文档识别,合同抽取,财务报表抽取,报告生成等业务需求,延伸了企业自动化链条,解决流程自动化“最后一公里的问题”。
什么是RPA?
RPA(Robotic Process Automation 机器人流程自动化),即以机器人作为虚拟劳动力,让计算机学习和模仿人类处理任务的步骤,代替人完成重复性的业务操作,如从业务系统或网站中自动提取数据、分析处理、生成文件和报告等,实现端到端的流程自动化。其最大的价值在于将企业重复性劳动进行自动化处理,迅速实现业务提效。
作为一种软件产品和解决方案,RPA在国外市场上已进入大规模发展应用。在Gartner发布的2019年Q1软件市场数据报告中显示,全球软件市场中RPA以75.6%的增幅速度增长,成为增长速度最快的企业级软件。
尤其是随着移动互联网的兴起,新技术迭代周期愈发缩短下,企业工作流程的规则更灵活、工作任务更复杂,需要更智能、更数字化的RPA。
达观数据创始人/CEO 陈运文
达观数据创始人陈运文介绍说,与传统 RPA 不同的是,达观智能RPA创新性地集成了RPA与AI,通过自然语言逻辑分类、自然语言数据提取、识别和深度学习模式预测,赋予机器人学习和思考的能力,打造了更聪明的机器人员工,将RPA的应用场景覆盖面提升到 了80%以上。
融合OCR+NLP技术,突破传统 RPA 能力边界
RPA最早起源于国外,但陈运文认为,RPA 在中国规模化发展更需要做有中国特色的 RPA产品。一方面,中国大型企业复杂的组织架构与权限划分需要从产品设计上做好不同部门、职位等级、角色的机器人隔离设计。另一方面和英文相比,中文更灵活,语法结构更复杂,这使得融合的 NLP技术在实现路径和方法上存在一定的差异化,在语义理解上也面临更大的难度与挑战。
从产品结构上来说,传统RPA 产品由开发平台、控制中心、终端机器人组成。在这三大核心部分的产品功能设计上,达观数据从其擅长的 NLP与 OCR所覆盖的场景切入,针对企业级用户特点,打造兼容性、灵活性、开放性和稳定性更强大的 RPA 产品,创造更智能、更具效率的机器人员工。
据陈运文介绍,达观智能RPA融合了自研OCR 的感知技术+NLP 的认知技术,突破传统 RPA无法处理的非结构化数据源问题,例如图片验证码识别,证件识别,纸质文档识别,合同抽取,财务报表抽取,报告生成等业务需求,延伸了企业自动化链条。
“对任何一个业务流程自动化而言,都需要串接许多技术模块。RPA+OCR+NLP的融合,减少了业务流程中人机交互、人工复核的环节,更全面的满足企业自动化的需求。”陈运文如是说。
NLP组件是由达观数据自主研发,采用CRF、HMM、HAN、Bi-LSTM、BERT等最新算法,为企业工作流程中的关键信息抽取、合同预审、合规检查等需要认知参与的复杂任务实现自动化、全流程、可调控的AI应用效果。
在达观自研的OCR组件中,通过融合CRNN、Attention OCR、 Faster-RCNN、Mask-RCNN等数十种算法,解决了图像识别与转换的难题,例如对通用文字、证照、财务报告、复杂表单、合同、图纸等各种类型文档的识别与处理,完成更大程度的自动化。
“OCR 如同人的眼睛,NLP 如同人的大脑,RPA则是人的双手,手脑眼三者结合才能承担更复杂的流程化工作。”陈运文说。
赋能行业落地,建设中国 RPA 生态
RPA能实现快速落地,最根本原因是企业无需对现有的系统和流程进行改造,只需通过非侵入式技术,就能实现系统间的快速对接、业务流程的自动化部署。
“对于企业来讲,这样的产品成本低且成效显著;对企业员工来讲,其学习成本、后期维护成本都可控。” 达观副总裁贾学锋表示。
例如达观数据为政府部门开发的智能RPA系统,解决了工作许可申请中各种信息录入和汇总的问题。通过结合 OCR和NLP语义理解等技术,以往需要工作人员对纸质文件反复录入、核对的信息,目前已可实现自动录入,并根据字段特征自动填写到系统的相应位置,行政审批流程从原来的 12天缩短到 5 天。
达观数据也在积极携手行业伙伴打造RPA+的生态体系建设,扩展更多 RPA场景,加速RPA+AI 生态在中国企业中的智能化应用落地与创新。目前RPA已推出银行、财税、政务、保险、证券基金等数十种不同岗位的机器人员工,在售后工单处理、商业案例报告生成、供应商准入核实、智慧政务行政审批、金融文档的抽取验查和填写等场景中,机器人员工已经在稳定高效地开展各项工作。
陈运文表示,在未来一年内,达观智能 RPA也将继续推出财务、金融、制造、IT服务等不同领域的机器人员工。