南京市智慧医疗投资运营服务有限公司申请费用明细清单识别专利
金融界2024年10月9日消息,国家知识产权局信息显示,南京市智慧医疗投资运营服务有限公司申请一项名为“基于OCR和LLM的费用明细清单识别方法及系统”的专利,公开号CN A,申请日期为2024年6月。
专利摘要显示,本发明涉及一种基于OCR和LLM的费用明细清单识别方法和系统,包括采集待处理图像,检测待处理图像的费用明细区域并截取第一子图;采用OCR识别第一子图获取第一集合,基于第一集合构建仿射变换矩阵进行图片水平校正,并获取水平校正后的第二子图;采用OCR识别第二子图获取第二集合,基于第二集合对第二子图中的文本行进行行列校正,校正后的文本行信息构成第三集合;基于第三集合构建,并结合大型语言模型获取费用明细识别信息。本发明通过多阶段的图像处理和OCR文字识别优化,显著提升复杂条件下文本识别精度;引入大语言模型,赋能空间位置关系理解能力,实现了从文本数据到特定信息提取的智能化飞跃,减少了人工干预,提高了效率。
本文源自:金融界