百度申请文档图像还原及多模态大模型训练方法和装置专利,可编辑文件还原文档内容
金融界2024年10月29日消息,国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“文档图像还原及多模态大模型训练方法和装置”的专利,公开号 CN 118823798 A,申请日期为2024年6月。
专利摘要显示,本公开提供了文档图像还原及多模态大模型训练方法和装置,涉及计算机视觉、深度学习以及大模型等人工智能领域。其中的方法可包括:获取待处理的目标文档图像;将目标文档图像作为多模态大模型的输入,得到输出的第一文件,第一文件为符合预定表示格式的超文本标记语言文件;根据第一文件生成作为还原结果的第二文件,第二文件为可编辑的文件,且第二文件中包括目标文档图像中的文档内容。
本文源自:金融界
作者:情报员
相关资讯
- ▣ 百度国际申请基于大模型的多模态内容提取模型的训练方法及智能体专利,有效提高训练的多模态内容提取模型的准确性
- ▣ 北京大学申请中文医学大语言模型训练方法及装置专利,提高大语言模型在医学领域回答的准确度
- ▣ 微众银行申请反欺诈模型的生成方法及装置专利,提高模型的训练速度
- ▣ 百度申请文本检测及文本检测模型训练方法专利,可获得待检测文本的目标粒度的目标检测结果
- ▣ 华为申请图像文件编解码方法专利,提高图像文件压缩率
- ▣ 锐明像素申请基于多模态大模型的道路病害检测方法及装置专利,能够提高检测精度
- ▣ 阿里健康科技申请大语言模型的训练方法及相关装置专利,一定程度上提升大语言模型的翻译文本的准确性
- ▣ OPPO申请图像编辑方法专利,提高图像编辑效率
- ▣ 威海蓝海银行申请基于多模态融合的文档图像篡改检测方法专利,解决图像篡改检测的技术问题
- ▣ 赛力斯申请一种车辆故障诊断模型及其训练和使用方法、装置及介质专利,提高模型的诊断精度和准确性
- ▣ 青岛道可云申请物体模型展示方法及系统专利,能够更真实地还原模型细节
- ▣ 腾讯科技申请一种模型处理方法专利,提高文生图模型的图像生成质量
- ▣ 阿里巴巴取得翻译模型训练方法及装置专利
- ▣ 腾讯公司申请图片生成方法及装置等专利,能够使得文生图模型的应用更加便捷
- ▣ 新唐科技申请图像辨识模型训练专利,能实现图像高效训练
- ▣ 中建工程申请一种基于大语言模型的文档标签生成方法专利,实现优质文档标签筛选
- ▣ 山东矩阵软件取得一种模型训练的改进方法及装置专利
- ▣ 京东方取得图像编辑方法及控制装置相关专利
- ▣ 宁波博登智能科技申请基于多模态大模型的通用图像标注系统及方法专利,标注精度高
- ▣ 百度取得融合文本和自动驾驶数据进行模型训练的方法和车辆专利
- ▣ 南京际舟电子科技申请智能化多模态信息识别与分类管理系统及方法专利,实现多模态文档的准确分类
- ▣ 上海华筑申请基于竣工档案的BIM模型和图纸比对方法及系统专利,提高了BIM模型生成和图纸比对的精度和效率
- ▣ 华为申请通信方法及装置专利,可确定适合的服务质量配置文件
- ▣ 国网河南电力与安徽大学申请多模态大模型感知量化训练专利,实现有效降低多模态大模型的计算复杂度和内存占用
- ▣ 通用文档理解新SOTA,多模态大模型TextMonkey来了
- ▣ 中国工商银行取得文档处理方法及装置专利
- ▣ 百度宣布3月16日发文心大模型4.5,具备深度思考及原生多模态能力
- ▣ 九章云极申请多模态大模型图像处理专利,提高机器学习模型处理图像的效率
- ▣ 华为申请编解码方法和装置专利,能够通过JPEGAI对图像内容进行空间维度的质量调节