阿里云申请复合信息实体抽取专利,可从待处理文档中抽取复合信息实体
金融界2024年12月12日消息,国家知识产权局信息显示,阿里云计算有限公司申请一项名为“一种复合信息实体抽取方法及装置”的专利,公开号CN 119106072 A,申请日期为2023年6月。
专利摘要显示,本说明书提供了一种复合信息实体抽取方法及装置。所述方法包括:获取待处理文档;其中,所述待处理文档中包含由若干信息实体构成的复合信息实体。所述复合信息实体包含的字符的数量大于阈值。从所述待处理文档中抽取代表所述复合信息实体的开头部分的第一类信息实体,以及代表所述复合信息实体的结尾部分的第二类信息实体。基于所述第一类信息实体和所述第二类信息实体,确定所述待处理文档中包含的所述复合信息实体,并抽取确定出的所述复合信息实体。
本文源自:金融界
作者:情报员