新书6月21日消息,腾讯云大模型知识引擎新鲜出炉,具有新能力——大型知识引擎文档分析!
基于腾讯优图实验室开发的新一代多模态文档分析模型,可以通过布局分析定位文档所有内容的位置和类型,然后准确识别文本表格公式等内容,最后按照人类阅读顺序输出连贯可读的内容。
例如,面对带表的PDF文档,特别是没有框架的表,它可以通过整合行列关系特征和元素特征来预测行列间隔线。
算法可以推理和正确恢复表格数据和结构,大大提高了识别的准确性。每次复制表格数据错位的人都有福了!
不仅中英文,还支持20 语言,以及繁体字、生僻字等字体。
更令人惊讶的是,它还支持将识别后的图片和PDF文档转换为Markdown格式输出。
腾讯表示,目前大型知识引擎文档分析复杂文档分析的准确率可达98%以上。
目前,本文档分析功能已在多个产品上线,您也可以点击此在线体验。
[本文结尾]如需转载,请务必注明出处:新书
责任编辑:随心所欲
文章内容报告
还没有评论,来说两句吧...