文档处理是影响大模型语料质量的关键环节,为了帮助广大开发者降低智能文档处理Agent(智能体)搭建门槛,合合信息旗下TextIn近期上线了文档处理领域首批MCP Server服务,助力“一次开发,多模型通用”目标的达成。
随着大模型及Agent技术的飞速发展,通过大模型调用外部工具正在成为AI应用开发的新范式。然而,由于不同大模型的调用结构和参数格式各异,开发者需要分别编写工具调用逻辑,AI工具集成效率低下,MCP(Model Context Protocol)协议的出现解决了大模型与外界数据源、工具的协作难题。
据合合信息技术团队成员介绍,TextIn MCP Server系“大模型加速器”产品中,专为大模型下游任务设计的通用文档解析服务,能够识别并提取上千种文档中的跨页表格、合并单元格、密集表格、手写字符及公式,包括金融文档、国家标准、学术论文、财务发票等,解析稳定率达99.99%,单页处理耗时较行业可比产品降低超30%。相关服务可帮助各类大模型在理解、生成、问答等场景中高效利用文档数据,加速教育题库数据处理、RAG知识库建设、文档翻译与格式保留、RPA及Agent自动化处理等多个下游场景的应用开发。