本文围绕上海辞书出版社推出的“辞文智能知识审校系统”展开,介绍了该系统的发布情况、特点、开发背景、技术支撑以及应用体验等,展现了其在出版及相关行业的重要价值。
当人工智能在各个领域纷纷崭露头角之际,具有深厚底蕴的《大辞海》也积极投身其中,推出了先进的AI审校系统。在3月25日这一天,上海辞书出版社联合百度以及鲸汤(上海)智能科技有限公司,在上海正式发布了最新产品——“辞文智能知识审校系统”。这一产品意义非凡,它是《大辞海》权威知识库与百度文心大模型深度融合的创新性成果,标志着出版行业的智能化转型踏入了一个全新的阶段。
上海世纪出版集团副总裁、上海辞书出版社社长秦志华介绍道,“辞文智能知识审校系统”具有高效且精准的特点。目前,该系统能够在短短10分钟之内完成40万字文本量的审校工作,错误识别准确率高达80%。这使得审校工作效率实现了成倍提升,有效解决了传统文本审校在知识性、逻辑性方面存在的痛点问题。
实现从“文字纠错”到“知识审校”的能力跨越
近年来,文本审校工具如同雨后春笋般不断涌现。从早期的黑马校对、方正审校,到后来的i校对、凤凰智能校对系统、蜜度校对通、果麦AI校对王等产品,它们各自都有独特的优势和特点。
而“辞文”系统则依托《大辞海》的权威知识,将自身定位精准瞄准“知识审校”。秦志华指出,“2023年8月起执行的《图书编校质量差错判定和计算方法》中明确规定,一般性错字、别字,每处计1个差错;知识性、逻辑性差错,每处计2个差错。由此可见,知识性、逻辑性差错对于编校质量管理而言是极为重要的。然而,随着知识专业化分工越来越精细,单个审校人员很难完全掌握跨学科的知识。因此,市场迫切需要一套智能、高效、准确的知识审校系统。这套系统不仅会成为新闻出版机构、内容发布平台的重要把关利器,也将成为整个内容创作行业的前置工具。”
实际上,上海辞书出版社很早就开始关注“智能审校”领域。秦志华介绍说:“‘辞文智能知识审校系统’并不是我们一时兴起追赶潮流的数字产品。最初产生开发智能审校系统的想法,可能要追溯到2019年。”当时,上海辞书出版社正在围绕《辞海》数字出版云平台的建设,开发工具书协同编纂的子系统,其中就包含了历史纪年、古今地名、规范汉字、引文和译名统一等自动核查功能。那时,他们就已经将智能审校这一知识服务方向列入了出版融合的“代办清单”中。
到了2023年6月,上海辞书出版社与百度文心一言展开合作,正式立项“辞文”智能审校项目。后来,鲸汤(上海)智能科技有限公司也加入进来,在数据、算法、算力等方面密切配合,推动大辞典与大模型深度融合。经过3轮严格的外部测试,“辞文智能知识审校系统”终于正式推出,成功实现了从“文字纠错”到“知识审校”的能力跨越。
百度AI技术生态副总经理周奇表示:“AI的质量与差异主要来自于数据,站在《大辞海》权威基础上做出的这个智能审校产品,基础非常好。”在大模型时代,软件产品是具有活力和发展性的,可以根据数据、用户反馈和大模型本身的成长不断进行迭代。依托文心 + 飞桨的核心技术,百度致力于和硬件伙伴、技术伙伴、数据伙伴等共建生态,架起技术和行业专业知识的桥梁,打通大模型垂直领域应用的工程化“最后一公里”。
王敏分享使用体验
《咬文嚼字》编辑部也对这一产品进行了体验。上海咬文嚼字文化传播有限公司总经理王敏介绍了试用情况,通过对一些已知错误的文本进行测试,“辞文”系统的修订结果值得参考。例如,一段文本中错将“多情总被无情恼”这句苏轼的词作写成是“出自元好问之手”,“辞文”系统第一次将其改成“并非出自元好问之手”,第二次则直接纠错为“出自苏轼之手”。
王敏认为:“智能校改两次内容不一样,第二次修订内容还有进步。”在大模型的助力下,通过人机协同,这一产品具有很大的潜力。
经济日报社上海记者站站长李治国感慨地说:“我做新闻20多年,最怕白纸黑字印出去的知识出错。”在做新闻报道时,记者编辑面对海量信息难免会有疏漏,比如历史事件的日期、科技概念的界定等都是跨领域的内容。“‘辞文’系统既具备AI的高效,又扎根于《大辞海》权威知识体系,能在几秒内完成交叉验证,帮助我们守住事实底线。媒体的价值在于权威性和准确性,通过前沿的技术,我们能提高工作效率,专注于更有创造性的工作。”
秦志华表示,“辞文”系统突破了以往各类文本审校工具的局限,实现了从“文字纠错”到“知识审校”的能力跨越,但其价值更在于守护知识传播的准确性与严肃性。据悉,目前该产品已成功应用于人文社科、科学技术等出版领域的文本审校,未来还将拓展至新闻传媒、教育科研等场景,致力于成为内容生产领域的“数字质检员”。
本文详细介绍了上海辞书出版社发布的“辞文智能知识审校系统”,阐述了其发布背景、特点、开发历程、技术支撑和应用反馈等。该系统依托《大辞海》权威知识库与百度文心大模型融合,实现了从文字纠错到知识审校的跨越,能提升审校效率和准确性,已在出版领域应用并将拓展到更多场景,守护知识传播的质量。
原创文章,作者:云淡风轻,如若转载,请注明出处:https://www.kqbond.com/archives/5324.html