当前位置：首页|资讯|ChatGPT|机器学习

南农大团队研发“古籍版ChatGPT”，为何取名“荀子”

作者：澎湃新闻发布时间：2023-12-11

ChatGPT 机器学习

“荀子”古籍大语言模型示意图微信公众号@南农信管之窗CIM 图

澎湃新闻（www.thepaper.cn）12月11日从南京农业大学获悉，该校信息管理学院王东波团队日前研发出国内首个专门用于古籍处理与研究的智能工具——“荀子”古籍大语言模型，包含《四库全书》在内的古籍文献超20亿字大型语料库，具备自然语言理解、自动翻译、自动标引等功能。该模型已在GitHub、ModelScope等网站开源。

王东波表示，荀子不仅是先秦伟大的朴素唯物主义思想家和散文家，对语言学理论的阐述也是开拓者，如此命名是纪念这位语言学先驱，“普通受众要走近繁体、竖版、没有句读的古文不是容易的事，‘荀子’上线，意味着在智媒时代与古籍对话成为可能，古文阅读理解、标点添加、译为现代汉语——这些难啃的‘硬骨头’，‘荀子’可以轻松拿下。”专家则可借助“荀子”完成古籍词法分析、实体识别、关系抽取、文本分类与匹配、文本摘要等。

据介绍，“荀子”的问世离不开高性能算力基础设施，也离不开团队长期积累精加工语料库，投喂了40亿字的混合语料数据。“模型的构建受算力、场景应用等影响，但精准度高的优质数据是关键。”王东波说，团队2008年接触古籍，2013年至今一直专注于人工精标注数据工作，“比如《岳阳楼记》，要训练机器标注其中的形容词，先要训练相关人员标注形容词，在大量人工标注的基础上让机器学习”。

王东波表示，期待通过“荀子”大语言模型，将古籍的智能化研究与跨学科人才培养结合，让学生既有前瞻的科研视野，又积累较深厚的人文底蕴，同时让更多受众接触、品读、传播古籍，唤活“故纸堆”。

推荐体验

相关资讯

南农研究团队发布国内首个“古籍版ChatGPT”

近日，南京农业大学信息管理学院王东波教授研究团队研发的“荀子”古籍大语言模型发布，这是国内首个专门应用于古籍处理与研究的智能工具，包含了《四库全书》在内的古籍文献超20亿字大型语料库，能够实现自然语言理解、自动翻译、诗歌生成、自动标引等多项功能，作为开源的、公益的研究成果，该模型已在GitHub（https://github.com/Xu...

ChatGPT GitHub 大语言模型

新华日报 2023-12-13

南大团队研发水系锌离子可充电电池，电池结构厚度仅有1毫米

近十年来，面向穿戴应用的电子设备已经从科幻影视作品走入日常生活，智能手环和智能手表便是典型的代表。这些产品普遍具备监测身体健康状况的功能，包括实时反映心率、血压和血氧等。在前几年新冠疫情的大背景下，这类产品也愈发受到关注。未来，还可以将可穿戴电子器件与ChatGPT等热门AI产品结合，从而构建一个充满智慧的物联网世界。

DeepTech深科技 2023-05-10

专业回血大团队

专业回血大团队《罔f c 5 8 .v i p》【企鹅Q176-5485】如果你是刚刚玩,我来教教你,如果你已经玩很久了,却不稳,我来拉拉你,如果你已经遍体鳞伤,我来帮帮你。用我们真诚的微笑，换取您对我们的满意。用我们真诚的微笑，换取您对我们的满意。同样即时设计的AI工具即时AI是一种全新的AIGC工具，可以通过自然语言描述在60s内生成高质量、高细节的Mobile/Web页面原型设计，适当的效率之王。即时AI的操作非常简单，只要模型选择完成后，就可以在文本框中输入网页描述，可以是“类似XX的页面”，也

koIw2q2nXR 2024-02-27

京东将推产业版ChatGPT 取名ChatJD

在ChatGPT火出圈后，国内的百度、阿里等巨头纷纷表示跟进，现在京东也宣布推出自己的ChatGPT产品。京东云旗下言犀人工智能应用平台宣布，将整合过往产业实践和技术积累，推出产业版ChatGPT，取

ChatGPT 百度人工智能

鹿角 2023-02-10

ChatGPT版Excel？北大团队搞出ChatExcel，动动嘴皮子就把表格改完了

欢迎报名2023年郑老师团队科研培训课程！2023年公众号会员邀请：每周直播答疑，配2200页纸质讲义【可开发票】ChatGPT 系列文章Excel 是最常见的数据统计工具，用于归纳和查询数据信息。在其之上，通常我们查询信息需要找到相关的单元格，获取其中的数据，这是合乎计算机操作逻辑的方法。但对于很多人来说，排序、乘除、平均数等操作比较简单，如果遇上复杂需要编程代码的操作，就完全不知如何下手了。近日，来自北大的研究者提出了一种更符合人们日常交流习惯的新方法 —— 一种名为 ChatExcel 的新应用可以

ChatGPT 北大编程

郑老师妙趣横生统计学 2023-03-06

近期资讯

推荐一个学习 CSS 网站，学习 7个小技巧

最近发现了一个学习CSS的网站。网站中收集了一些常见的动态特效。对于学习 CSS 很有帮助。网址如下：网址：https://lhammer.cn/You-need-to-know-css/#/ 下

关山月 2024-12-27

主打一个“小巧灵动”：Vite + Svelte

本文主要针对开发小型项目的场景，谈谈Vite+Svelte是如何让项目变得“小巧灵动”，并横向对比Svelte和Vue的性能表现，对二者的加载流程做详细分析。

vivo互联网技术 2024-12-27

深入剖析SQL死锁-两条SQL之间的死锁原因

注：测试环境数据库5.7。后续源码、SQL命令行操作、问题验证等，都是在8.0的数据库版本上。 1 问题背景在业务实现中，若数据存在则修改，不存在则插入，通常大家会选用 INSERT INTO...

转转技术团队 2024-12-27

前端浏览器前进后退传递信息

前端实现有两个页面page1和page2，page1跳转到page2，page2点击浏览器自带回退按钮回退到page1时，通过浏览器history api 给page1界面传递信息我们使用浏览器 H

小小小小宇 2024-12-27

攀一座山，看一场雪，追一个梦

我敲下的或许不仅仅是文字，更是自己这些年的成长轨迹，也是我内心最真实的自己，当我敲下这段，明天又是新的一天，马上又是新的一年。

介个凑是爱情 2024-12-27

Chatbot 不是“万金油”：企业级生成式 AI 如何真正创造价值

企业在引入生成式 AI 时，是否陷入了盲目追随聊天机器人的误区，如何真正发挥 AI 的价值潜力？本文作者提出了一个观点：企业应该首先关注业务流程，而非简单地将 AI 聊天机器人作为万能解决方案。

Baihai_IDP 2024-12-27

去哪儿机票智能预警系统-雷达系统落地实践

一、前言本文将从以下三个方向展开：首先，我们将进行价值分析，探讨为什么需要智能预警系统，以及搭建去哪儿机票智能预警系统-雷达系统（之后简称雷达系统）所面临的挑战。其次，我们将详细介绍去哪儿机票雷

去哪儿技术沙龙 2024-12-27

自学记录HarmonyOS Next Image API 13：图像处理与传输的开发实践

简介：在完成数字版权管理（DRM）项目后，我决定挑战HarmonyOS Next的图像处理功能，学习Image API和SendableImage API。

李游Leo 2024-12-27

浅谈API错误码设计

作者：京东物流冯志文一、痛点你是否曾遇到过以下问题？ 1.API错误码形同虚设，无法提供有效帮助？ 2.API错误码文档晦涩难懂，别说其他团队，连团队内同事都看不明白？ 3.API错误码定义混乱

京东云开发者 2024-12-27

一键美化！为本地图片增添边框与阴影效果的 Chrome 扩展

推荐给大家一个绿色的无广告的给本地图片添加边框和阴影的插件工具，供大家平时写文章、工作需要作图时使用！！

小肚肚肚肚肚哦 2024-12-27

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1