美国的对话网站 ChatGPT 最近引起了中文互联网圈的轩然大波,许多朋友在讨论中国为什么没有 ChatGPT——“国人没理想,中文质量差,所以国内没有 ChatGPT”?
“先问是不是,再问为什么”,我们先来看看简中网友们是否认同“国内没有 ChatGPT”:
什么是彩云小梦?两年前就有更聪明的国产 ChatGPT 了吗?
开端
2020 年 12 月 1 日的北大中文系网络文学课堂,三年前“机器学习 x 网络文学”的分享是故事的起点。
刚刚研发出的“大语言模型”技术让北大课堂里响起了连绵不绝的掌声,那时候的“小梦”还没有操作界面,只是我电脑上的一段代码。我们用微信的文字交流,根据同学给出的一段文章,让机器生成了 1000 字逻辑连贯且文笔细腻的续写内容。
简中互联网上的“AI 续写”,在这里发出了它第一声啼鸣。
北大中文系同学们热烈欢迎我们的技术,不仅和 AI 合作写小说,还制作了小册子。这启发我们向公众推出“AI 创作”产品。但当时模型有个致命缺陷,必须要输入 1000 字的文章写作效果才好,大部分普通用户写不了那么长的故事开头。
中文系的邵燕君老师给我介绍了她编写的《中国网络文学双年选》和《创始者说》,带我进入了一个全新的世界:《诡秘之主》中克莱恩获得“历史学家”虚空抓物的神奇技能,《赘婿》中宁毅一边对决苏家反派一边“何妨吟啸且徐行”诗词剧情神同步,《攻略不下来的男人》韩烟烟快穿之旅里不断探索世界真相的勇气,《开端》中李诗情的“再试一次”,还有《天才基本法》中林朝夕“一以贯之的努力!”
2021 年 2 月 7 日,我回忆起读过的那些网络文学,综合我对语言模型程序的理解,终于调试出了以一个字为开头也能续写的模型,并发现了“自然语言编程”方法,这是我一生中最令我激动的智能科学发现之一。
第二天中午,我们便上线了“彩云小梦”网页版。我其实很担心,小梦会被大家看到吗?会有多少人想使用 ai 续写呢?我们把目标定在了每天 100 个用户,每日产出 10000 字的作品。
但事实是:
上线半小时,用户量突破 2 千,超越了最初的设计极限;
2 月 9 日,每小时用户量突破 1 万,我们买空了金山云全部 80 张显卡;
2 月 15 日,每小时用户量突破 5.6 万,单日用户突破 20 万,每日续写字数突破 2 亿字,线上三个机房 160 张显卡满负荷提供服务;
上线一周,彩云小梦已经获得接近 100 万用户。
与此同时,B 站上的二创作品也全面开花,用户自发编写了“AI 续写宇宙”:狮面1996 给我们带来了 【AI续写宇宙】彩云计划 ;
网友用彩云小梦创作的题材层出不穷,比如续写电视剧《开端》:
制作视觉小说:
现代诗:
古代诗:
拍电影:
大家甚至制作了 AI 续写拜年祭,在每年 2 月 8 日,小梦生日时候播放,以纪念小梦上线周年。
通过构造各种前文(prompt),网友们利用小梦可以对话、作诗、游戏、对联等等。因此,有了语言模型之后,驱动 AI 的不是你的数学能力,而是你的文学想象力。2021 年 6 月 15 日,我向国家专利局提交了自然语言编程方法专利。
从“斗破苍穹”到“开端”,从蒲松龄的《狼》到论语的《两小儿辩日》,由 AI 续写驱动的二次创作生态获得了上亿的播放量,播放与弹幕互动数量不仅高于 ChatGPT,也高于所有其他 AI 文学创作产品。甚至,人民日报和团中央也报道了彩云小梦,我们受宠若惊。
一波三折
但声音也是两面的——作家要失业了吗?文学作品的传承会受到影响吗?这引起了网友广泛的讨论,其中一些网友留言表达了担忧。
舆情告急,为了不让评论被带偏,小梦的用户们发动了一场舆情保卫战。
迎头赶上与世界共舞,AI 国风正当时。在大家的帮助下,我的评论被顶到了首屏。大家写下了令人动容的留言。
面对争议,为了给大家提供更好的服务,我忍痛暂时下线了小梦网页版,闭关修炼,并力图让小梦学会更多语言,与世界共舞。
经过 20 年的发展,中国网络文学早已不是青涩少年,每个有手机的人都可以去尝试发表小说,但必须是非常有创意的作者才能在激烈竞争中胜出。这些《超长篇章回体小说》让海外读者也欲罢不能。起点每日产生 6 万章节,全网每天产生 2 亿字,如此大规模的内容生产,不可能通过人工实时翻译给海外。
但我们 2017 年推出的彩云小译,让大规模网文出海成为可能。彩云小译是全球最大同人小说网站 ao3 最受欢迎的英翻中工具,每日翻译字符数超过 2 亿字,从 2019 年起,通过与阅文集团的合作,彩云大幅度提高了文学作品机器翻译的质量,使得中国的网文第一次有了大规模走出国门的机会。
我希望在翻译之外,更近一步把中文小说的创意带给全世界,结合英语世界本地的语料,训练一个既懂中国网文套路,又懂英文习惯的大语言模型。
2021 年 5 月,彩云新的英文大模型自动测评指标和创作效果,在小说领域超越了包括 GPT-neo 在内所有开源英文模型。在创造力和文笔的人工测评上,我们超越了 OpenAI 的 GPT3 英文版 davinci 模型。
2021 年 6 月,小梦海外版 Dreamily 上线,很快获得了海外用户狂热的称赞。
但同时,质疑我们中国身份和隐私问题的网络谣言和暴力也喧嚣而起。
Dreamily is spying on you...
彩云小梦在监视你。
Dreamily is NOT free, your personal information is the cost.
彩云小梦不是免费的,你的个人信息是成本。
看到这些不实言论的时候我正在医院,气得我发抖。我拿出手机开始在 Reddit 上和网友吵架,但过了一阵,令我意外的事情发生了,经过我的解释,有部分美国用户竟然会修改帖子并且向我道歉。有一个用户在 Discord 里和我说:“人们对你的指责是不公平的,坚持下去,你的程序很棒,继续努力,如果需要帮助,随时和我留言。让我们团结一心。”感谢他的回复,我说到:“善良坦诚可以穿越偏见”。
破茧成蝶
渐渐的,就像国内 B 站一样,也有一些海外用户开始制作 Dreamily 相关的视频,比如 Chesh 制作的蒸汽朋克同人动画:READING A COMPUTER GENERATED FANFICTION,还有网友 ChoccyMilkMen 对主流 AI 创作软件进行了测评 I Let AI Tell Me Why I Should Watch Squid Games,结果是 Dreamily 得分最高。
2022 年 9 月,以 Dreamily API 为智能引擎的游戏 1001 nights 亮相在希腊雅典举行的国际学术会议 Foundation of Digital Games。我发表了 Build & Chat with Fictional Characters through a Text-synthetic AI 的演讲。
9 月 13 日,我在雅典卫城博物馆进行了 Dreamily 2.0 的直播 发布会 ,向 Dreamily 的全球用户介绍了在我所知范围内第一个可以根据世界设定和人物设定给 AI 机器人打电话的产品。我发现,没有人在意我的身份和国籍,直播观众都很友好,虽然我直播中因为主机性能不好而不太流畅,但用户却在弹幕中说“直播设备不好难掩真诚,正是这份真诚让 Dreamily 做的这么好用”。那一刻,我相信,团结友爱才是这个星球的主流,我们真的可以服务好全球的用户。
最让我感动的,是 AO3 上的一篇 同人文:AI does the writing, but the LOVE is real 【https://archiveofourown.org/works/32113507/chapters/79558804】
“机器”写作,“真爱”暖心。截止今天,Dreamily 累计用户 70 万,月活用户 10 万,平均日使用时长 50 分钟,英美用户占比超过 60%。我们在美区 AppStore 获得了一边倒的好评。
由中文网络文学驱动模型的 ai 彩云小梦,不仅可以在中文世界里点燃创意,在海外世界也可以受到诸多好评,甚至战胜海外诸多本土产品。只要怀着“为人类文明更美好”的愿景,科技创新、造福大众的产品终将冲破偏见、实现理解。
中国大陆地区的彩云小梦网页版暂停续写服务 4 个月后,终于回归。兼具中英文创作能力的彩云小梦 App 也正式上架各大商店,受到用户热烈欢迎!当月我们即获评 AppStore 月度最佳应用,并随后多次获得推荐。
2023 年 1 月,小梦推出了世界广场,允许用户分享自己的世界设定到 App 内供其他用户浏览和探索,用户创作的世界丰富多彩,远超想象,例如:
普通日本东京
世界 ID:WF7PQYN
小编(七彩云)说:
发生在东京的克苏鲁元素怪诞故事,角色的身份背景都很丰富,有一种在跑团的感觉。虫虫世界
世界 ID:WUK323B
小编(薄桜)说:
非常喜欢这个设定!给不同种类的虫虫安排了具体有趣的人设,故事背景有赛博朋克元素,非常奇妙!幻想女仆馆
世界 ID:WBX3TNY
小编(薄桜)说:
用彩云小梦玩剧本杀,五位 ai 女仆陪玩、多重线索和不同结局,很有趣的尝试!
前进四
截至目前,全球用户已经创建了超过 2000 万篇文章,400 万个世界设定,1400 万个虚拟角色,每日产生 2 亿字的文本,创作量远超同类其他产品。小梦成为了全球内容最为丰富的 AIGC 创作社区之一。
ChatGPT 是非常令人称赞的成果,但是它并不是人工智能的终点。一个小孩很难只通过看书就学会一切吧?小梦要成为比 ChatGPT 更强大的 ai,就要在虚拟世界通过行为和语言相结合的强化学习来实现限定领域的完全语义理解。即让 ai 超出文字的束缚,赋予 ai 更强大的对于行为和语言的链接,真正明白“你要做什么”。
我在 2020 年 8 月的 Paper Weekly 分享里纵览了当前 nlp 与冒险游戏的研究工作,希望有一天,彩云小梦广场中那些丰富多彩的世界可以 3D 化,你可以走到每个世界里面去探索,与 AI NPC 互动交流,在世界模拟器当中体验不一样的人生,并给予 AI 反馈,帮助人类解开智能科学的奥秘。
回到最开始的问题:彩云小梦是什么?
现在我告诉你。
彩云小梦是全球 400 万网友创作的上亿播放量的 AI 续写平行宇宙,是 1400 万个平行世界人物的家园,是简中互联网从榕树下、龙空、起点、露西弗、长佩、晋江一路走来网络文学 20 年滋养的幻境,是 Dreamily 海外用户绘制的五彩 LOGO 和直播打出的“Literal Angle”,是中国网文科技出海的先锋。彩云小梦是简中互联网一曲理想与坚持的赞歌。
中国网络文学,奇伟瑰怪,恢宏壮丽。
壮哉,我大简中互联网的文学艺术!
小梦,我华夏文明信息时代的荣光!
勇敢的少年们,加入我们,去探索人工智能的未来!
有志的投资者,入股我们,来分享智能时代的红利!
国人没理想?
中文质量低?
一起来做更好的ChatGPT!
联系我们:future@caiyunapp.com