国产AI大模型内卷长文本时代,Kimi凭借先发优势率先“出圈”,随着百度、阿里等业界巨头的下场,AI长文本应用赛道竞争开始变得白热化。近期名为“橙篇”的长文本AI原生应用强势崛起,一站式的长文本生成体验有别于传统大模型学习工具,让其圈粉无数,如果“橙篇”遇上热门工具Kimi,AI长文本赛道新旧势力的碰撞又会产生怎样的结果?
01
内容创作者自述,雇佣“橙篇”是最正确的选择
“AI才出来的时候,有那么一阵子挺担心自己会被替代、会失业的,可深度体验大半年下来,发现AI其实挺‘小白’的,根本谈不上替代,能在内容创作时充当工具就算不错了。”提到AIGC,从事六年教育自媒体内容创作的李言有些兴致阑珊,接触过市面上几乎所有主流AI大模型的他表示目前Chat类AI大模型看似提供了许多功能,可“博而不精”明显也适用于AI大模型。
“拿长文本生成来说吧,AI很多时候生成的都是一堆看似正确的废话,而且AI八股味儿十足,生硬的行文套路让人感觉它就是个‘混基本工资’的,”,李言毫不掩饰自己对AI内容生成的失望,而随着AI长文本赛道的兴起,李言也开始让AI去解读一些财报/研报。“使用了才知道为啥AI企业宣传长文本时总爱拿经典小说举例了,真让他们去阅读分析企业财报,数据不出错可能就是底线了,内容总结不全反而是常态。”
从最初的助理到效率工具,认清现实的李言开始逐渐放低对AI大模型的期待,Kimi凭借“长文本”出圈后,李言就将其当作AI阅读器使用,“冗长”的报告让Kimi先行阅读并总结概括,从而为自己创作的内容提供元素或完善自己的思路。然而,这样的关系却随着“橙篇”的出现而发生变化。
“当初仅在好奇心的驱使下尝试以‘分析最近10年清华大学和北京大学通过高考在重庆的录取人数,以图表的形式展现’为指令,让橙篇和Kimi阅读网络资料的同时生成图表,没想到两者生成的结果差异能如此大”,提到第一次用“橙篇”和Kimi对比,李言依旧难掩心中激动。
Kimi的生成的表格数据不全
“橙篇”很好地完成了表格的生成与数据分析
Kimi与“橙篇”对于互联网数据的收集整理差距非常明显,Kimi表示没有直接数据提供的情况下,仅整理了清华大学2023和2016两年在重庆的录取人数,北京大学更是只有2023年的录取人数,“橙篇”则不仅根据互联网数据按要求完成了两所大学近10年在重庆招生人数对比,且2022年和2023年两年还对物理和历史录取人数进行了区分。
“橙篇”不仅可以生成数据清晰的表格,更为用户提供了备注,通过仔细阅读备注我们发现,“橙篇”在数据整理和分析时,明确提到2020年的数据来源的三所学校以及影响数据的各种因素,这样一份答案的生成,意味着“橙篇”不仅对互联网数据进行了整理,更按用户要求进行分析、归类,同时,“橙篇”还对数据进行了简单的分析。
“数据采集和分析一直都是非常耗时耗力的事情,橙篇表现出来的水平已经相当专业了,更难得的是其还对数据进行了简单的分析提示,这意味着我能够直接在行文中采用。”李言对于“橙篇”对互联网内容数据的采集和分析能力相当肯定,“除利用橙篇帮忙做一些数据整理和分析外,橙篇的“全文校正”功能也是我非常推荐的。”
“橙篇”有设计单独的“全文校正”功能
在“橙篇”首页点选“全文校正”功能后,上传需要校正的文本即可。不同于其他AI碎片化的对错别字校正,“橙篇”不仅在对话框中以横线标注的形式对文本内容进行校正,更会在校正完成后生成一篇单独的“全文校对结果”附在对话框底部,用户直接点击即可查看。
“橙篇”会生成单独的“全文校对结果”文本文件
而同样的指令和文章,Kimi的校对仅仅是列举出它认为需要修改的地方和修改建议,看似条理清楚,实际上操作起来非常麻烦。
Kimi条理清楚地列举了需要修改的地方,可用户实际修改非常麻烦
“橙篇真的是一款非常不错的效率工具,它对于互联网内容的阅读理解能力对Kimi而言完全是具有压倒性优势的,而且“全文校对”功能的出现,更是弥补了个人自媒体在‘三审三校’上的缺失问题,我已经养成在撰稿完成后让橙篇帮忙审一次的习惯。”
02
媒体资深编辑,效率工具体现“橙篇”价值
Chat类大模型想要在C端大众市场收获用户,无外乎两条路可走:一是提效工具,二是娱乐工具。自Kimi推动AI大模型向长文本赛道“内卷”后,能够体现生产力价值的AI大模型显然更符合当下终端消费市场需求,对此本社编辑亲身实战,体验效率工具在工作中的应用表现如何。
从界面设计入手,对比Kimi和“橙篇”会发现Kimi极简的UI设计风格反而成为一种“桎梏”,虽然底部会给出一些对话提示让用户明白Kimi能为其提供哪些服务,可对比“橙篇”会发现,后者明确地将重点功能以块状分布,用户能够一眼了解自己想要做什么或者需要某功能时需要点选哪里。
界面比较,上为Kimi,下为橙篇
这里还有一个非常有意思的事情是“橙篇”不仅给出“写长文神器”区域,更“AI工具箱”区域,虽然后者诸多功能暂时显示“上线中”,但从智能PPT到AI思维导图甚至AI有声漫画,这样的功能结构设计,俨然有成为轻办公平台的基础。
除“橙篇”除在UI设计方面更显专业和方便操作外,其内容处理上更有专业“文科生”的水平。
当我们以“帮我写一篇长文,主题是:介绍北京排名前十的博物馆”为指令下发给Kimi和“橙篇”后,两者采取了截然不同的创作模式。
Kimi根据指令生成的长文较为生硬
Kimi直接根据指令生成了长文,其内容包含了10个北京主要博物馆的介绍,从理解到答题并没有任何偏差,但面对同样的指令,“橙篇”首先生成的是文章大纲,用户可以直接在大纲中进行修改、调整。
橙篇在生成长文之前,会先生成可调整的文章大纲
用户确认“橙篇”生成的大纲无误后即可点击“生成长文”按钮(如果特别不满意,甚至可以直接点击“换个大纲”)。
橙篇在生成长文之前继续生成可调整的文章大纲
根据大纲,“橙篇”完成了一篇13,158字的长文,详细介绍10个北京博物馆的同时,更给出了参观和游览建议,更在文末附有参考文献。
“深度编辑功能”的出现,让“橙篇”在长文生成上明显高出Kimi一个档次。而在长文本理解方面,笔者尝试让“橙篇”和Kimi同时阅读一篇包含图文及表格信息,名为“C919放量元年,大飞机乘风起航”的研报。
左为Kimi生成结果,右为“橙篇”生成结果
对比发现,Kimi在文章概括中忽略了“C919技术亮点与材料应用”,同时,“产业链公司梳理”也是直接堆在一起表述,而“橙篇”则细分为“机体制造商”“材料供应商”和“机载系统供应商”三个类别,再针对每一个类别对企业进行归类。此外,“橙篇”对内容概要进行梳理的同时,还在文末附带了“整体总结”,其对长文本的整体阅读理解能力上表现相当出色。
当然,如此强悍的长文本理解能力一定程度上同“橙篇”背靠百度算力及内容生态有关,作为百度AI大生态的一员,“橙篇”能快速在长文本赛道上迸发出耀眼的光芒也就不足为奇了。
03
点评:完美融合AI的一站式创作平台
无论是内容创作者的表述还是科技媒体资深编辑的测试,“橙篇”对于长文本和互联网内容的阅读理解能力都远超Kimi,尤其是在长文本生成方面,“橙篇”更是拥有近乎碾压的优势。
而从文稿大纲拟定到长文本生成,“橙篇”撰写长文的步骤已经相当类人化了,最关键的是其还提供“深度编辑功能”,用户可以直接在Word编辑器中对生成内容进行审核、编辑,同时,Word编辑器也整合了“智能助手”“资料搜索”“全文校正”“格式整理”等常用功能,足以成为融AI大模型于一体的一站式创作平台,而这或许也是未来AI长文本声场工具的发展方向。
来源:壹零社