当前位置:首页|资讯|生成式AI

掌阅科技:用生成式AI实现阅读的第三次变迁

作者:至顶头条发布时间:2024-05-24

作者:王聪彬

《长相忆》《我的阿勒泰》《明朝那些事》《百年孤独》是最近掌阅APP上最受欢迎的读物。

随着电脑阅读、电子阅读器阅读、手机阅读、听书等阅读方式的转变,优质的读物正越来越容易被读者快速发现。

数字阅读在现代生活中已经占据了重要地位,《2023年度中国数字阅读报告》显示,2023年我国数字阅读用户规模5.7亿,同比增长7.53%,数字阅读用户规模占网民规模的比例,首次超过50%。

成立于2008年9月的掌阅科技,是国内最早进入电子阅读行业的企业之一,产品矩阵包括掌阅APP、掌阅文学、掌阅精选、掌阅课外书、掌阅iReader国际版等,为全球150多个国家和地区的用户提供高品质的图书内容和智能化的服务体验,2017年登陆上交所上市。

如今,在生成式AI浪潮中,背靠数字阅读场景和海量阅读数据的掌阅科技,看到了可以进一步激发用户阅读兴趣的机会。掌阅科技CTO孙凯认为,如何真正激发用户的阅读兴趣是改变阅读本质的核心,生成式AI与阅读的融合将实现与用户更深层次的互动。

用生成式AI解决阅读价值问题

阅读不仅是吸收知识和休闲娱乐的重要方式,也是掌阅科技专注15年的核心业务。

掌阅科技看到阅读这件事正在不断进化,10年前阅读还是以纸质书为主,2010年左右开始了纸质书到电子书阅读的第一次变迁,到2015年左右随着APP的爆发,开始了从PC、电子书阅读到移动阅读的第二次变迁。

第一次变迁解决的是介质问题,第二次变迁解决的是时间问题,两次变迁都没有对阅读内容的可读性、体验、可理解性的本质进行改造,那么第三次变迁是否能真正解决阅读价值的问题,掌阅科技相信答案是肯定的。

掌阅科技看到,要以人为中心,以存储和时间为半径给用户提供更多机会去阅读,而且这些机会是建立在兴趣的前提下。

“在生成式AI来临后,我们觉得机会可能到了。”孙凯说,下一次变迁的节点是从阅读的内容本身为用户提供深度交互。掌阅科技抱着对阅读的极大热情,开始了对于大模型的探索,更深度地帮助于用户更好、更快速、更便捷、更有体验感地去阅读。

相关数据显示,70%的用户是有阅读意愿的,但最终坚持下来的不到30%。掌阅科技观察发现,看什么书,怎么看;看时没意思,再看没动力;看完没感觉,过后不记得是常见的读前、读中、读后三个场景的痛点,也是用户无法坚持阅读的原因。

明确了三个问题,掌阅科技也开始针对性的考虑如何用生成式AI改造阅读的流程。通过对选书:一人一书单、看书:私人阅读规划、检查:一人一总结,结合视频和脑图等呈现形式对阅读进行重塑,在看书时候更能身临其境、获得更好的愉悦体验。

掌阅科技在2015年就开始了和亚马逊云科技的合作,通过亚马逊云科技遍布全球的基础设施,包括数据库、分析、网络和内容分发等服务构建了全球阅读平台,实现了阅读的出海。正是有了之前的良好合作,掌阅科技也开始在中国业务上进行生成式AI的共创。

从效率到愉悦的阅读革新

之前掌阅科技就基于阅读场景,推出了生成式AI驱动的国内阅读行业首款小说IP对话交互应用“阅爱聊”,聚焦阅读过程中的“聊书”“聊人”两个场景,为用户提供创新体验的阅读交互方式。

如果说之前是解决阅读效率需求,现在就是为了解决阅读愉悦需求。孙凯表示,现阶段掌阅科技基于生成式AI主要做的是怎么能为用户带来更好消遣形式的娱乐体验,图片和视频形式将在其中发挥重要作用。

在具体的实践过程中,并没有想象的那么简单,掌阅科技遇到了像部署和运营成本、生成式AI技术应用门槛、数据隐私和安全性等挑战。通过借助机器学习平台Amazon SageMaker和Stable Diffusion亚马逊云科技插件解决方案等技术,掌阅科技为用户提供了文生图、文生视频在内的多维度阅读交互方式,并大幅缩短了项目的调研、测试和部署周期。

通过将现有的Stable Diffusion模型训练、推理和调优等工作负载从本地服务器迁移至Amazon SageMaker,掌阅科技在文生图解决方案的开发效率上获得很大提升,具有安装便捷、可扩展性强、可协作性强的应用优势。并且Stable Diffusion亚马逊云科技插件解决方案的代码是开源的,掌阅科技可将其运用于LoRA训练,进一步优化文生图功能的性能表现。

“Stable Diffusion的开发是相当复杂的,我们曾经自己做过一个实验,过程并没有那么顺利。”孙凯说道,Stable Diffusion在技术的深度和广度上有一定的门槛,插件、LoRA、不同融合方案的选择通过亚马逊云科技的解决方案可以又快又好的完成。

掌阅科技选择亚马逊云科技主要基于三个原因,第一,提供丰富、安全、负责任的生成式AI产品:亚马逊云科技在生成式AI领域拥有全栈式技术布局;第二,提供广泛全面的数据管理、集成和治理能力:亚马逊云科技在数据存储、管理与安全方面提供非常专业的技术与服务;第三,提供基于生成式AI场景的赋能:亚马逊云科技不仅提供技术与解决方案,还在实际生成式AI应用场景与合作过程中给予非常多的资源支持与启发,实现能力共创。

在阅读的前中后期,生成式AI还有很多的结合场景,掌阅科技也在计划把生成式AI的能力融入到更多场景中,真正实现阅读效率和体验的第三次变迁。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1