封面新闻记者 张越熙
近年来,随着移动办公、学习需求的爆发,手机扫描市场悄然生变。据夸克扫描王数据显示,用户扫描学习相关内容数量长期位居第一;职场人群的扫描内容量过去一年增长三倍。同时,Z世代用户不仅要求扫得清晰,他们对编辑、分享、存储乃至创作都有了更加个性化的需求,而传统的手机扫描已经很难满足这一变化。
随着AI大模型技术逐渐深入到应用层面,手机扫描的功能和体验迎来了全面升级。8月29日,记者获悉,阿里智能信息事业群推出搭载AI大模型技术的手机扫描产品“夸克扫描王App”,集合高清扫描、提取文字、格式转换、去除手写笔迹、自拍证件照等20余种功能,能够精准、高效地识别、分析与理解复杂内容。
AI大模型技术能力能给扫描如何赋能?据悉,基于大语言模型的结果优化,能够实现在复杂场景下模仿人类思维,更精准地识别、分析和提取文字、公式及图片等内容,从而实现更佳的扫描效果。记者体验时发现,当被扫描文字存在阴影遮挡或破损等情况,其可以在结合数据库里的训练样本后,根据上下文的语义解析,进行匹配定位,从而扫描出清晰、平整、有逻辑的电子文档。
相关负责人介绍,过去一年,夸克扫描王自研的AI大模型,通过对海量图文数据的训练,首次将多模算法引入文字识别领域,让公式识别、手写识别的效果大幅度提升,印刷文字识别精度为99.99%,手写文字识别精度超过98.5%。同时,将游戏引擎数据模拟方法与半监督模型训练方法引入到文档扫描的模型开发中,可以提升文档矫正、字迹清晰度、背景杂质擦除效果。扫描是用户资产数字化的重要场景,搭载AI大模型的能力后,一方面可以让被扫描内容呈现出更好的效果,也会让用户拥有更加自由的创作空间,进而帮助用户实现扫描场景下的提质增效。
今年是大模型备受关注的一年,企业场景与行业应用则是高频词。大模型的应用场景不断丰富,如阿里云通义万相可辅助人类进行图片创作,应用于艺术设计、电商、游戏和文创等应用场景。在MaaS赛道中,腾讯云公布了行业大模型生态计划,并依托打造行业大模型精选商店。百度也曾公开表示,文心千帆大模型平台会作为一个大模型生产平台,让企业基于任何大模型开发自己的专属大模型。
据不完全统计,截至2023年5月底,中国10亿级参数规模以上大模型已发布了79个,“自研大模型热”仍将持续。华西证券表示,对于头部科技公司,立足已有禀赋布局AI大模型,将是未来重要的增收。在供给侧持续高爆发的情况下,应用侧有望爆发,服务场景有望进一步拓宽。