9月19日,由阿里巴巴智能信息事业群、潇湘晨报社联合举办的“AIGC与场景化应用创新”主题研讨会在长沙召开。阿里巴巴智能信息事业群夸克视觉技术负责人黄锐华以《AI图像技术引领产业变革与创新》为主题,带来了精彩分享。在他看来,随着AI大模型技术逐渐深入到应用层面,手机办公学习的功能和体验迎来了全面升级。
黄锐华介绍,AIGC和大模型给在线办公和教育已经在识别精度、任务类型及应用场景等方面带来突破。以识别精度的突破为例,手写字符识别准确率97%-98%提升至99%+;复杂公式识别准确率99%;模糊文本识别准确率领先。“像分数、矩阵、分段函数、三角函数、积分、微分等类型全覆盖,复杂公式准确率更高,识别能力是完全领先的。”
黄锐华表示,夸克扫描王已形成扫描能力、图像能力、内容识别和版式理解能力及学习效率工具的能力矩阵。
除了领先的识别能力,在英文解题、数学大题解题及语文作文批改上也能实现技术应用。“例如英语的阅读理解、完形填空,数学的选择、判断,语文的错别字、语法批改,这些的应用都能大幅度节省人力。老师可通过此技术批改试卷,家长辅导作业时遇到不会的题目也可通过AI解答并解释知识点。”
此外,当被扫描内容模糊或有污渍时,夸克扫描王可以自动修复并提升清晰度。针对手机扫描容易出现的角度不正、版面不平整、字迹模糊等常见问题,该产品能通过智能算法和图像识别进行文档摆正、矫正以及字迹高清等处理;手写表单,也可基于位置和语义进行列对齐。
文档结构化理解,也就是将图像转化成word格式,这个作为基础能力非常重要也很具有挑战。 利用AIGC技术,相比传统方法,能够更好地对任务进行建模,经过大规模数据训练,能够大幅提升文档理解水平。黄锐华表示,Ai算法让扫描内容更精准更清晰,同时提供强大的编辑、管理能力,给用户带来全新信息服务体验。
潇湘晨报记者张沁 摄影记者谢长贵