当前位置:首页|资讯|AI大模型|微软|商汤|Midjourney

商汤AI大模型发布:比微软更精确,比Midjourney更快!

作者:清博智能发布时间:2023-04-10

原标题:商汤AI大模型发布:比微软更精确,比Midjourney更快!

今日(4月10日)商汤科技宣布推出大模型体系“日日新大模型”,其中对用户高度关注的语言问答和图片AI生成功能部分,商汤在活动中做了多种应用场景的实机演示,并且多次邀请与会嘉宾在会后去体验产品,显示出商汤对产品完成度的高度自信。

商汤大模型“日日新”名称取自《礼记·大学》中的“苟日新,日日新,又日新”,体现大模型日新月异,不断进化之意。

日日新大模型包括自然语言生成、文生图、感知模型标注、以及模型研发功能。商汤称其大模型从2019年开始研发,目前整体参数量达到5000亿,今年目标达到万亿。

用户最关心的功能之一——中文语言大模型应用平台,商汤将其命名为“商量”,希望AI能在商量的过程中帮助用户解决问题。“商量”平台目前参数量为1800亿。

在这部分的介绍中,商汤首先实机演示了包括生成品牌名称、邀请函、续写儿童故事等场景,展示了多轮对话和超长文本的理解能力。

在超长文本的理解能力方面,在向“商量”提供长达24页的《中国专利法》PDF文件后,“商量”能够快速理解相关法条,并回答用户提出的问题。

同时,“商量”还集成了“AI代码助手”功能,商汤称在其内部公司的测试中,代码助手将编程效率提升62%,一次通过率达到40.2%,商汤称该通过率高于微软此前公布的Copilot。

在实机演示中,商汤还展示了“商量”在医疗领域的应用。在用户提出症状后,“商量”并没有直接给出病情诊断,而是在多次询问病情后才给出了可能的病症和求医科室建议,相较以往的通过网络搜索查询病情,“商量”的方式更注重引导,更类似真正的问诊体验。

商汤称,目前“问诊助手”功能已在包括新华医院在内的多家医院落地,未来有望面向更多医院开放。

之后,商汤公布了其自研的生成式AI应用系列,剑指实现多模态大模型的终极目标;包括文生图工具“秒画”、AI数字人生成工具“如影”、3D建模快速生成工具“琼影”和“格物”。

“秒画”可理解为对标Midjourney的AI绘图产品,并实现了部分Civitai(C站)功能,尤其值得注意的是,“秒画”实现了2秒出图和自训练功能。

在自训练方面,商汤在现场演示中向AI“投喂”20张香港明星照片生成港星风格,之后用户便可使用该种风格快速生成图片,全程不需要编程和调试,只需要准备20张风格一致的图片即可。

在生成图片界面,类似Midjourney的逻辑,用户只需要在选定风格后输入提示词即可生成,且比Midjourney更加人性化的是,用户可以自己选择生成图片的数量、分辨率、长宽比等,图片生成的速度也比Midjourney更快。

AI生成式数字人应用“如影”,可快速生成数字人,并定制包括主播样貌风格、场景、语言等多种元素,主要应用于直播、短视频等领域。

制作过程中,用户只需要一台智能手机和录制5分钟视频,便可由AI生成全部要素供用户定制。

“琼影”和“格物”是本次商汤发布的场景和建模AI生成工具,可快速生成大到城市、小到花朵的建模,且建模可实现实时互动。

“琼影”、“格物”配合之前的快速生成数字人技术“如影”,可在商业广告、直播间等场景下应用。

徐立在活动后对记者表示,在这个时间点推出大模型体系,是希望吸引更多下游用户,自然语言模型能够把各种垂直类的任务串联起来,用多模态混合的模式迭代行业场景。通过提供新的多模态训练框架,训练下一个阶段的多模态大模型,通过细分场景端到端的迭代和应用,帮助多模态大模型的发展。目前已有8家商业客户使用商汤多模态训练框架进行大模型训练。“我们希望我们的大模型体系能够帮助行业生产出下一代最领先的多模态模型,并且升级性能。”

作者:鹤山 排版:骆伟玲

图片源于Q仔互联网冲浪所得,若有侵权,后台联系,Q仔滑跪删除~


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1