百度文心智能体平台免费开放文心4.0
据百度官方消息,百度文心智能体平台(AgentBuilder)免费开放了文心大模型4.0。开发者在文心智能体平台上制作智能体时,可灵活选择文心大模型3.5或4.0版本。文心4.0版本的免费开放,提升了百度文心智能体平台的能力边界。目前已经有20万开发者、6.3万企业加入百度文心智能体平台。
支付宝发布多模态医疗大模型,支持千亿级视觉识别
在2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正 式亮相,成为国内首批多模态医疗大模型之一。基于蚂蚁百灵的多模态能力,该模型可实现直接理解并训练音频、视频、图、文等多模态数据,支持千亿级视觉识别。测试期间,对诊疗报告、医学药品、毛发状况等识别准确率达90%以上。
阿里旗下通义App上线AI画具“追星星的AI”
7月5日消息,阿里旗下通义App上线AI画具“追星星的AI”,这是国内首个关照孤独症儿童的AI绘本工具。该公益产品由阿里巴巴携手上海美术电影制片厂、中国青少年发展基金会“阅读中国”基金,孤独症儿童干预机构恒星乐乐、海豚乐乐联合发布。
商汤发布可控人物视频生成大模型Vimi,实现分钟级视频
世界人工智能大会期间,由商汤科技打造的首个面向C端用户的可控人物视频生成大模型Vimi亮相。商汤介绍,Vimi能够实现精准的人物表情控制,还可实现在半身区域内控制照片中人物的自然肢体变化,并自动生成与人物相符的头发、服饰及背景变化,可稳定生成1分钟的单镜头人物类视频。据悉,Vimi将完全面向C端用户开放使用。
商汤科技发布“日日新5o”,实时多模态流式交互对标GPT-4o
今日,上海2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)战略合作伙伴商汤科技召开“大爱无疆·向新力”人工智能论坛,发布国内首个所见即所得模型“日日新5o”。
据了解,日日新5o模型交互体验对标GPT-4o,有望实现全新AI交互模式。
混元DiT推出小显存版本,并开源caption模型
腾讯混元文生图大模型(混元DiT)宣布开源小显存版本,仅需6G显存即可运行,该版本与LoRA、ControlNet等插件,都已适配至Diffusers库;并新增对Kohya图形化界面的支持,让开发者可以低门槛地训练个性化LoRA模型;同时,混元DiT模型升级至1.2版本,在图片质感与构图方面均有所提升。此外,腾讯宣布混元文生图打标模型“混元Captioner”正式对外开源。
Lanmeih/今日话题
哪个行业的大模型应用,你最期待?
咱们评论区聊聊~