这道题,是时候可以交给“会看”的大模型来处理了。其次是语音大模型方面,豆包·音乐模型现在可以直接生成3分钟完整音乐!由此可见,这一次,豆包大模型在“说”、“唱”、“看”三大维度上确实是提升了不小的实力。在把A…
编程
量子位 2024-12-19
实验表明,不同的模型在这件事上喜好也不一样,比如基于Claude3.5Sonnet的智能体,就会表现出极强的合作意识。每个桌上坐了12个智能体,它们各自手中都握有一定量的“资源”,系统会从这12名玩家中随机抽…
Claude3谷歌
新模型仅用1分钟就能生成5秒长的视频,比之前提速8倍,步骤也从50步减少到了6步,甚至画面细节也更逼真了。此外,他们还结合了预计算潜变量和预计算文本嵌入,用户可以根据自己的硬件条件选择不同的微调方式来执行命令…
腾讯Sora
机器人忙碌而有序地穿梭在病区中,有的运送药品、器械,有的处理医疗废物,有的专门执行消杀任务;大模型应用帮助分析病情、提供诊疗建议,成为医生不可或缺的好帮手;AI数字人随时待命,有问必答,迅速回答病患提出的各种…
医疗数字人
IT时报 2024-12-19
在2024数字科技生态大会上,中国电信公布了目前的商业化进程,已面向政务、工业、教育等领域推出50多个场景大模型,重点打造80多个行业大模型和20个行业智能体,提供“算力+平台+数据+模型+应用”的一体化服务…
Sora教育
豆包大模型多款产品也迎来重要更新:豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,更是在业界首次实现精准生…
字节跳动
讯飞星火智能批阅机减少80%作业批改时间在上海市育才初级中学,老师们正在试用讯飞星火智能批阅机,只需三步就能完成试卷批阅。现场,科大讯飞研究院院长刘聪发布了这台“讯飞星火智能批阅机”,演示了它批改作业的全流程…
科大讯飞
在12月18日举办的火山引擎Force大会上,字节跳动正式发布发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片…
动点科技 2024-12-19
结果中,微软Copilot、讯飞星火和ima给出的答案最令人满意,ima还提到该路牌的使用源于美国,和电影的背景发生地相符;Gemini(1.5Flash)和Grok(Grok-2)的答案容易让人越看越迷糊,…
ChatGPTCopilot微软
谈及开源原因,CreateAI表示,模型定位于“能够个人使用的最佳开源图生视频大模型”,将真正赋能有梦想的创作者,让用户能够更高效地使用,进而更好地创建用户生态社区,这同时也是CreateAI在生成式AI领域…
生成式AI
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1