🤖📈💻💡大模型动态
百度智能云千帆大模型平台推出千帆SDK开源版本
百度智能云升级推出免费开源的千帆SDK,包括数据集管理、模型训练、模型评估、服务部署等功能,助用户轻松构建大语言模型应用。
具体操作指引可点击链接查看:
https://github.com/baidubce/bce-qianfan-sdk/blob/main/cookbook/console-finetune/console-finetune.ipynb
【AiBase提要:】
🌟 升级免费SDK:百度智能云推出千帆SDK,全面开源,提供从数据管理到模型应用的全流程支持。
🚀 多功能应用:SDK支持对话补全、续写补全、语义向量等多种应用,助力用户开发大型语言模型应用。
📚 丰富资源:SDK提供实践案例、应用场景的cookbook,扩展了大语言模型应用的基础能力。
三星发布生成式AI模型Samsung Gauss
三星于2023年11月7日首次公开发布了生成式AI模型Samsung Gauss,旨在将其应用于未来的产品,包括语言、代码和图像模型,提高工作效率和用户体验。
【AiBase提要:】
🔹 三星首次公开发布生成式AI模型Samsung Gauss,用于未来产品。
🔹 Samsung Gauss包括语言、代码和图像模型,提高工作效率和设备控制。
🔹 三星致力于通过自己的AI红队确保AI的安全使用,保护消费者隐私。
思谋科技发布全球首个工业多模态大模型 IndustryGPT V1.0
思谋科技发布了全球首个工业多模态大模型 IndustryGPT V1.0,具备深度行业洞察和精炼数据,可应对制造业问题、识别工业缺陷,并与跨国企业合作推动智能制造进入新时代。
AiBase提要:
1. 🚀 思谋科技发布全球首个工业多模态大模型 IndustryGPT V1.0。
2. 🏭 这一大模型通过深度行业洞察和精炼数据,解答制造业问题、识别工业缺陷,并提供决策支持。
3. 🤝 思谋科技与跨国企业签署战略合作协议,共同推动全球工业制造进入智能时代。
🤖📱💼AI应用
美图旗下开拍APP推出“AI封面”功能
美图旗下开拍APP推出“AI封面”功能,利用智能生成技术根据图片和文案,帮助视频创作者更高效地制作爆款封面,包括图文生成和视频生成封面,同时支持文案润色。
【AiBase提要】:
1. “AI封面”是美图公司推出的功能,可以根据图片和文案智能生成视频封面,提高视频创作者的创作效率。
2. 用户只需上传照片和输入封面文案,系统即可生成十款爆款封面,并支持智能优化字体颜色、边框等,满足个性化需求。
3. 对于不擅长写封面文案的创作者,该功能还提供AI文案润色服务,降低了封面制作门槛。
支付宝上线新功能:免费生成AI写真 还可导出高清图
支付宝推出免费AI写真功能,用户可生成多种风格的照片,还支持导出高清图,并允许指定生成不同性别的自己。
【AiBase提要】
💡 支付宝新增AI写真功能,限时免费,每日登录可获得10张胶片,1张可生成4张写真。
💡 用户可选择不同风格的写真,包括古风、杂志风、航天员风格等。
💡 支付宝AI写真支持导出高清图,但保存1张照片需要扣除3张胶片。
Google Performance Max推生成式AI广告工具
Google最近推出的Performance Max将AI生成技术引入广告领域,帮助广告商生成高质量的广告内容,包括标题、描述和图像,提供更多的自定义选择和创意自由度。
【AiBase提要:】
🚀 Google Performance Max引入生成式AI广告工具,帮助广告商轻松创建高质量广告内容。
📝 广告代理和企业可以使用文本提示迭代生成广告,提高广告效果,同时避免生成相同的广告元素。
📷 AI驱动的图片编辑功能提供广告资源的图片部分编辑,提高广告吸引力,并简化创意审查流程。
PopSockets推AI定制工具 支持用户定制手机壳
智能手机外壳和配件制造商PopSockets推出AI定制工具,使用大型模型引擎,让用户个性化手机壳、手柄和钱包,并奖励最佳AI艺术作品。这一创新利用人工智能技术,提供更多创意可能性。
【AiBase提要】
1. PopSockets的AI定制工具基于大型模型引擎,允许用户个性化手机配件。
2. PopSockets举办竞赛,奖励最佳AI艺术作品,推动创造性。
3. 使用PopSockets Customizer AI,用户可以轻松创建专业照片,为产品添加文本或贴纸,提供独特的设计体验。
Plai Labs推文本到视频生成器PlaiDay
Plai Labs最新推出的PlaiDay是一款文本到视频生成工具,允许用户通过上传自拍照片并输入一些文字,生成个性化的短视频,基于AI平台Orchestra的技术开发。
地址:https://plaiday.io/app/
【AiBase提要】:
📌 Plai Labs推出PlaiDay工具,允许用户生成个性化短视频。
📌 Orchestra平台支持合作和连接的AI工具,不仅限于艺术创作。
📌 Plai Labs的技术为各行业提供AI应用,拓宽了AI技术的应用范围。
📰🤖📢AI新鲜事
Adobe回应有关AI生成加沙爆炸图像的争议
Adobe在拜登总统关于AI潜在社会危害的讲话后,对未标记为AI生成的加沙爆炸图像争议进行了回应。
【AiBase提要:】
💬 Adobe回应争议:Adobe就涉及未标记为AI生成的加沙爆炸图像争议发布声明,强调其库存图像标记要求。
🖼️ 图像争议引发抵制:澳大利亚媒体报道此图像,引发社交媒体上的抵制浪潮,涉及Adobe Stock上的其他逼真加沙图像。
👥 平台受到影响:争议导致库存图像贡献者担忧,认为涌入的生成AI图像损害了Adobe Stock平台,Adobe强调尊重第三方权利。
微软将租用Oracle的GPU超级集群以满足Bing Chat的GPU需求
微软计划将Bing搜索中的机器学习模型部分迁移到Oracle的GPU超级集群,以满足Bing Chat生成式AI聊天机器人的高需求,加强其AI服务。
【AiBase提要:】
🔸 微软与Oracle合作将Bing搜索中的机器学习模型部分迁移到GPU超级集群,以支持Bing Chat的高GPU需求。
🔸 合作旨在提高搜索速度和扩展客户访问,涵盖微软与Oracle在云基础设施领域的合作。
🔸 Oracle的GPU集群提供成千上万的Nvidia A100和H100GPU租赁,以满足微软的计算资源需求。
寒武纪与百川智能完成大模型适配
寒武纪的思元(MLU)云端智能加速卡与百川智能的大模型完成全面适配,加速了大模型从训练到部署的流程,提供了更高性能。
【AiBase提要】
1. 寒武纪思元(MLU)云端智能加速卡成功适配百川智能的大模型,提高了性能。
2. 合作涵盖多领域,包括大语言模型和视觉大模型。
3. 合作计划推动大模型在不同行业和场景的广泛应用。
人类或于2028年推出首个AGI?谷歌DeepMind提6条AGI标准
谷歌DeepMind的Shane Legg团队发布了AGI时间表论文,预测到2028年,有50%的可能性开发出首个AGI,同时提出AGI的6个标准和5个等级。
【AiBase提要:】
📅 AGI时间表:Shane Legg团队预测人类可能在2028年开发出首个AGI,引发广泛关注。
📚 定义标准:论文提出AGI的6个标准,包括性能、通用性、认知任务等,为AGI测评提供指导。
🤖 大语言模型:现代大语言模型已经迈向AGI雏形,展现出元认知能力和广泛任务完成潜力。
投资 Hugging Face 的 IBM 启动5亿美元企业人工智能风险基金
IBM宣布启动5亿美元的风险投资基金,专注于投资人工智能公司,以加速生成式人工智能技术的研究和应用。
【AiBase提要】
🚀 IBM启动5亿美元风险投资基金,专注于人工智能公司。
💡 基金将支持全球企业实现人工智能商业潜力。
🤝 IBM积极投资于Hugging Face等领先人工智能公司。
OpenAI发布ChatGPT更新或导致部分AI初创公司倒闭
OpenAI发布的最新ChatGPT更新可能让围绕PDF分析构建的多家AI公司失去竞争力,引发担忧,尤其是包装器的添加可能影响小型AI初创公司。
ℹ️ 【AiBase提要】:
1️⃣ OpenAI的最新更新引发担忧,特别是包装器的添加,可能影响小型AI初创公司,尤其是那些围绕PDF分析构建的公司。
2️⃣ 这一举措引发了一些公司的担忧,包括Stripe产品负责人Sahar Mor的担忧,他认为这可能导致一些车载人工智能公司倒闭。
3️⃣ OpenAI作为最大的大型语言模型开发者,具备资源来应对监管要求,而规模较小的AI初创公司可能受到监管的抑制。
👨💻💡🎯聚焦开发者
清华、中科院、MIT联合提出Co-Pilot人机交互框架
清华、中科院和MIT的科研人员合作研发了Co-Pilot人机交互框架,首次将大语言模型用于辅助驾驶,以描述方式控制车辆行动轨迹,并成功满足乘客的意图。
论文地址:https://www.researchgate.net/figure/Co-Pilot-for-path-tracking-control-The-system-consists-of-three-modules-the-Reference_fig2_374800815
【AiBase提要:】
🚗 首次尝试使用语言模型辅助驾驶,以描述方式控制车辆轨迹。
🤖 Co-Pilot人机交互框架能够理解和满足乘客的意图。
🔬 这项研究揭示了大语言模型在自动驾驶领域的应用潜力,为未来研究提供了方向。
斯坦福大学提出RT-Sketch 手绘轮廓助机器人完成任务
斯坦福大学研究人员提出了RT-Sketch,一种目标导向操作策略,使用手绘草图作为机器人任务规范,改进了视觉任务中的机器人操作。
项目地址:https://rt-sketch.github.io/
【AiBase提要】
📌 RT-Sketch是一目标导向策略,使用手绘草图作为机器人任务规范,提高了任务的准确性。
📌 研究人员使用生成对抗网络将图像转化为草图,构建了训练数据集,使RT-Sketch能够接受不同精细程度的草图作为输入。
📌 RT-Sketch在处理模糊语言目标或视觉干扰时表现出色,为人机交互和机器人技术带来了新可能性。
多模态音乐AI框架Video2Music 为视频生成情感相符的音乐
多模态音乐AI框架Video2Music 利用前沿Transformer模型,根据视频内容生成情感相符的音乐,为视频创作者提供更好的音乐配乐选项。
项目地址:https://github.com/amaai-lab/video2music
【AiBase提要】
🎵 Video2Music使用Transformer架构生成音乐,确保音乐与视频内容匹配。
🎶 利用独特的数据集和验证的转换器模型,捕捉视频中的情感变化并转化为音乐情感表达。
🎥 为用户创造更个性化和情感丰富的音乐与视频体验,为未来音乐和视频领域带来更多可能性。
新NeRF技术: 视频转化为可控制的3D模型
Fraunhofer Heinrich Hertz研究团队引入NeRF技术,将标准RGB视频转化为可控制的3D人体模型,降低数字人物模型制作成本,拓展电影、游戏、虚拟现实等领域的应用可能。
【AiBase提要】:
1. Fraunhofer Heinrich Hertz研究团队使用NeRF技术简化数字人物创建,从标准RGB视频生成可控制的3D人体模型。
2. NeRF技术通过预测光线与场景的交互创造逼真的3D图像,提供新途径实现多角度人物动作。
3. 这项创新有望降低数字人物模型制作成本,对电影、游戏、虚拟现实等领域带来积极影响,拓展应用可能性。
中国研究人员推ControlLLM框架:提升大语言模型处理多模态任务能力
中国的研究人员提出ControlLLM框架,旨在增强大型语言模型处理复杂多模态任务,提高准确性和效率。
【AiBase提要】
🔍 中国研究人员提出ControlLLM框架,用于增强大型语言模型(LLMs)在处理复杂任务中的表现。
🔍 ControlLLM通过任务分解、Thoughts-on-Graph方法和多功能执行引擎提高工具利用的准确性和效率。
🔍 这一创新提高了多模态任务的成功率,使LLMs能够更好地处理包括图像、音频和视频在内的不同信息类型。