AI视野：百度推千帆SDK开源版本；支付宝上线AI写真功能；

作者：站长之家发布时间：2023-11-25

百度生成式AI 大语言模型

🤖📈💻💡大模型动态

百度智能云千帆大模型平台推出千帆SDK开源版本

百度智能云升级推出免费开源的千帆SDK，包括数据集管理、模型训练、模型评估、服务部署等功能，助用户轻松构建大语言模型应用。

具体操作指引可点击链接查看:

https://github.com/baidubce/bce-qianfan-sdk/blob/main/cookbook/console-finetune/console-finetune.ipynb

【AiBase提要:】

🌟 升级免费SDK:百度智能云推出千帆SDK，全面开源，提供从数据管理到模型应用的全流程支持。

🚀 多功能应用:SDK支持对话补全、续写补全、语义向量等多种应用，助力用户开发大型语言模型应用。

📚 丰富资源:SDK提供实践案例、应用场景的cookbook，扩展了大语言模型应用的基础能力。

三星发布生成式AI模型Samsung Gauss

三星于2023年11月7日首次公开发布了生成式AI模型Samsung Gauss，旨在将其应用于未来的产品，包括语言、代码和图像模型，提高工作效率和用户体验。

【AiBase提要:】

🔹 三星首次公开发布生成式AI模型Samsung Gauss，用于未来产品。

🔹 Samsung Gauss包括语言、代码和图像模型，提高工作效率和设备控制。

🔹 三星致力于通过自己的AI红队确保AI的安全使用，保护消费者隐私。

思谋科技发布全球首个工业多模态大模型 IndustryGPT V1.0

思谋科技发布了全球首个工业多模态大模型 IndustryGPT V1.0，具备深度行业洞察和精炼数据，可应对制造业问题、识别工业缺陷，并与跨国企业合作推动智能制造进入新时代。

AiBase提要:

1. 🚀 思谋科技发布全球首个工业多模态大模型 IndustryGPT V1.0。

2. 🏭 这一大模型通过深度行业洞察和精炼数据，解答制造业问题、识别工业缺陷，并提供决策支持。

3. 🤝 思谋科技与跨国企业签署战略合作协议，共同推动全球工业制造进入智能时代。

🤖📱💼AI应用

美图旗下开拍APP推出“AI封面”功能

美图旗下开拍APP推出“AI封面”功能，利用智能生成技术根据图片和文案，帮助视频创作者更高效地制作爆款封面，包括图文生成和视频生成封面，同时支持文案润色。

【AiBase提要】:

1. “AI封面”是美图公司推出的功能，可以根据图片和文案智能生成视频封面，提高视频创作者的创作效率。

2. 用户只需上传照片和输入封面文案，系统即可生成十款爆款封面，并支持智能优化字体颜色、边框等，满足个性化需求。

3. 对于不擅长写封面文案的创作者，该功能还提供AI文案润色服务，降低了封面制作门槛。

支付宝上线新功能:免费生成AI写真还可导出高清图

支付宝推出免费AI写真功能，用户可生成多种风格的照片，还支持导出高清图，并允许指定生成不同性别的自己。

【AiBase提要】

💡 支付宝新增AI写真功能，限时免费，每日登录可获得10张胶片，1张可生成4张写真。

💡 用户可选择不同风格的写真，包括古风、杂志风、航天员风格等。

💡 支付宝AI写真支持导出高清图，但保存1张照片需要扣除3张胶片。

Google Performance Max推生成式AI广告工具

Google最近推出的Performance Max将AI生成技术引入广告领域，帮助广告商生成高质量的广告内容，包括标题、描述和图像，提供更多的自定义选择和创意自由度。

【AiBase提要:】

🚀 Google Performance Max引入生成式AI广告工具，帮助广告商轻松创建高质量广告内容。

📝 广告代理和企业可以使用文本提示迭代生成广告，提高广告效果，同时避免生成相同的广告元素。

📷 AI驱动的图片编辑功能提供广告资源的图片部分编辑，提高广告吸引力，并简化创意审查流程。

PopSockets推AI定制工具支持用户定制手机壳

智能手机外壳和配件制造商PopSockets推出AI定制工具，使用大型模型引擎，让用户个性化手机壳、手柄和钱包，并奖励最佳AI艺术作品。这一创新利用人工智能技术，提供更多创意可能性。

【AiBase提要】

1. PopSockets的AI定制工具基于大型模型引擎，允许用户个性化手机配件。

2. PopSockets举办竞赛，奖励最佳AI艺术作品，推动创造性。

3. 使用PopSockets Customizer AI，用户可以轻松创建专业照片，为产品添加文本或贴纸，提供独特的设计体验。

Plai Labs推文本到视频生成器PlaiDay

Plai Labs最新推出的PlaiDay是一款文本到视频生成工具，允许用户通过上传自拍照片并输入一些文字，生成个性化的短视频，基于AI平台Orchestra的技术开发。

地址:https://plaiday.io/app/

【AiBase提要】:

📌 Plai Labs推出PlaiDay工具，允许用户生成个性化短视频。

📌 Orchestra平台支持合作和连接的AI工具，不仅限于艺术创作。

📌 Plai Labs的技术为各行业提供AI应用，拓宽了AI技术的应用范围。

📰🤖📢AI新鲜事

Adobe回应有关AI生成加沙爆炸图像的争议

Adobe在拜登总统关于AI潜在社会危害的讲话后，对未标记为AI生成的加沙爆炸图像争议进行了回应。

【AiBase提要:】

💬 Adobe回应争议:Adobe就涉及未标记为AI生成的加沙爆炸图像争议发布声明，强调其库存图像标记要求。

🖼️ 图像争议引发抵制:澳大利亚媒体报道此图像，引发社交媒体上的抵制浪潮，涉及Adobe Stock上的其他逼真加沙图像。

👥 平台受到影响:争议导致库存图像贡献者担忧，认为涌入的生成AI图像损害了Adobe Stock平台，Adobe强调尊重第三方权利。

微软将租用Oracle的GPU超级集群以满足Bing Chat的GPU需求

微软计划将Bing搜索中的机器学习模型部分迁移到Oracle的GPU超级集群，以满足Bing Chat生成式AI聊天机器人的高需求，加强其AI服务。

【AiBase提要:】

🔸 微软与Oracle合作将Bing搜索中的机器学习模型部分迁移到GPU超级集群，以支持Bing Chat的高GPU需求。

🔸 合作旨在提高搜索速度和扩展客户访问，涵盖微软与Oracle在云基础设施领域的合作。

🔸 Oracle的GPU集群提供成千上万的Nvidia A100和H100GPU租赁，以满足微软的计算资源需求。

寒武纪与百川智能完成大模型适配

寒武纪的思元（MLU）云端智能加速卡与百川智能的大模型完成全面适配，加速了大模型从训练到部署的流程，提供了更高性能。

【AiBase提要】

1. 寒武纪思元（MLU）云端智能加速卡成功适配百川智能的大模型，提高了性能。

2. 合作涵盖多领域，包括大语言模型和视觉大模型。

3. 合作计划推动大模型在不同行业和场景的广泛应用。

人类或于2028年推出首个AGI?谷歌DeepMind提6条AGI标准

谷歌DeepMind的Shane Legg团队发布了AGI时间表论文，预测到2028年，有50%的可能性开发出首个AGI，同时提出AGI的6个标准和5个等级。

【AiBase提要:】

📅 AGI时间表:Shane Legg团队预测人类可能在2028年开发出首个AGI，引发广泛关注。

📚 定义标准:论文提出AGI的6个标准，包括性能、通用性、认知任务等，为AGI测评提供指导。

🤖 大语言模型:现代大语言模型已经迈向AGI雏形，展现出元认知能力和广泛任务完成潜力。

投资 Hugging Face 的 IBM 启动5亿美元企业人工智能风险基金

IBM宣布启动5亿美元的风险投资基金，专注于投资人工智能公司，以加速生成式人工智能技术的研究和应用。

【AiBase提要】

🚀 IBM启动5亿美元风险投资基金，专注于人工智能公司。

💡 基金将支持全球企业实现人工智能商业潜力。

🤝 IBM积极投资于Hugging Face等领先人工智能公司。

OpenAI发布ChatGPT更新或导致部分AI初创公司倒闭

OpenAI发布的最新ChatGPT更新可能让围绕PDF分析构建的多家AI公司失去竞争力，引发担忧，尤其是包装器的添加可能影响小型AI初创公司。

ℹ️ 【AiBase提要】:

1️⃣ OpenAI的最新更新引发担忧，特别是包装器的添加，可能影响小型AI初创公司，尤其是那些围绕PDF分析构建的公司。

2️⃣ 这一举措引发了一些公司的担忧，包括Stripe产品负责人Sahar Mor的担忧，他认为这可能导致一些车载人工智能公司倒闭。

3️⃣ OpenAI作为最大的大型语言模型开发者，具备资源来应对监管要求，而规模较小的AI初创公司可能受到监管的抑制。

👨‍💻💡🎯聚焦开发者

清华、中科院、MIT联合提出Co-Pilot人机交互框架

清华、中科院和MIT的科研人员合作研发了Co-Pilot人机交互框架，首次将大语言模型用于辅助驾驶，以描述方式控制车辆行动轨迹，并成功满足乘客的意图。

论文地址:https://www.researchgate.net/figure/Co-Pilot-for-path-tracking-control-The-system-consists-of-three-modules-the-Reference_fig2_374800815

【AiBase提要:】

🚗 首次尝试使用语言模型辅助驾驶，以描述方式控制车辆轨迹。

🤖 Co-Pilot人机交互框架能够理解和满足乘客的意图。

🔬 这项研究揭示了大语言模型在自动驾驶领域的应用潜力，为未来研究提供了方向。

斯坦福大学提出RT-Sketch 手绘轮廓助机器人完成任务

斯坦福大学研究人员提出了RT-Sketch，一种目标导向操作策略，使用手绘草图作为机器人任务规范，改进了视觉任务中的机器人操作。

项目地址:https://rt-sketch.github.io/

【AiBase提要】

📌 RT-Sketch是一目标导向策略，使用手绘草图作为机器人任务规范，提高了任务的准确性。

📌 研究人员使用生成对抗网络将图像转化为草图，构建了训练数据集，使RT-Sketch能够接受不同精细程度的草图作为输入。

📌 RT-Sketch在处理模糊语言目标或视觉干扰时表现出色，为人机交互和机器人技术带来了新可能性。

多模态音乐AI框架Video2Music 为视频生成情感相符的音乐

多模态音乐AI框架Video2Music 利用前沿Transformer模型，根据视频内容生成情感相符的音乐，为视频创作者提供更好的音乐配乐选项。

项目地址:https://github.com/amaai-lab/video2music

【AiBase提要】

🎵 Video2Music使用Transformer架构生成音乐，确保音乐与视频内容匹配。

🎶 利用独特的数据集和验证的转换器模型，捕捉视频中的情感变化并转化为音乐情感表达。

🎥 为用户创造更个性化和情感丰富的音乐与视频体验，为未来音乐和视频领域带来更多可能性。

新NeRF技术: 视频转化为可控制的3D模型

Fraunhofer Heinrich Hertz研究团队引入NeRF技术，将标准RGB视频转化为可控制的3D人体模型，降低数字人物模型制作成本，拓展电影、游戏、虚拟现实等领域的应用可能。

【AiBase提要】:

1. Fraunhofer Heinrich Hertz研究团队使用NeRF技术简化数字人物创建，从标准RGB视频生成可控制的3D人体模型。

2. NeRF技术通过预测光线与场景的交互创造逼真的3D图像，提供新途径实现多角度人物动作。

3. 这项创新有望降低数字人物模型制作成本，对电影、游戏、虚拟现实等领域带来积极影响，拓展应用可能性。

中国研究人员推ControlLLM框架:提升大语言模型处理多模态任务能力

中国的研究人员提出ControlLLM框架，旨在增强大型语言模型处理复杂多模态任务，提高准确性和效率。

【AiBase提要】

🔍 中国研究人员提出ControlLLM框架，用于增强大型语言模型（LLMs）在处理复杂任务中的表现。

🔍 ControlLLM通过任务分解、Thoughts-on-Graph方法和多功能执行引擎提高工具利用的准确性和效率。

🔍 这一创新提高了多模态任务的成功率，使LLMs能够更好地处理包括图像、音频和视频在内的不同信息类型。

新报观察 2024-12-30

AI视野：百度推千帆SDK开源版本；支付宝上线AI写真功能；

推荐体验

相关资讯

早资道 | 支付宝研发掌纹支付功能；百度“文心一言”定档3月16日

支付宝在AI大模型时代

支付宝又有大动作！

支付宝为蚂蚁再探路

支付宝不甘再做“工具人”

近期资讯

山西绿建智造取得中空玻璃加工用磨削加工机专利，避免玻璃破碎

广西华悦木业取得胶合板表面毛刺去除装置专利，能够对不同尺寸的胶合板进行固定打磨

如何轻松设置电脑自动关机，提升工作与生活效率的实用指南

四川佛能达取得防火玻璃生产用倒角机专利，方便对不同防火玻璃倒角过程中的限位工作

如何轻松设置Windows 10的锁屏时间，提升使用体验与安全性

中建二局第三建筑取得模板毛边打磨装置专利，提高装置的打磨效率

如何轻松设置QQ聊天背景，提升个性化聊天体验

如何选择与佩戴耳机，提升音乐体验的全面指南

南通向阳光学元件取得半自动光学玻璃的侧边加工机专利，方便对光学玻璃调整方向

如何轻松连接电视网络，享受丰富的娱乐体验

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响