大家好,欢迎来到本期AI前沿速报。本期内容包括:阿卜杜拉国王科技大学博士朱德尧分享构建视觉语言理解能力的方法,阿里巴巴云推出AI图像生成模型“同一万象”,喜剧演员Sarah Silverman等人起诉OpenAI和Meta侵犯版权等。我们希望通过这些资讯,让大家了解到AI技术的前沿进展,并引发对AI接下来发展的思考与讨论。请大家关注、点赞、转发这篇内容,让更多的人了解AI的日新月异变化。
1. 【阿卜杜拉国王科技大学博士朱德尧分享构建视觉语言理解能力的方法】
阿卜杜拉国王科技大学在读博士朱德尧将在AI新青年讲座上分享他使用大型语言模型为MiniGPT-4构建视觉语言理解能力的方法。他通过将开源的视觉模型与先进的大型语言模型对齐,成功复现了GPT-4的视觉语言能力。朱德尧将深度讲解基于先进LLM的视觉语言理解能力构建,并分享MiniGPT-4的应用案例。讲座将于7月10日晚7点举行。
2. 【研究人员提出了一种名为DDPO的策略梯度算法,可以通过黑盒奖励函数优化扩散模型】
研究人员通过使用强化学习训练扩散模型,取得了显著的进展,提高了提示-图像对齐和优化传统提示方法难以表达的目标。DDPO是一类专为此目的设计的策略梯度算法。研究团队通过利用LLaVA等大型视觉语言模型的反馈,改善了提示-图像对齐,取得了显著进展。研究结果显示,DDPO在各种奖励函数上的表现令人满意,对于可压缩性、不可压缩性和美学质量等目标的优化都有显著提升。然而,奖励过度优化和基于提示的对齐方法的漏洞等挑战需要进一步研究。这些发现为扩散模型在图像生成和完成任务方面的研究和开发提供了新的机会。
3. 【阿里巴巴云推出AI图像生成模型“同一万象”】
阿里巴巴云在2023年世界人工智能大会上宣布推出新的AI图像生成模型“同一万象”,企业客户可以参与该模型的测试。该模型可以根据中英文文本提示生成各种风格的图像,包括水彩画、油画、素描、扁平插图和3D卡通等。此外,该模型还可以通过“风格转换”将一张图像转换成另一张具有相似视觉风格的图像。该模型利用阿里巴巴云在知识整理、视觉AI和自然语言处理等领域的先进技术,具有强大的语义理解能力,提高了图像质量和上下文相关性。
4. 【喜剧演员Sarah Silverman等人起诉OpenAI和Meta侵犯版权】
喜剧演员Sarah Silverman、作家Christopher Golden和Richard Kadrey分别在美国地方法院起诉OpenAI和Meta侵犯版权。起诉称,OpenAI的ChatGPT和Meta的LLaMA是在非法获取的数据集上进行训练的,这些数据集包含了他们的作品。起诉还指出,这些作品可以通过“影子图书馆”网站以及种子系统批量获取。作者们寻求法定赔偿、利润归还等。此类诉讼挑战了版权的极限。目前OpenAI、Meta和律师事务所尚未回应请求置评。
5. 【AI风险和监管引发全球讨论】
近几周,全球关于AI风险和监管的讨论出现了一些重要进展。美国就OpenAI的听证会和欧盟关于修订AI法案的公告都呼吁加强监管。然而,尽管对风险的认识日益增加,但对监管的具体形式和审计重点仍缺乏共识。在世界经济论坛举办的首届生成式AI峰会上,AI高管们就如何应对这些伦理和监管考虑进行了讨论,其中两个关键主题是:需要负责任和可追溯的AI审计,以及有关当局需要明确和广泛定义AI技术的建设标准,并向消费者和员工明确这些标准。这些新的监管要求对人力资源团队和企业高管产生了影响,他们需要推动负责任的AI采用和意识,以及了解技术和监管环境,制定负责任的AI战略。
6. 【AI模型开发的三种道德有效方法】
AI模型存在偏见问题,但大公司不等待问题消失就开始采用AI,这使得解决AI模型面临的主要挑战变得更加紧迫。为了减少偏见,开发者应该选择正确的训练方法,避免过度依赖大数据,平衡文献和现实数据,并在AI模型中建立透明度。只有这样,AI才能真正减少医疗、招聘、借贷、司法等行业中的人为偏见。
7. 【AI GIF生成器】
Simplified、DALL-E 2、Gfycat、Meta Make-A-Video、Imgflip、Mage Space、Artbreeder和Picsart。这些工具都能够帮助用户轻松制作出专业级的GIF动画,无论是在设计编辑方面还是在内容库和搜索功能方面都提供了丰富的选择。这些AI GIF生成器的出现,让制作个性化、有趣的GIF变得更加简单和便捷。
8. 【MIT研究人员开发出自动化机器学习系统BioAutoMATED】
麻省理工学院的研究人员开发出一种名为BioAutoMATED的创新解决方案,用于简化机器学习模型的构建过程。这个自动化机器学习系统可以帮助生物学家选择合适的模型和预处理数据,大大减少了时间和精力的投入。研究人员认为,BioAutoMATED可以为生物学和机器学习之间的更有效合作铺平道路,并促进生物学和机器学习领域的交叉发展。该系统已经开源,鼓励其他人使用和改进代码,推动科学界的合作。
9. 【谷歌AI举办机器遗忘挑战赛】
谷歌AI宣布举办首个机器遗忘挑战赛,旨在推进机器遗忘的SOTA水平,并鼓励开发高效、有效和合乎道德的遗忘算法。比赛将在Kaggle平台上举办,参赛者需要在一个真实场景中,通过训练模型并遗忘某个子集,保护相关个人的隐私或其他权利。评分将根据遗忘质量和模型实用性进行自动评估。机器遗忘是机器学习的新兴领域,旨在消除训练模型特定训练样本子集的影响,保护隐私和提高模型的公平性。
10. 【2023 WAIC AI开发者论坛在上海成功举办】
2023 WAIC AI开发者论坛于7月8日在上海张江科学会堂举办。论坛聚集了来自微软、百度、科大讯飞等企业的技术大咖和专家,共同探讨人工智能技术与产业发展趋势。论坛上还举行了云帆奖璀璨明星颁奖典礼,揭晓了10位璀璨明星得主。此外,安远AI和机器之心共同运营的“AI对齐失败数据库”中文社区站点也在论坛上正式发布。论坛旨在为开发者提供广阔的事业平台和优质资源服务,推动人工智能技术和产业的创新发展。
11. 【OpenAI宣布向ChatGPT Plus用户提供Code Interpreter插件】
OpenAI宣布向所有ChatGPT Plus用户提供Code Interpreter插件,这是一个用于数据分析、创建图表、编辑文件、执行数学运算等任务的工具。Code Interpreter可以通过Python代码解决ChatGPT在数学和语言方面的固有弱点,并能处理多种任务,如数据处理、动画生成、文字提取和音乐偏好分析。用户只需上传数据并提供简单的英文指示即可完成工作。然而,使用Code Interpreter时需要仔细检查结果和过程,不可盲目相信AI的输出。
12. 【生物制药领域的模型和算法】
本文介绍了生物制药领域中的重要模型和算法,包括蛋白质结构预测、蛋白设计和分子生成等。这些模型可以应用于药物研发、分子设计和生物制造等领域。模型的设计和应用需要结合生物学和医学知识,以实现更好的效果。相关模型资源可以在SOTA!模型资源站上获取。其中BIMODAL是一种用于分子图生成的模型,GF-VAE是基于流的变分自动编码器模型,MCMG是基于知识蒸馏的多约束分子生成方法。
13. 【清华大学研究团队提出视-触融合框架解决透明物体抓取难题】
清华大学深圳国际研究生院的研究团队提出了一种基于视-触融合的透明物体抓取框架,通过利用RGB相机和带有触觉感知能力的机械爪,实现了透明物体的抓取位置检测。该框架不仅可以解决玻璃碎片等不规则透明物体的抓取,还可以应对重叠、堆叠、高低不平、沙堆和水下透明物体等复杂场景。研究者表示,该框架还可以应用于低能见度环境下的物体检测,通过视觉-触觉融合提高分类精度。
14. 【VentureBeat公布第五届AI创新奖的提名名单】
VentureBeat宣布了第五届AI创新奖的提名名单。这些奖项将在7月12日举行的Transform大会上公布。提名包括AI创新者、Best企业生成式AI应用、最有潜力的生成式AI初创公司、生成式AI先锋、生成式AI多样性与包容性以及生成式AI开源贡献等类别。这些奖项旨在表彰在生成式AI领域做出杰出贡献的个人、团队和公司。
15. 【研究提出“First-Explore”:一种简单的元强化学习AI框架,包含两个策略,一个策略只学习探索,另一个策略只学习利用】
研究人员提出了一种名为“First-Explore”的轻量级元强化学习框架,它包含两个策略:一个智能探索策略和一个智能利用策略。该框架能够在未知的困难探索领域中实现人类水平的、上下文相关的、样本高效的学习。研究人员认为,将“First-Explore”与课程设置相结合,可能是朝着人工通用智能的正确方向迈出的一步。他们相信,如果能够妥善处理与开发人工通用智能相关的真正严重的安全问题,这样的进展将带来巨大的潜在利益。
16. 【新思科技推出工具帮助芯片设计人员开发定制化RISC-V处理器】
新思科技推出RTL Architect与ASIP Designer两种工具,帮助芯片设计人员快速开发定制化的RISC-V处理器并实现Best PPA。ASIP Designer是用于设计、实现、编程和验证专用指令集处理器的工具,可以快速获得优化的编译器和硬件实现。RTL Architect是业界首个集成了签核技术的物理感知RTL分析、探索和优化系统,可以准确预测架构变化对PPA的影响。新思科技还将举办公开课,分享RISC-V内核设计与PPA优化技术。
17. 【瑞莱智慧发布RealSafe3.0人工智能安全平台,覆盖近70个评测维度】
瑞莱智慧在上海世界人工智能大会上发布了RealSafe3.0人工智能安全平台。该平台集成了多个自研模型和高质量数据集,新增了对通用大模型的评测,覆盖近70个评测维度。平台旨在解决大模型安全问题,帮助修复模型中的问题,并提供端到端的模型安全性测评解决方案。此外,瑞莱智慧还发布了DeepReal2.0平台,可检测生成式人工智能生成的内容。瑞莱智慧已参与30余项国家及行业标准制定,致力于研究和发展安全可控的第三代人工智能技术。
18. 【华为云发布盘古大模型3.0,推出合作伙伴共拓计划】
华为云在华为开发者大会2023上发布了盘古大模型3.0,并推出了合作伙伴共拓计划。该计划旨在与伙伴共建联合方案,互锁商业目标,共享市场商机,共拓市场空间。华为云还发布了云商店的五大成长计划,包括GTK计划、星品计划、会员计划、出海计划和伙伴计划,以赋能开发者商业增长。此外,华为云还发布了应用现代化产业白皮书和应用现代化技术能力成熟度评估模型。
感谢您的关注,AI前沿观察将继续为您带来前沿、全面的人工智能资讯。请大家积极参与互动,点赞、评论、转发,让更多人了解AI的前沿技术和应用。明天的速报,我们不见不散!