当前位置:首页|资讯|腾讯|Sora

腾讯研究院AI速递 20240702

作者:腾讯研究院发布时间:2024-07-02

生成式AI

一、 Gen-3开放实测demo惊艳,时装秀一绝,却依旧不懂物理世界

1. Gen-3 Alpha在细节、一致性和运动表现方面有非常的显著改进,生成质量提升;

2. 模型在理解物理世界方面仍有不足,例如越野车尘土分布不自然、体操运动员动作变形等问题;

3. 总的来说,Gen-3和Sora各有优劣,具体表现取决于生成场景和要求。

https://mp.weixin.qq.com/s/wzPRt2NhImfyKnTKt4CEtw

二、 又一个AI智能眼镜,全球首款搭载GPT-4o的AI智能眼镜来啦!

1. Solos AirGo 3智能眼镜简化使用体验,通过触摸镜框与ChatGPT互动,支持实时翻译和音乐播放;

2. 设计时尚,结合了Wayfarer风格和高科技,微型扬声器和麦克风也能做到音质清晰;

3. 配备强大软件支持,通过Solos App个性化设置,整合SolosChat和SolosTranslate实现多功能交流和信息查询。

https://mp.weixin.qq.com/s/Ot4_QJyRzYvARqrlJOywSQ

三、 齐活了,Resona V2A,AI智能解析视频,实现自动配音与配乐

1. Resona V2A允许用户上传视频后,系统自动生成与内容契合的音频,包括音效和环境音等;

2. 相较传统方法,其音频生成速度快90%,大幅节省制作时间,提升工作效率;

3. 适用于多领域,尤其对电影制作人和使用特定视频生成应用的创作者提供支持,降低成本同时保持音频质量。

https://mp.weixin.qq.com/s/d7Mbe4lBv-lvKUsWy7ng1w

四、 甲骨文首次将LLMs引入数据库,集成Llama 3等和数据库高效对话

1. 甲骨文首次在数据库HeatWave GenAI中嵌入Llama 3和Mistral LLM,提高安全性和使用便捷性;

2. 通过将数据转换为向量并在内存中搜索,实现快速且精确的数据查询;

3. HeatWave GenAI可结合机器学习进一步探索新应用,如银行的欺诈检测和外卖平台的个性化推荐。

https://mp.weixin.qq.com/s/TQ-999ZrdlGhsbXub28JEQ

五、 前 OpenAI 工程师创办AI 机器人定制公司 Dust,ARR 已破百万美元

1. DustAI 机器人定制公司获得红杉美国1600万美元融资,扩展到美国市场,并已达100万美元年经常性收入;

2. Dust开发的软件整合了OpenAI、Google、Anthropic和Mistral AI的产品,并与Slack等应用程序连接;

3. Dust的主要客户包括法国初创公司和美国碳会计企业Watershed,帮助非工程师员工开发复杂的数据项目。

https://mp.weixin.qq.com/s/hSG_ZYHPfOJg4ggEbUvVlA

六、 8B即达到GPT-4级性能!北大等提出医疗专家模型训练方法

1. 北大等研究团队通过在适当大小的数据子集上多轮预训练,提出改善大语言模型在医疗领域的训练效率和性能;

2. 介绍了使用高质量医疗数据进行连续预训练,并通过混合数据训练缓解预训练分布差异;

3. 通过三种策略优化的Llama-3-Physician-8B小模型在医疗任务上表现优越,接近GPT-4级性能。

https://mp.weixin.qq.com/s/Y0IsaHAiKPH-W6DBhYXtmg

七、 华为、腾讯开源AniPortrait:用音频、图片生成会说话的视频

1. AniPortrait开源模型使用音频和图片生成同步说话的视频;

2. 该模型包括从语音提取3D面部网格和头部姿态,以及将这些数据转化为视频的步骤;

3. 通过优化细节处理,特别是面部关键点,提高视频生成的精细度和一致性。

https://mp.weixin.qq.com/s/CyaZ5uiCh8we2otIn5cfcQ

前沿科技

八、 利用AI进行噪音消除:NVIDIA Broadcast 强效助力直播和远程工作

1. NVIDIA Broadcast 使用 RTX GPU 的 Tensor Core 提高直播和视频会议的音视频质量;

2. 通过 AI 功能,如噪音和回声移除、虚拟背景和自动聚焦,提升用户体验;

3. 支持广泛应用,适合远程工作者、直播主播和内容创作者,易于集成和使用。

https://mp.weixin.qq.com/s/HllHk9poXoj17w0fDIwiiw

报告观点

九、 微软 AI CEO:今年年底,将拥有实时的语音,允许完全动态的交互

1. Mustafa Suleyman预计年底将实现实时语音界面,实现完全动态交互;

2. AI技术持续对社会产生深远影响,不会像加密货币那样成为一时热潮;

3. 呼吁中美技术竞争中保持合作,通过全球合作共存来推动技术发展。

https://mp.weixin.qq.com/s/WVu5xv2yPKkacatPTmX6bQ

十、 《奇点更近了》作者再预言:2045年,智能将扩展到100万倍

1. Ray Kurzweil预测2045年人类智能将扩展到100万倍;

2. 预计在2029年人工智能将达到人类水平,并在2030年代初实现医学长寿逃逸速度;

3. 纳米机器人将使人脑与云端融合,彻底改变人类智能和生存方式。

https://mp.weixin.qq.com/s/AlZSXpxqqukooobWA8vGRg

👇订阅下方合集,获取每日推送


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1