大家好,欢迎来到本期AI前沿速报。本期内容包括:研究团队发布JourneyDB数据集,马斯克预测未来机器人数量将超过人类等。我们希望通过这些资讯,让大家了解到AI技术的前沿进展,并引发对AI接下来发展的思考与讨论。请大家关注、点赞、转发这篇内容,让更多的人了解AI的日新月异变化。
1. 【研究团队发布JourneyDB数据集,用于多模态视觉理解】
研究团队发布了JourneyDB数据集,该数据集包含了400万个独特的高质量生成图像,用于多模态视觉理解。数据集包括四个任务:提示反转、风格检索、图像描述和视觉问答。研究结果显示,目前的多模态模型在这个数据集上表现不如在真实数据集上,但对数据集进行一些调整可以显著提高性能。
2. 【研究团队开发出一种能够直接从脑电图信号生成高质量图像的AI模型】
研究团队开发出一种名为DreamDiffusion的AI模型,可以利用脑电图信号直接生成逼真、高质量的图像。该模型通过利用预训练的文本到图像扩散模型,探索了脑电图信号的时间特征,解决了噪声和数据有限的挑战,并将脑电图信号、文本和图像空间进行了对齐。DreamDiffusion的出现为高效的艺术创作、梦境可视化以及对自闭症或语言障碍患者的潜在治疗应用提供了可能性。该研究为神经科学、心理学和人机交互等领域的研究和实际应用开辟了新的途径。
3. 【马斯克:未来机器人数量将超过人类,特斯拉愿与其他汽车制造商分享自动驾驶技术】
特斯拉CEO马斯克在第六届世界人工智能大会上表示,未来地球上机器人的数量将超过人类,特斯拉愿意将自动驾驶技术许可给其他汽车制造商使用。他还透露特斯拉正在开发人形机器人“Optimus”,旨在帮助人类完成重复、危险的工作。马斯克表示,特斯拉已经非常接近全自动驾驶状态,计划在今年晚些时候实现L4-L5级的全自动驾驶。他还对中国人民的智慧和干劲表示钦佩,并相信中国会有很强的AI能力。
4. 【谷歌量子计算机突破:比超级计算机快47年】
谷歌宣布在量子计算领域取得重大突破,其设计的量子计算机可以在几秒钟内完成世界上先进超级计算机需要47年才能完成的计算量。这标志着量子计算技术迎来了里程碑时刻。
5. 【OpenAI向所有人发布GPT-4 API访问权限】
OpenAI今天宣布通过其API正式发布新的文本生成模型GPT-4。现有的OpenAI API开发者可以立即访问GPT-4,新开发者将在本月底之前获得访问权限。GPT-4可以生成文本、接受图像和文本输入,并在各种专业和学术基准测试中表现出“人类水平”的能力。OpenAI表示,未来将允许开发者对GPT-4进行微调,并计划在今年晚些时候推出这一功能。同时,OpenAI还宣布将其DALL-E 2和Whisper API正式推出,并计划淘汰旧的API模型以优化计算能力。
6. 【2023年上半年创投界的惊喜是AI】
2023年上半年,创投界的惊喜是AI的快速发展。许多投资者都被生成式AI的迅猛崛起所吃惊,更令人瞠目结舌的是风投基金从保守态度一夜之间转向大举投资AI相关公司。然而,并非所有与AI相关的惊喜都是积极的,一些公司竟然不惜动用气候基金来投资AI,这让一些投资者感到困惑。此外,AI投资的迅速增加也引发了一些担忧,一些投资者担心会有大量资金流失。除了AI之外,早期阶段的估值范围也让一些投资者感到惊讶。总的来说,投资者们希望自己在2023年上半年更加积极主动,抓住机会进行投资。
7. 【OpenMask3D:一种能够使用开放词汇查询在3D中分割实例的AI模型】
OpenMask3D是一种能够预测3D物体实例掩码并计算掩码特征表示的AI模型。它采用两阶段的流程,通过RGB-D序列和对应的3D重建几何来实现其目标。OpenMask3D能够根据相似度检索物体实例掩码,从而实现开放词汇的3D实例分割,并超越了封闭词汇的限制。该模型还能更好地保留关于新颖和长尾物体的信息,并能根据与物体属性(如语义、几何、可用性和材料属性)相关的自由形式查询来分割物体实例。
8. 【AI数据爬取引发争议】
最近,AI数据爬取的做法引发了争议。OpenAI因未经版权持有人同意而复制书籍文本,以及ChatGPT和DALL·E违反隐私法从互联网收集个人数据而被起诉。Twitter为了限制AI数据爬取的影响,暂时限制未登录用户查看推文,并设置了推文的查看速率限制。Google则确认其为AI训练而爬取数据。专家表示,数据爬取引发的争议是AI伦理讨论丰富公众理解的一个好迹象。
9. 【TCL华星CEO赵军:显示产业迎来中国时刻,2024量产印刷OLED】
TCL华星CEO赵军表示,显示产业正处于“百年未有之大变局”,中国已成为全球显示产业的重要成员。赵军提到,数字经济的发展为显示产业带来新机遇,新显示技术的升级也促进了新需求的涌现。TCL华星将加大在Micro LED领域的技术研发,并重点关注新能源汽车显示和折叠屏市场。此外,TCL华星计划在2024年实现小批量印刷OLED量产。公司已在产业链合作方面取得进展,与多家客户建立联合实验室,并将技术应用于终端产品中。
10. 【VB Transform将于7月11日至12日在旧金山举行,企业高管者将分享如何成功整合和优化AI投资】
VB Transform是专为企业世代AI而设的独立活动,将在全球科技创新之都旧金山举行。届时,Google Cloud的数据与分析副总裁兼总经理Gerrit Kazmaier、亚马逊AWS的产品副总裁Matt Wood、麦当劳公司的全球前瞻总监Joanna Lepore等知名企业高管和技术专家将发表演讲。这是一个极好的交流和知识分享机会,您将从前沿科技人士那里获得实用的建议,了解如何利用世代AI为您的业务提供动力,从而在今天和未来获得更多价值。
11. 【Spotify创始人Daniel Ek的Neko Health获得6500万美元的AI驱动预防性医疗解决方案的融资】
Neko Health是一家由Hjalmar Nilsonne和Spotify创始人Daniel Ek共同创立的医疗技术公司,宣布成功完成了6000万欧元(6500万美元)的A轮融资。该公司旨在通过人工智能驱动的全身扫描技术,革新健康行业,特别关注预防性医疗。此次融资是该公司首次引入外部资本。融资由Lakestar领投,Atomico和General Catalyst等投资公司参与。融资完成后,Lakestar的Klaus Hommels和Atomico的Niklas Zennström将加入公司董事会。Neko Health引入了一种创新的医疗扫描技术,可以进行广泛且非侵入性的健康数据收集,注重速度、准确性和便利性。该公司声称其新的AI平台通过分析扫描结果并提供即时结果,能够早期发现健康问题,涵盖从皮肤状况到心血管健康等各种可能问题。客户在预约期间即可获得结果,并可以通过专用应用程序访问和监控结果。
12. 【AI生成的文章即将登场,但存在明显问题】
媒体公司G/O Media计划使用AI生成文章,但首次尝试出现了尴尬错误。其中一篇关于《星球大战》的文章出现了事实错误,另一篇则只是为了吸引搜索流量而几乎没有实质内容。目前尚不清楚这些文章是如何分配、生成和编辑的。虽然许多媒体公司都使用AI工具生成内容,但这种做法常常导致文章质量低下或明显不准确。一些媒体从业者对这种技术表示反对,认为需要更多透明度和员工参与决策。
13. 【DigitalOcean以1.11亿美元现金收购云计算初创公司Paperspace】
DigitalOcean宣布以1.11亿美元现金收购纽约的云计算和人工智能开发初创公司Paperspace。DigitalOcean的CEO表示,Paperspace的基础设施和工具将与DigitalOcean的产品整合,使客户更容易测试、开发和部署人工智能应用。Paperspace的客户将受益于DigitalOcean的云服务,包括数据库、存储、应用托管、文档、教程和强大的支持系统。Paperspace将继续作为DigitalOcean的一个独立业务部门存在,客户的服务不会立即发生变化。这次收购是DigitalOcean扩展云计算和人工智能业务的一部分,旨在为中小型企业和初创公司提供简化的AI和机器学习解决方案。
14. 【人工智能在制造业中的应用】
人工智能(AI)在各行各业中变得普遍,从传统制造公司使用AI在机器人中建立智能工厂,到科技初创公司开发自动化客户服务和聊天机器人。AI不再只是助手,而是在机器人、驾驶、知识生成和模拟等方面发挥自主作用。研究人员通过机器学习和机器人的应用,解锁了AI的价值,用于增强而不是取代人类在制造业、医疗保健和太空探索等领域的能力。AI赋予人类创新和支持的力量,以人为中心的方法使人类的发明和智慧得到增强。未来,AI将为人类创造更多机会,但也需要注意其存在的限制和责任。
15. 【OpenAI宣布成立Superalignment团队,用AI监督AI】
OpenAI宣布成立Superalignment团队,由OpenAI联合创始人Ilya Sutskever和Jan Leike共同领导。该团队的主要任务是构建一个与人类水平相当的、负责模型对齐的「AI研究员」,即用AI来监督AI。OpenAI认为,超级智能可能在十年内到来,为了解决超级智能对齐问题,他们将投入20%的计算资源,花费4年时间打造一个超级对齐系统。该系统的开发团队将开发可扩展的训练方法、验证系统一致性,并对整个对齐管道进行压力测试。这种用AI来监督AI的方法是一种新的尝试,能否解决AI模型的可控性问题还有待观察。
16. 【微软研究成功将Transformer扩展到10亿个token】
微软新研究成功将Transformer扩展到10亿个token,为建模非常长的序列开辟了新的可能性,例如将整个语料库甚至整个互联网视为一个序列。研究中提出了一种名为LONGNET的新组件,通过dilated attention实现了线性计算复杂度和token之间的对数依赖性。实验结果表明,LONGNET在长序列建模和一般语言任务上表现出很强的性能。这一研究为扩展语言模型的上下文长度提供了一种更有效的方法。
17. 【百度文心大模型3.5发布,模型效果提升50%】
百度在世界人工智能大会上发布了文心大模型3.5版本。该版本在问答、推理、代码和文生图等能力上都有提升。通过优化算法和数据,模型效果累计提升超过50%,训练速度提升2倍,推理速度提升30倍。此外,文心一言还引入了插件机制,提供了百度搜索和ChatFile两个插件选项。百度表示,未来将发布更多插件,并逐步开放插件生态给第三方开发者。
18. 【华为云盘古气象大模型突破AI预报天气精度难题】
华为云的研究人员提出了一种新的高分辨率全球AI气象预报系统:盘古气象大模型。该模型是一个精度超过传统数值预报方法的AI预测模型,对比传统方法预测速度提升10000倍,可秒级完成对全球气象的预测。盘古气象大模型的水平空间分辨率达到0.25°×0.25°,时间分辨率为1小时,可以精准地预测细粒度气象特征。此项研究发表在《Nature》上。
感谢您的关注,AI前沿观察将继续为您带来前沿、全面的人工智能资讯。请大家积极参与互动,点赞、评论、转发,让更多人了解AI的前沿技术和应用。明天的速报,我们不见不散!