免费 AI “神器”系列第三弹：AI 视频领域的“字节跳动”诞生，首个GPT-4V盲测工具发布｜钛媒体AGI

作者：钛媒体APP发布时间：2024-02-13

字节跳动谷歌英伟达 AGI

图片来源：unsplash

近期，生成式人工智能（AIGC）领域又涌现出多款创意十足的新应用。

今天，钛媒体AGI梳理了免费 AI “神器”系列第三弹，共五款，其中大多数实用工具能帮你提升一定的生产力。

AI视频编辑神器——Runway Gen-2
胸部x光片诊断神器——CheXagent
AlphaZero升级版——DeepMind下象棋模型
Vision Arena：视觉模型盲测工具
图片3D转换器——ComfyUI 3D Pack

1、AI 视频编辑神器——Runway Gen-2

产品信息：Runway Gen-2是一款功能强大的AI视频编辑软件，用户可以直接使用“文本”、“图片”和“文本+图片”三种方式提示生成视频内容，并自动剪辑视频。

产品功能：用户在主界面可自由选择“文本”、“图片”和“文本+图片”三种方式来生成视频内容。以“文本”生成视频为例，在输入框输入一段描述词后，等待两分钟左右就会生成一段4秒的视频内容。

除此之外，Runway Gen-2还配备有其他30种强大的 AI 工具，比如：“Remove Background”（绿幕去背景）、“Expand Image”（图片扩展）、“Blur Faces”（模糊人脸）、“Inpainting”（移除视频杂物/人）等，可以帮助视频内容创作者极大提高工作效率。

Runway Gen-2配备有30种 AI 功能

据悉，Runway Gen-2背后的开发团队来自Runway公司，他们致力于开发用于生成视频、图像和多媒体内容的产品和模型。在2023年6月，该公司以15亿美元的估值，完成了1.41亿美元的C轮融资，谷歌、英伟达等科技巨头都参与了投资，被誉为“AI 视频生成领域的字节跳动”。

Runway Gen-2首席执行官Cristobal Valenzuela曾表示，“创意软件的时代已经结束。”而有科技博主认为：“如果（Runway）按照这个速度发展下去，到2024年底，我们或许能够看到导演们手工制作出好莱坞水准的生成式视频作品。”

体验链接：https://app.runwayml.com/

2、胸部x光片诊断神器——CheXagent

产品信息：CheXagent是一个专门用来解读胸部x光片的AI模型，旨在提高医疗影像诊断效率与准确性。

产品功能：用户只需在CheXagent主界面上传一张胸部x光片，等待数秒后即可生成相关的诊断结果，包括疾病识别、异常检测、重要结构分析以及后续步骤建议。

CheXagent 界面

CheXagent由斯坦福大学与Stability AI合作开发，结合了临床医学大语言模型、视觉编码器和视觉-语言桥接网络，利用超过600万组数据的大型集合进行训练，提升了解读X光图像的能力。如若未来进入大规模应用，医疗工作者的工作效率和诊断准确率都将得到提升。

体验链接：https://stanford-aimi.github.io/chexagent.html

3、AlphaZero升级版——DeepMind下象棋模型

产品信息：Google DeepMind抛弃传统的搜索方法，使用Transformer模型，训练了一个AI模型来下国际象棋。

产品功能：Google DeepMind下象棋模型使用了一个国际象棋程序Stockfish 16来训练，AI不再需要像此前普通 AI 国际象棋依赖于搜索算法来预测和评估最佳选择的走法，而是直接学习成千上万棋局中的模式和策略，达到只需通过观察当前棋盘的状态，做出高水平决策的大师级棋艺。

DeepMind下象棋模型相关论文

该模型在性能上超越了AlphaGo Zero和GPT-3.5-Turbo-Instruct，证明了深度学习模型，特别是Transformer模型，能够在复杂的决策和策略游戏中学习和模拟高级人类智能，显著减少了计算需求，为AI的自主学习和理解复杂系统提供了新的范例。

与AI下棋体验地址：https://lichess.org/

4、Vision Arena：视觉模型盲测工具

产品信息：Vision Arena是一款视觉模型领域的开放评测对比平台，目的是测试和比较不同的视觉语言模型（VLMs），比如GPT-4V、Gemini（谷歌模型）、Llava、Qwen-VL（通义模型）等。

产品功能：用户可以在Vision Arena工具上同时测试两个视觉模型，并对它们进行投票，以决定哪个更优秀。而且整个过程处于“盲测”状态，需要选择你认为好的结果才会告诉你模型是什么。

据透露，这是全球首个GPT-4V的盲测工具软件。未来，基于该工具的模型基准排行榜（Elo Rating）功能也将推出。

体验地址：https://huggingface.co/spaces/WildVision/vision-arena

5、图片3D转换器——ComfyUI 3D Pack

产品信息：ComfyUI 是一款基于稳定扩散模型（Stable Diffusion Model）架构技术，直观、功能强大且实现模块化的图形平台，允许用户创建复杂的 AI 文生图工作，无需编程知识。

产品功能：今年1月，ComfyUI 宣布引入3D图像处理模型，能快速将图片转换成3D模型。如今，用户可在ComfyUI 3D Pack平台上将图片快速转换成一个3D模型，并能从不同角度查看该3D模型，还能使用3D高斯扩散技术提升模型质量，让3D模型看起来更加真实和具有立体感。此外，ComfyUI 3D Pack还支持多种格式导出，集成了先进的3D处理算法。

ComfyUI 3D Pack界面

体验地址：https://github.com/MrForExample/ComfyUI-3D-Pack/tree/main

（本文首发钛媒体App，作者｜任颖文，编辑｜林志佳）

免费 AI “神器”系列第三弹：AI 视频领域的“字节跳动”诞生，首个GPT-4V盲测工具发布｜钛媒体AGI

推荐体验

相关资讯

免费 AI “神器”系列第四弹：字节跳动发布视频界“神笔马良”，谷歌Gemini最强竞对出现｜钛媒体AGI

免费AI“神器”系列第九弹：“字节版Sora”突然爆火；AI 代码软件走红网络｜钛媒体AGI

免费AI“神器”系列第11弹：苹果版ChatGPT超越GPT-4；腾讯版Sora已获3000星｜钛媒体AGI

免费AI“神器”系列第12弹：腾讯研发出“AI 蔡徐坤”；字节Gauth日下载量增长1400% | 钛媒体AGI

免费 AI “神器”系列第八弹：全球首个 AI 软件工程师Devin来袭；阿里版Sora模型爆火｜钛媒体AGI

近期资讯

黄埔文冲科技成果入选“2024中国智能制造十大科技进展”

只要一个软件从此不怕游戏存档丢失！神人发明的游戏存档管理器来了

屏幕一键秒变普通笔记本两倍！联想卷轴屏PC更多细节曝光

2024云计算产业和标准应用大会成功举办

美国频现天空不明发光物体目击事件官方称大多是无人机，仍有100多起需调查

2024工业数字化转型案例发布会即将开幕

2024·百姓身边科技事丨智能创新赋能疾控网络

解决QQ无法登录问题的实用指南与常见故障排查方法

网易武侠游戏《燕云十六声》PC 端公测今日开启

从古到今，人类是如何获取、保存和传递知识的？

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响