OpenAI在近期发布了GPT-4系列的新模型GPT-4o。这一更新主要聚焦于多模态和端侧应用,为用户提供了全新的交互体验。 GPT-4o作为OpenAI的新模型,具有三大显著特点: 多模态:GPT-...【查看原文】
GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频、图像和视频的任意组合作为输入,并生成文本、音频和图像输出的任意组合。它可以在短短 232 毫秒内响应音频输入,平均为 320 毫秒,这类似于人工响应时间(在新窗口中打开)在对话中。它在英语文本和代码上的 GPT-4 Turbo 性能相匹配,在非英语语言的文本上也有显着改进,同时在 API 中也更快且便宜 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。视觉理解评估目前最强更多去看零度博客和他的视频:
ChatGPTGPT-4编程
张子心Jolly 2024-05-15
概要 今天凌晨OpenAI发布了GPT-4o 发布会说了很多功能。 我这里就主要说一下自己的第一感受,就是和之前google发布那个Gemini的视频差不多 主要来说应该是推出了语音模式,可以实现AI
OpenAI谷歌
小奏技术 2024-05-14
AI在大多数人的想像中是冰冷,机械的。其实正好相反,ChatGPT特别擅长与人类感性共情,你看我还特意说了是「特别」。我们就拿一个例子来证明它在这方面的强悍性能。就比如说很多人都会遇到的问题,那就是有秘密但是不想找人倾诉,可是又想说出来,有什么解决法子?一般人碰到这种问题,其实就两种解决办法。1 花钱找心理咨询师2 憋在心里前者的回答很看咨询师的功力,不能保证每个心理咨询师的专业能力都很过硬。后者就是把脑袋埋进沙子里而已,并不难解决问题。而现在ChatGPT就是一个很好的解决方法。我们就拿匿名用户的不能释
ChatGPT
平凡pppf 2023-04-29
OpenAI能一直遥遥领先吗?
OpenAI
36氪的朋友们 2024-05-15
玩笑归玩笑,但世超觉得,OpenAI这次GPT-4o的现场演示效果,特别是实时语音和视频交互的能力,确实甩了其他现役大模型好几个车尾灯。再摇身一变,GPT-4o还能化身成数学老师,把屏幕的权限开放给它,它能一…
差评 2024-05-18
快手可灵,只是抖音即梦的下一个目标罢了。
蓝洞商业 2024-12-26
多年来一直讨论不休
家办新智点 2024-12-26
前有狼后有虎
正解局 2024-12-26
“就算是反应迟钝的人,估计也能感觉到,现在入境游是真的火了!”
显微一线观察 2024-12-26
“前首富之子”看上了下沉市场
首席商业评论 2024-12-26
京东3C数码发布超级趋势2024年度榜单
时氪分享 2024-12-26
与阳光电源同场的竞技比亚迪和宁德时代,都是储能电芯的供货商,他们更有核心零部件的成本优势。
阿尔法工场 2024-12-26
在2024年监管层查处的财务造假案中,恒大地产因两年虚增收入超5600亿元位列榜首
读数一帜 2024-12-26
千万别拿“时间和年龄”当做借口。
金融八卦女 2024-12-26
打造新一代AI办公产品全家桶。
晓曦 2024-12-26
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1