生成式AI
一、 OpenAI Day7:发布ChatGPT Projects,万能工具箱上线
1. ChatGPT Projects是OpenAI推出的多功能协作平台,支持文件上传、对话管理、实时协作等高效工具;
2. 用户可自定义指令和集成网络搜索、Canvas等工具,增强工作效率和个性化需求;
3. 长期目标是发展为企业级应用,提供ERP和CRM等管理功能,扩展至企业用户。
二、 OpenAI Day6:OpenAI版「Her」满血上线,实时视频对话
1. OpenAI版「Her」全量上线,新增视频聊天、屏幕共享及圣诞限定圣诞老人语音;
2. 高级语音模式支持多模态交互,提供自然对话节奏和多语言情感表达,可用于教学与协作;
3. 然而,谷歌Gemini 2.0的实时AI功能被认为更先进,OpenAI在竞争中面临挑战。
三、 微软推出最新小模型Phi-4,训练新范式引热议:midtraining
1. 微软推出Phi-4小模型,参数仅14B,数学和编程能力上超过Llama 3.3和GPT-4o等大型模型;
2. Phi-4采用新的训练范式“midtraining”,提升了长文本处理能力,窗口长度可达16K;
3. 微软的midtraining通过引入长文本数据和对比学习方法,可显著提升模型推理、知识和编程能力。
四、 Pika 2.0 上线,核心亮点是图像到视频转换,实现多主体一致
1. Pika 2.0推出图像到视频转换功能,可根据图片和提示词生成无缝视频场景;
2. 模型特别适用于电商场景,能将服装、产品等照片与特定环境结合,生成高质量视频;
五、 Google的NotebookLM大更新,新增互动功能,可中途打断
1. NotebookLM新增实时对话功能,用户可与AI主持人互动,提升学习体验;
2. 引入新的界面设计,包含来源面板、聊天面板和工作室面板,优化内容组织;
六、 谷歌首款MR眼镜:AI加持、比苹果眼镜轻、FOV更大、更便宜
1. Google与三星联合发布首款MR眼镜,集成强大AI功能并搭载Android XR系统;
2. 眼镜比苹果Vision Pro更轻,视场角更大,价格更具竞争力;
3. 通过与多家厂商合作,推动XR生态系统发展,挑战苹果和Meta的市场地位。
七、 OpenAI“吹哨人”疑似自杀,不到一个月前曾揭露ChatGPT黑幕
1. OpenAI前研究员Suchir Balaji去世,死因自杀;他曾揭露OpenAI在训练ChatGPT过程中违反版权法;
2. Balaji指控OpenAI未经授权使用大量互联网数据,损害企业和创业者利益;
3. 该事件引发公众关注AI公司如何使用数据,特别是对“合理使用”法律的争议。
前沿科技
八、 Meta黑科技:戴上腕带即可隔空打字,引领神经接口AR革命
1. Meta发布EMG腕带与Orion AR眼镜原型,实现隔空打字和手势控制;
3. 通过轻便设备和AI技术推动神经接口与AR革命,挑战现有市场。
报告观点
九、 大模型预训练时代即将终结!,AI巨佬Ilya最新顶会演讲解读
1. Ilya在NeuralPS2024演讲中断言大模型预训练时代即将终结;
2. 数据量增长停滞和数据资源有限是预训练终结的主要原因;
3. 未来AI将转向代理、合成数据、推理时间计算及生物学启示等新方法。
十、 Hinton:AI的发展应回归生物学;一定不要开放大模型源代码
1. AI的发展应回归生物学,结合现代基因工程技术,通过模拟神经网络的非线性特性,实现低功耗计算;
2. 大语言模型不只是“自动完成”,它们具备深层次的理解,通过特征和交互学习词汇的含义;
3. 不应开放大模型源代码,AI的智能和控制能力可能引发资源争夺和不受控制的风险,需谨慎管理。