生成式AI
一、 奥特曼秀5颗草莓疯狂暗示GPT-5?匿名超强新模型神秘现身
1. OpenAI可能正在开发代号为"Strawberry"的新模型,暗示为GPT-5;
2. 匿名模型"anonymous-chatbot"基于GPT-4架构,显示出在数学问题上的显著提升;
3. 社区通过各种暗示和线索,推测GPT-5可能在未来4-6周内发布。
https://mp.weixin.qq.com/s/LMNIKV7xWTGK5MZsSPT5Mg
二、 最强国产多模态易主!腾讯混元把Claude-3.5/Gemini-1.5都超了
1. 腾讯混元模型在中文多模态大模型测评基准SuperCLUE-V中表现优异,超越了Claude-3.5和Gemini-1.5;
2. 混元模型具备强大的多模态理解和生成能力,能处理高分辨率和极端长宽比的图片;
3. 模型在实际应用中表现出色,如理解复杂图表、财报摘要,并能在多模态测试中准确识别和分析内容。
https://mp.weixin.qq.com/s/jEJxIc8SB1B_H3zdGNFIng
三、 OpenAI计划下注6000万美元,投资AI硬件Opal网络摄像头
1. OpenAI投资6000万美元于Opal,原为网络摄像头制造商,现计划开发由AI模型驱动的创意工具设备;
2. Opal将与OpenAI研究人员合作,几乎像研究实验室一样,为设备创意提供原型;
3. 尽管市场上AI硬件开发面临挑战,OpenAI及其CEO Sam Altman对AI技术驱动的物理设备持续投资显示出对该领域的强烈兴趣。
https://mp.weixin.qq.com/s/6GofBNHxFtaqw3ZkNtdg-A
四、 谷歌发布大模型数据筛选方法:效率提升13倍,算力降低10倍
1. 谷歌Deepmind开发的JEST算法提升了大模型数据筛选效率13倍,降低算力需求10倍;
2. JEST通过批次级评分而非单个数据点评分,优化了数据选择过程;
3. 结合模型近似和多分辨率训练方法,进一步降低了算力需求,提高了处理效率。
https://mp.weixin.qq.com/s/sSzTWr8xEP8M8Wslqaj4qg
五、 体验完腾讯元宝「深度阅读」,以后的论文和研报阅读有救了
1. 腾讯元宝的深度阅读功能显著提高了论文和研报的阅读效率,适合非专业人士快速获取关键信息;
2. 深度阅读模式包括精读大纲、精读提问和原文搜索,支持文图混排,保留格式和图片;
3. 尽管存在一些用户界面和交互设计的初期问题,整体体验仍然积极,显示出产品的潜力和改进空间。
https://mp.weixin.qq.com/s/vJf1KMmHXWMdtCxQa8VKQA
六、 告别TTS!贾扬清领衔的Lepton AI推出实时语音交互功能
1. Lepton AI推出的实时语音交互功能实现了几乎无延迟的响应,大幅提升用户体验;
2. 技术创新包括将LLM和TTS合二为一,实现文本和语音的并行处理,显著减少首次音频时间(TTFA);
3. Lepton AI的语音模式技术与多种开源LLM模型兼容,支持开发者自由选择和使用,提供高度定制化的应用可能。
https://mp.weixin.qq.com/s/4mNd43wTiUbffSkRRAkYCA
七、 世界模型+数学证明,确保AI系统正常运作,深度学习巨头新动向
1. Yoshua Bengio加入Safeguarded AI项目,担任科学总监,项目由英国ARIA支持,预算达5900万英镑;
2. 项目目标是通过结合科学的世界模型和数学证明,构建能理解和降低其他AI Agent风险的系统;
3. Safeguarded AI分为三个技术领域:支架、机器学习和应用,旨在通过量化安全保障,提高AI系统的安全性和可靠性。
https://mp.weixin.qq.com/s/tDa46iKHeLqJS39PamnAPw
八、 智驾一年10亿美元只是入场券,One Model端到端还有多远?
1. 国内厂家开始参考 FSD 的思路,采用基于端到端模型、VLM视觉语言模型和世界模型的自动驾驶技术架构,模拟人类思考和决策过程;
2. 端到端模型直接从传感器数据输出行驶轨迹,与业内分段式端到端模型有显著区别;
3. 理想汽车自动驾驶负责人表示,该技术投入巨大,预计未来每年训练花费将达到10亿美元,强调高质量数据和算力是关键。
https://mp.weixin.qq.com/s/gHonY0HXu71gLYXChkmagg
前沿科技
九、 将 ChatGPT 植入人类大脑,瘫痪病人用意念控制 Vision Pro
1. Synchron开发的脑机接口技术通过血管植入,无需开颅手术,利用stentrode传感器网读取大脑信号;
2. 结合ChatGPT,该技术允许瘫痪患者通过思考控制外部设备,如Vision Pro,增强交互自然性和效率;
3. 系统通过学习用户偏好优化预测能力,提供个性化的交互选项,极大提升了用户的沟通效率和体验。
https://mp.weixin.qq.com/s/g9HStPJHnipu3Ja7gCnodQ
报告观点
十、 国际劳工:ChatGPT等生成式AI,影响1700万工作岗位
1. 生成式AI如ChatGPT预计将影响拉丁美洲和加勒比地区的1700万个工作岗位,尤其在数据密集型行业如金融和保险;
2. 虽然只有2%到5%的岗位可能完全被AI替代,但大多数工作将转向人机协作模式,提高工作效率;
3. 生成式AI的应用将加剧现有的数字鸿沟,对教育和经济条件较好的群体带来更多好处,而对条件较差的群体则可能造成负面影响。
https://mp.weixin.qq.com/s/dQdm8hGhCQNEMRGgwzcAGA
👇订阅下方合集,获取每日推送