联想宣布独家投资大模型公司,CTO曾为ChatGPT创始团队成员
近日,基础模型和通用人工智能公司nyonic完成了数千万美元首轮融资,由联想创投独家投资。公开资料显示,nyonic首席技术官Johannes Otterbach博士曾作为OpenAI GPT创始团队成员,担任算法和数据工程团队的负责人,全程参与了GPT-2及GPT-3的研发和工程,是全球少数几位掌握GPT-3这种革命性模型训练奥秘的专家。在加入OpenAI之前,Otterbach博士是Palantir Technologies负责数据和Infra的核心工程师,并在哈佛大学进行量子物理和量子计算机的研究。
中国科学院院士:大模型存在难以逾越的天花板
在近期出席由智谱AI举办的2024年度技术开放日期间,中国科学院院士、清华大学人工智能研究院院长、清华大学计算机系教授张钹表示,GPT-4只能和数字世界打交道,但人最终必须跟物理世界打交道,这就需要机器人,也就是具身智能。具身智能的提出有助于构造完整的智能体,让智能体既有感知,又有思考。
张钹院士认为,AI可提高大多数人类工作的质量和效率,但被AI完全替代的工作仍是少数。之所以AI还不能替代大多数工作,是因为大模型还存在难以逾越的天花板:大模型的所有工作都是外部提示而非主动,并且在外部提示的情况下利用概率预测完成任务,而人类的工作依靠内部意图驱动。大语言模型生成语言与人类语言生成只是行为上的相似性,而内在机制根本不同,且有时会生成看似合理的编造或无意义的答案(幻觉)。
三星发布搭载Galaxy AI大模型新款手机
日前,三星发布了搭载端侧AI助手 Galaxy AI的全新Galaxy S24系列手机,据悉,Galaxy AI功能为系统级集成,可在通话、笔记、系统相册等界面中调出,并拥有语音、文本、图像和视频处理方面的能力,包括通话中实时翻译,AI组织和优化笔记内容生成大纲,以及AI优化照片和对视频进行慢动作补帧,生成流畅视频画面等功能。
蚂蚁集团再开源两项大模型技术
蚂蚁集团近期又开源了两项与大模型相关的新技术,分别是ATorch和 Lookahead。其中,ATorch是一个大模型分布式训练加速扩展库,可实现深度学习自动资源动态优化和分布式训练稳定性提升,可提升深度学习的智能性,千亿模型千卡级别训练的算力利用率可达60%;Lookahead则是一个推理加速框架,可以大幅提升大模型的推理效率,可将推理加速2-6倍,目前技术已在GitHub上开源,相关论文公布在ARXIV。
商汤开源“书生·浦语”2.0大模型
近日,商汤科技与上海AI实验室联合香港中文大学和复旦大学正式发布新一代大语言模型书生.浦语2.0(InternLM2)。资料显示,InternLM2是在 2.6 万亿 token 的语料上训练得到的。沿袭第一代书生・浦语(InternLM)设定,InternLM2包含7B及20B两种参数规格及基座、对话等版本,继续开源,提供免费商用授权。
Lanmeih/今日话题
你经常使用哪些AI功能?
咱们评论区聊聊~