“ChatGPT最强对手”Claude2大更新，马斯克创立xAI公司“探索宇宙本质”

作者：阿尔法公社发布时间：2023-07-14

AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的资讯周报。阿尔法公社希望发现和投资非凡创业者（AlphaFounders），相信非凡创业者们在技术、商业和社会方面的巨大推动力，他们指引着创投生态的风向。

本周，我们观察到以下AI领域的新动向和新趋势：

1.ChatGPT的劲敌们大更新：Anthropic发布Claude2，它不仅在输入上下文长度上超越ChatGPT，而且在与人类价值观等人性化和安全性方面的对齐上下了大工夫，它在GRE考试和医师执照考试方面进步也很大。

谷歌的AI助手Bard同样迎来更新，它首次支持包括中文在内的40+语言，而且新增了对语言输入的支持。

2.AI在医疗方面的应用活跃：谷歌的医疗大模型Med-PaLM登上Nature，在美国医师执照考试上达到86.5%的准确率；利用生成式AI驱动药物发现的Causaly获6000万美元B轮融资；Spotify联合创始人创立的Neko Health获6000万欧元A轮融资，它主要通过AI诊断全身扫描结果。

3.马斯克创立xAI公司“探索宇宙本质”：马斯克在推特上宣布了他新成立的xAI公司，其目标是“了解宇宙的真实本质”。xAI公司有包括马斯克及多位华人科学家在内的12位创始成员。

人工智能产品和技术的新突破

1.ChatGPT最强竞品Claude2：100k上下文，代码、GRE成绩超越GPT-4

Claude被许多网友称为「ChatGPT 最强竞品」，由OpenAI离职人员创建的Anthropic公司打造，它近日更新到了Claude2版本。这款新的人工智能助手在编写代码、分析文本、数学推理等方面的能力得到加强，且尤其注重其生成内容的安全性，与人类价值观和伦理的匹配。用户可以在新的beta网站上免费试用。

Claude2的主要改进包括：提高作为编码助理的能力，上下文窗口从9K token扩展到100K token，可以生成最多4000个token的连贯文档，以及更正确地生成JSON、XML、YAML、代码和Markdown格式输出。它对于多语言的支持也明显增强。

Claude 2在GRE阅读和写作考试中的得分高于90%，在定量推理方面与达到了参加GRE考试的考生的中位数水平，它也能通过美国医师执照考试（USMLE）。

2.Bard迎来大更新：支持中文，支持语音

近日，谷歌旗下的AI对话系统Bard在最新更新中新增了对中文等40多种语言的支持。同时，Bard还新增了语音支持。此外，用户还可以调整Bard的回答语气和风格，包括简单、长、短、专业或休闲等五种选项。

此次更新还实现了Google Lens的整合，用户可以上传带有Prompt的图像，Bard会分析图片内容和信息来提供帮助。Bard是基于谷歌的大语言模型PaLM 2模型训练的，它具有多语言、推理和编码功能。

3.谷歌医疗大模型Med-PaLM登Nature，AI医生成绩比肩人类

谷歌最近在Nature上公开了其医疗大模型Med-PaLM的研究成果。Med-PaLM 2在美国医师执照考试的问题上达到了86.5%的准确率，比谷歌自己的Med-PaLM的最先进结果提高了19%。

谷歌还提出了全新的MultiMedQA评估基准，以评测大模型在临床方面的能力。在此基准下，研究人员评估了PaLM及其指令微调变体Flan-PaLM。通过利用提示策略的组合，Flan-PaLM在MedQA（美国医疗执照考试USMLE）、MedMCQA、PubMedQA和MMLU临床主题上超越了SOTA。最后，研究人员通过指令提示微调，进一步将Flan-PaLM与医学领域对齐，并提出了全新的医学模型——Med-PaLM。

4.性价比超H100，英特尔发布中国版Gaudi2 AI加速卡

英特尔发布了面向中国市场的第二代Gaudi深度学习加速器—Habana Gaudi2。这款加速器在编程、文本分析和数学推理等方面的性能得到了显著提升，可以产生更长的响应。

Gaudi2在MLPerf Training 3.0基准测试中展示了出色的性能，其在计算机视觉模型ResNet-50、Unet3D，以及自然语言处理模型BERT上的训练结果均优于英伟达A100，部分任务上接近H100。

5.ChatGPT编程神器Code Interpreter终于开放，人人都能编程做数据分析

OpenAI的Code Interpreter插件已经正式向所有ChatGPT Plus用户开放。这个插件可以帮助用户进行数据分析、创建图表、编辑文件、执行数学运算等。

Code Interpreter的功能强大，能够编写Python代码来解决大语言模型在数学和语言方面的固有弱点，降低了幻觉和迷惑的概率，使人工智能的用途更加广泛。此外，Code Interpreter还能够自动处理数据合并和清理的工作，进行复杂的数据分析，并以非常人性化的方式对数据进行推理。

6.七部门联手！首个生成式AI监管文件将实施

爆火的生成式AI产业正式在国内迎来首个监管文件。继今年4月网信办就《生成式人工智能服务管理办法》公开征求意见后，7月13日，网信办等七部门正式发布了《生成式人工智能服务管理暂行办法》，该办法自2023年8月15日起施行。

7.百川开源最强中英文百亿参数可商用大模型，训练数据量超越LLaMA

百川智能发布新型大语言模型Baichuan-13B，参数量达到了130亿，包括Baichuan-13B-Base通用模型和Baichuan-13B-Chat对话模型，以及其INT4/INT8两个量化版本。

Baichuan-13B模型集合了高性能、完全开源、免费可商用等优势，是目前所有33B以下尺寸开源模型中效果最好的可商用大语言模型。该模型在1.4万亿token数据集上训练，超过了LLaMA-13B的40%，是目前开源13B尺寸下训练数据量最大的模型。Baichuan-13B模型的发布，实现了国内开源大模型对美国大模型开源领域的追赶，改变了此前国内在相关领域一直落后的局面。

8.商汤文生图大模型在图片生成质量等多个指标击败Stable Diffusion XL

商汤大模型团队提出的文生图大模型RAPHAEL，该模型可以生成具有高度艺术风格或者摄影风格的图片，生成速度极快，且在各项测试上击败了Stable Diffusion XL，DALL-E 2，DeepFloyd此前的主流模型。

RAPHAEL的创新之处在于其提出了三个组件：Space-MoE, Time-MoE, 以及Edge-supervised learning模块。RAPHAEL在FID上的测试结果显示，其在图片生成质量和多样性的指标上击败了如Stable Diffusion，DALL-E 2等模型，达到6.61。此外，基于人类评估给出的一些指标也显示，RAPHAEL在图文匹配度以及生成质量上均超过了Stable Diffusion XL，DeepFloyd，文心一格以及DALL-E 2。

9.京东推出言犀大模型，预计8月正式上线

7月13日，京东在2023京东全球科技探索者大会暨京东云峰会上正式推出京东言犀大模型，同时发布言犀AI开发计算平台。该平台已经启动预约注册，预计8月正式上线。

京东集团CEO许冉表示，大模型在京东内部已经取得明确的实践效果。此外，京东对大模型也制定了“三步走”的明确规划，分别是在内部打造通用大模型、在内部的产业场景大规模实践，大模型的价值在内部充分验证后，再开放给合作伙伴。

10.MIT打造实验科学家的大模型助手，语音聊天就能开展实验

麻省理工学院李巨教授团队开发的一款名为CRESt的人工智能助手，它是专为实验科学家量身打造的，其后端使用了OpenAI的ChatGPT作为核心。

CRESt具有以下特点：可以调用真实世界的机械臂进行自动化实验，自主查找本地或互联网上专业的材料数据库，提供优化材料配方的主动学习算法。CRESt的前端实现了语音输入输出，AI生成语音，以及多平台无缝切换。有了CRESt，即使没有任何代码经验，科研工作者也能通过与其口头对话来利用自动化实验平台帮自己做实验。

11.3D AI生成新玩法：无需数小时，只要45秒，单张图片即可生成 3D模型

来自加州大学圣迭戈分校等机构的研究者提出一项名为"One-2-3-45"的新研究，它是一种新的3D人工智能生成方法。这种方法可以在45秒内从任意单张图片或文本生成3D纹理网格，无需针对每个物体进行优化。这是通过结合2D扩散生成模型和基于cost volume的可泛化NeRF实现的。

与现有的3D AI生成方法相比，One-2-3-45不仅大大降低了推断时间，而且在输入的多样性、输出的几何表示、结果的3D一致性、与输入的相似性，以及所需的3D数据规模上，都具有多方面的优势。

12.三句话生成CPU！中科院ChipGPT攻克AI芯片设计？

中科院计算所发布了ChipGPT ，这是一种基于大语言模型的自动设计芯片的方法。ChipGPT不仅能自动设计芯片，还探索了针对芯片性能和面积的优化方法。

相比于其他方法，ChipGPT在芯片设计上节省了多达47%的面积。然而，大模型芯片设计面临三大难题：如何精选模型的输入内容，如何通过"Prompt Engineering"让大模型生成更优秀的芯片，以及如何控制大模型生成的HDL，让设计出来的芯片在性能、功耗和面积之间达到最佳的平衡。尽管有这些挑战，但如果能解决这些问题，芯片自动设计的未来将十分光明。

13.下一代语言模型范式LAM崛起！AutoGPT模式席卷LLM

大型动作模型（Large-Action Models，LAM）崛起，这是一种新的语言模型范式，它将语言模型作为智能体的核心大脑，可以将复杂任务分解，并在每个子步骤实现自主决策，无需用户参与即可解决问题。LAM的开发涉及到三个关键组件：规划、记忆和工具。

规划是指智能体需要提前将任务分解，并进行规划。任务分解思维链已然成为「诱导模型推理」的标准提示技术，可以增强解决复杂任务时的模型性能。

记忆可以被定义为用于获取、存储、保留和后续检索信息的过程，人类大脑中主要有三种类型的记忆：感官记忆、短时记忆和长期记忆。这些记忆类型也可以对应到语言模型的概念上。

工具使用能使用复杂工具是人类高智力的体现，我们可以创造、修改和利用外部物体来完成超出身体和认知极限的事情，同样，为LLM配备外部工具也可以显著扩展模型功能。

人工智能初创公司的新融资

1.马斯克建立xAI公司，创始团队包括多位华人科学家

马斯克在推特上宣布了他新成立的xAI公司，其目标是"了解宇宙的真实本质"。xAI公司有包括马斯克及多位华人科学家在内的12位创始成员。

xAI公司的目标是解决宇宙中的根本问题。马斯克引用了科幻作家道格拉斯·亚当斯的话，"一旦你问对了问题，那么答案往往是最简单的部分"。

在xAI的创始团队中，有多位曾在DeepMind、OpenAI、谷歌、微软、特斯拉、多伦多大学等公司和机构的AI研究者。其中包括吴宇怀（Yuhuai "Tony" Wu）、Jimmy Ba、杨格（Greg Yang）、张国栋（Guodong Zhang）和戴子航（Zihang Dai）等华人科学家。

2.最后一位Transformer论文作者离开谷歌创业

据彭博社消息，Transformer模型论文的最后一位共同作者Llion Jones，宣布将在月底离开谷歌，自行创业。这标志着Transformer模型的所有八位共同作者都已离开谷歌。

Llion Jones在给彭博社的一封消息中写道：离开谷歌并不是一个容易的决定，我与他们度过了非常精彩的十年，但是现在是尝试一些不同的事情的时候了。鉴于人工智能领域的势头和进展，现在是构建新事物的好时机。

3.Spotify联合创始人Daniel Ek创立的Neko Health获6000万欧元A轮融资

官方网站：www.nekohealth.com/

Spotify联合创始人创立的医疗科技公司Neko Health最近获得了由Lakestar领投，Atomico和General Catalyst参投的6000万欧元（6500万美元）A轮融资。

Neko Health主要通过AI诊断全身扫描结果，对包括癌症、心血管疾病和糖尿病等代谢综合征在内的疾病进行分析和诊断。

目前公司提供的服务形态是，先对客户进行一场价格约为250欧元的扫描，并针对扫描结果进行分析解释，最终提供给客户一份面对面的咨询服务。公司宣称这笔融资未来将投入到公司的扩张计划中，包括在欧洲开设更多诊所，并投资于研发，临床研究和招聘。

Neko Health由Spotify联合创始人Daniel Ek和另一位连续创业者Hjalmar Nilsonne于2018年在瑞典创立。据公司称，其目前已经拥有一支遍布欧洲超过35名的医生、研究人员和技术人员组成的专业团队。

4.推动由生成式AI驱动的药物发现，Causaly获6000万美元B轮融资

官方网站：www.causaly.com/

Causaly近日完成6000万美元的B轮融资，由ICONIQ Growth领投，Index Ventures、Marathon Ventures等参投，它的总融资额达到9300万美元。

Causaly是一家药物发现AI初创公司，已经有12家全球前20大制药公司成为其客户。它表示，其“最佳级别”的知识图谱，结合生成式AI解决方案，使生物医学研究人员能够合成和参考数千篇已发表的研究论文，揭示新的见解，并比以前更快地分析可用的科学数据。

Causaly引用了研究人员使用其软件的“10倍生产力增益”，并表示，这意味着过去需要两到三年的研究现在只需要两到三周。

5.利用多模态大模型帮用户解决复杂商业任务，Aleph Alpha获得1亿欧元B轮融资

官方网站：www.aleph-alpha.com/

德国人工智能初创公司Aleph Alpha获得由英特尔与英伟达等领投的1亿欧元融资。它计划用这笔资金提升自己训练的千亿大语言模型的透明度，将人工智能助手打造为高度专业化的服务技术人员，支持用户解决复杂的任务。

Aleph Alpha正在开发自有的多模态大模型，它拥有多达2000亿以上的参数。该模型能够处理多语种的任务，以及理解和回答任何语言和视觉信息组合的相关背景问题。

透过加强自然语言处理的能力，用户在与机器沟通时，不必拘泥于预定的系统，也不必只使用某些关键术语，而是可以很自然地与系统对话。人工智能助手还会用自然语言做出回应。这种交流不仅可以用口语进行，也可以用图片进行。例如，专家可以拍摄机器人的站立位置，并询问这个位置是否安全。

Aleph Alpha的创始人是Jonas Andrulis是连续创业者，并且在SAP和苹果都有过技术管理经验。

6.Vendict利用AI自动化安全合规评估，获NFX领投的950万美元种子轮融资

官方网站：www.vendict.com/

Vendict近日获得950万美元种子轮融资，由NFX、Disruptive AI和Cardumen Capital领投，其他投资者还包括NewFund Capital、Tuesday Capital等。

Vendict是一家以色列初创公司，其主要目标是使用生成式AI自动化安全合规性评估。在现有的企业软件供应商环境中，供应商通常需要填写问卷，证明他们符合他们希望服务的客户的安全要求，这是一个非常手动、技术性强且耗时的过程。

Vendict的创始人Udi Cohen（CEO）和Michael Keslassy（CTO）希望改变这一现状，他们创建了一个擅长安全语言的AI模型，结合了高级安全评估专业知识和尖端的AI创新。这种新颖的AI模型不仅将安全评估从几周缩短到几个小时，而且每次用户交互都会持续提高效率。

Vendict的创新方法包括从组织现有的合规信息中提取数据，并使用其生成式AI专业且准确地回答给定问卷中的每个问题。除了帮助内部风险管理，Vendict还提供内部审计、法规跟踪以及所有合规文档的集中知识库。

7.AI短视频平台Anneal获YC所投Pre-Seed融资

官方网站：https://anneal.ai/

Anneal近日宣布获得Y Combinator投资的Pre-Seed融资，具体金额未披露。

Aneeal希望打造一个生成式AI驱动的短视频生成和分享的社交平台，致力于成为AI驱动的TikTok。

Aneeal由Akash Kashyap, Tyler Kahn共同创立，目前团队仅由两人组成。Kashyap曾是语言交换学习软件Tandem的共同CEO；Kahn是 Omreader（Kindle阅读工具）的创始人。

8.SpeedyBrand获得GV领投的250万美元pre-seed融资

公司官网：https://speedybrand.io/

近日，AI驱动的内容营销解决方案提供商SpeedyBrand宣布获得250万美元的pre-seed融资，该轮融资由谷歌的风险投资和Y Combinator领投。

SpeedyBrand为客户提供了生成式AI驱动的宣传内容生成、搜索引擎优化（SEO）和社交媒体整合。

品牌首先选择一个主题。然后，他们让平台生成文本并建议可能适合他们生成的内容类型的图像。

9.用生成式AI改变学习方式，英国教育科技初创公司Kinnu获650万美元种子轮融资

官方网站：https://kinnu.xyz/

AI教育科技公司Kinnu近日获得650万美元种子轮融资，由LocalGlobe和Cavalry Ventures领投，Spark Capital和Google Ventures跟投。Kinnu 目前的融资总额达900万美元。

Kinnu的平台使用生成式AI创作内容。首先，人类专家创建一个课程大纲，之后输入到Kinnu的大语言模型中。模型确定每门课程的主要思想，并以多种格式创建复习问题。Kinnu随后通过其移动应用程序提供这些课程，包括文化、历史、科学、心理学四大门类，每一大类下又细分多门课程。

Kinnu由Christopher Kahler、Abraham Muller和Hanna Celina创立。在创立Kinnu之前，Christopher和Abraham创办了由Accel和Spark投资的实时市场研究初创公司Qriously。

本文由阿尔法公社综合自多个信息源，并在ChatGPT的辅助下写作。

关于阿尔法公社