AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社希望发现和投资非凡创业者(AlphaFounders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。
本图由“千象”(网址:www.hidreamai.com)生成
本周,我们观察到以下AI领域的新动向和新趋势:
1.AWS和阿里云更新AI全家桶,AWS不仅推出企业级AI助手Amazon Q,还发布文生图模型和AI芯片。阿里云则将通义千问的几个基础模型开源,最大的模型参数720亿。
2.DeepMind颠覆材料科学,它的AI工具GNoMES登上Nature杂志,GNoMES成功预测了220万种晶体结构,这一成就相当于人类近800年的知识积累。
3.AI可解释和幻觉消除方面的新突破,马毅团队提出「白盒」Transformer—CRATE,能在保持模型良好性能的同时,大大增强模型的可解释性;Meta提出全新注意力机制S2A,大幅降低模型幻觉。
1.企业级AI助手Amazon Q重磅登场,AWS还推出新模型和AI芯片
AWS最近推出了专为企业用户定制的生成式AI助手“Amazon Q”,它能够重构信息管理和工作流程,解决企业在搜索内部信息源、分析结果、撰写报告等方面的痛点。它通过连接企业的业务数据、信息和系统,提供定制化的解决方案,并内置了多个常用的数据源连接器。
Amazon Q还具备代码转换功能,能在短时间内升级大量应用程序。例如,AWS的团队在两天内利用Amazon Q将上千款应用程序从Java 8升级到了Java 17。
针对生成式AI系统普遍面临的幻觉问题,Amazon Q采取了一系列措施来确保安全性和可控性。管理员可以设置Amazon Q仅从公司文档中提取知识,确保其提供的答案和行动是可控和可过滤的。此外,Amazon Q只会返回用户有权查看的信息,并允许管理员限制敏感主题,过滤不适当的问题和答案。
AWS还对其Amazon Bedrock平台进行了升级,不仅推出了新的文生图模型Amazon Titan Image Generator,还升级了新的第三方模型Claude 2.1。此外,它发布了专为生成式AI训练设计的云端AI芯片Trainium2。
2.AI颠覆材料学!DeepMind重磅研究登Nature,预测220万晶体结构
自谷歌DeepMind用AlphaFold发现蛋白质结构后,他们的一项新研究又登上了Nature,这一次的目标是材料科学。谷歌DeepMind发布一种名为GNoME的AI工具,成功预测了220万种晶体结构,这一成就相当于近800年的知识积累。
在这220万个晶体预测中,有38万种被认为是最稳定的,可能成为未来变革性技术的关键材料,如超导体、电动汽车电池和超级计算机供电等。
GNoME使用图神经网络(GNN)模型,能够预测晶体的总能量。这种模型通过元素的单次嵌入转换成图,利用消息传递公式进行预测。GNoME的能力在于预测新材料的稳定性,极大提高了材料发现的速度和效率。
此外,全球科学家已开始利用GNoME发现的新材料进行合成实验。美国劳伦斯国家实验室与DeepMind合作,利用GNoME的预测进行自主材料合成,仅用17天就合成了41种新材料。
3.Stability AI推出SDXL Turbo,AI画图进入实时生成时代
近日,Stability AI推出了新一代图像生成模型Stable Diffusion XL Turbo(SDXL Turbo)。SDXL Turbo的特点是能够在极短的时间内(200毫秒左右)根据文本输入快速生成对应的图像,实现了文本到图像的即时转换。
SDXL Turbo的技术核心是一种叫对抗扩散蒸馏(Adversarial Diffusion Distillation,ADD)的方法。这种方法能将预训练的扩散模型的推理步骤数量大幅减少,同时保持高质量的图像输出。
SDXL Turbo的性能在多个方面优于现有的多步骤生成模型。在盲测中,SDXL Turbo以单步操作击败了LCM-XL的四步配置,并且仅用四步就超越了SDXL的五十步配置。
4.通义千问开源全家桶,最大的模型720亿参数,最小18亿模型端侧都能跑
阿里的通义千问将旗下的几个AI基础模型进行了开源,四款基础模型的参数量分别为18亿、70亿、140亿、720亿,还包括跨语言、图像、语音等多种模态的多款模型。
特别值得关注的是720亿参数的Qwen-72B模型,它在多个权威基准测评中取得了开源模型中的最优成绩,甚至超越了Llama 2-70B和大部分商用闭源模型。
除了Qwen-72B,通义千问还同时发布了小型模型Qwen-1.8B和音频模型Qwen-Audio。Qwen-1.8B的推理能力强大,仅需3G显存即可处理2K长度的文本内容,适合在手机等端侧设备上部署。
5.Keras 3.0大更新,整合PyTorch、JAX,全球250万开发者在用
深度学习框架Keras 3.0近期发布了3.0版本,实现了对PyTorch和JAX的支持,同时提升了性能,并能轻松实现大规模分布式训练。目前,全球已有超过250万的开发者在使用Keras框架。
Keras的这一转变是对市场需求的响应,根据2023年StackOverflow开发者调查和2022年Kaggle机器学习和数据科学调查,TensorFlow和PyTorch分别在生产和研究领域占据主导地位,而JAX虽然市场份额较小,但已被顶级生成式AI领域的参与者所接受。
Keras 3.0的新特性包括在JAX、TensorFlow和PyTorch上运行Keras,使用XLA编译更快地训练,通过新的Keras分发API解锁任意数量的设备和主机的训练运行。
6.打开LLM黑盒!马毅团队5年心血提出「白盒」Transformer
由马毅教授带领的来自UC伯克利,TTIC,上科大,UIUC,JHU,港大的研究人员,开创性地提出了一种「白盒」Transformer构架——CRATE,能在保持模型良好性能的同时,大大增强模型的可解释性。
这项研究通过将数据从高维度分布压缩到低维结构分布,实现有效的数据表征,从而提升了模型性能。这一发现引发了关于智能本质是否为压缩的深入讨论。长期以来,AI界对于大模型的安全性问题争论不休,主要因为神经网络的「黑盒」特性使其难以理解。CRATE的提出,可能为解决大模型安全性问题提供了新的视角。
CRATE的核心思想是基于「第一性原理」,即深度学习的本质可能就是压缩,这一理论由AI教父Hinton在90年代提出。CRATE通过「稀疏编码率减少」的方法,将数据压缩到低维混合高斯分布模型,从而推导出类似Transformer的神经网络结构。这一结构不仅在多项任务和数据集上表现出色,而且每一层和操作都具有明确的解释性。
马毅教授强调,理解现有方法的边界和本质对于推动AI研究至关重要。CRATE的研究成果不仅为AI领域带来了新的理论和实践视角,也为未来AI技术的安全性和可解释性提供了新的可能性。
7.Meta提出全新注意力机制S2A,大幅降低模型幻觉
Meta最近提出了一种新的注意力机制——System 2 Attention(S2A),旨在提高大语言模型(LLM)的事实性和客观性,从而有效减少模型的“幻觉”现象。
S2A机制的核心在于使用LLM本身构建注意力机制,通过删除不相关的文本来重写上下文,从而使模型在输出响应之前进行深思熟虑的推理决定。这种方法不仅提高了模型对事实的关注,还模拟了人类控制注意力的方式。实验结果显示,使用S2A机制的LLaMA-2-70B-chat模型在准确率上达到了80.3%。
论文还提到,人类的反馈是LLM“阿谀奉承”行为的一个重要因素。Anthropic在一项研究中指出,人工智能助手经过训练,会做出人类喜欢但不准确的回应。此外,谷歌DeepMind的研究也展示了使用合成数据进行微调以优化模型表现的可能性。
8.Hinton和LeCun再交锋,激辩LLM能否引发智能奇点!LeCun:人类理解能力碾压GPT-4
两位图灵奖得主Hinton和LeCun就大模型是否有了意识再次展开辩论,Hinton作为悲观派,认为大模型有了意识,应该着重控制风险,LeCun则持相反的意见。
他在最新论文中提出了一个通用AI助手基准GAIA,包含466个设计精良的问题和答案。这些问题旨在测试AI系统的基本能力,如推理、多模态处理、网页浏览等。结果显示,人类在这些问题上的表现远超过GPT-4,即使是使用了插件的GPT-4,其准确率也仅为15%。
GAIA的设计基于几个原则,包括瞄准概念上简单但可能乏味的问题、可解释性、对记忆的鲁棒性和易用性。这些设计原则旨在使问题对人类来说容易理解,同时对AI系统构成挑战。
这项研究不仅揭示了当前LLM在处理复杂任务上的不足,也展示了人类在理解和推理能力上的优势。
9.陶哲轩支持!AI奥林匹克数学奖来了,奖金500万美元,寻找能得IMO金牌的大模型
近日,一个专为AI设立的国际奥林匹克数学竞赛(AI-MO)引起了广泛关注。这场比赛旨在挑战AI解决复杂数学问题的能力。著名数学家陶哲轩也对此表示支持,认为这是一个评估AI解题策略的重要基准。
AI-MO的主要目标是推动大语言模型在数学推理方面的发展,鼓励开发能够匹配国际数学奥林匹克竞赛(IMO)水平的AI模型。
AI-MO比赛计划于2024年初开放,要求参赛的AI模型必须以人类选手相同的格式处理题目,并生成可读的答案。这些答案将按照IMO的标准进行评分。达到金牌水平的AI将获得500万美元的奖金,而其他实现关键里程碑的AI模型将分享剩余的500万美元奖金。值得注意的是,获奖模型必须遵守AI-MO的公共共享协议,即必须开源。
1.Pika获5500万美元A轮融资,开发AI视频生成和编辑工具
官方网站:pika.art
专注于视频领域的AI公司Pika近日获得Lightspeed Venture Partners领投的5500万美元A轮融资,Homebrew、Conviction Capital、SV Angel、Ben's Bites以及包括Quora创始人Adam D’Angelo、前GitHub CEO Nat Friedman和OpenAI创始成员Karpathy在内的知名天使投资者参与。
Pika的产品Pika 1.0也获得了广泛关注,它的主要功能包括文本生成视频、图像生成视频、视频风格转换、视频内容编辑和扩展等。它能够根据用户输入的文本或图像,快速生成高质量的视频内容。此外,Pika 1.0还支持实时编辑和修改视频,使得用户能够轻松地在视频中添加或更改元素,如更换服装、添加角色或道具等。
目前它的Discord频道人数已超过16万,有50万用户使用过他们的软件,并且现在每周都有数百万新视频由此生成。
由斯坦福大学华人博士生郭文景(Demi Guo)和Chenlin Meng联合创立,Pika 1.0的开发团队仅有4人。郭文景和Chenlin Meng都是斯坦福大学AI Lab的博士生,此前郭文景曾在Meta的AI研究部门担任工程师。
2.Together获得Kleiner Perkins领投的1.025亿美元A轮投资,打造用于训练生成式AI的云平台
官方网站:www.together.xyz
专注于AI模型开发基础设施的初创公司Together获得Kleiner Perkins领投的1.025亿美元A轮融资,NVIDIA和Emergence Capital参投。Together的联合创始人兼CEO Vipul Ved Prakash表示,这笔资金将用于扩展Together的云平台。
Together运营的是用于AI训练和推理的云平台,客户可以将自己的模型部署在他们的云平台,并对模型进行训练,微调和推理。Together作为第三方平台,让AI创业公司可以不把自己的业务与AWS等巨头公司的AI云平台绑定。它们具有从技术栈底层开始优化的能力,它们能够提供更安全,更低成本的AI模型部署服务。
为了补充云服务,Together提供了所谓的“定制模型”,这是一项咨询服务,允许客户将自己的数据带到Together云平台,并由Together团队设计、构建和测试模型。
最近比较热门的AI视频公司Pika也在Together的GPU集群上构建了一个模型,并在集群上训练、迭代和运行模型,这个模型每月要生成数百万视频。
Vipul Ved Prakash与Ce Zhang、Chris Re和Percy Liang共同创立了Together,Prakash此前创立了社交媒体搜索平台Topsy,并于2013年被苹果收购,随后成为苹果的高级总监。
3.利用大模型开发游戏引擎,李沐大模型公司细节曝光
知名AI专家李沐和他的导师Alex Smola共同创立的公司Boson.ai,自成立以来一直保持着神秘的姿态。这家公司此前披露的方向是开发“可扩展基础模型”,而最近它的一些细节浮出水面,它们计划利用大模型的能力来开发游戏引擎。
他们将利用大模型在创意生成、编辑能力和语音指令控制方面的优势,同时也可能为游戏中的非玩家角色(NPC)赋予更加独特和丰富的AI特性,从而增强玩家的互动体验和游戏的可玩性。为NPC增加个性的方向,此前已经有估值5亿美元的创业公司Inworld在耕耘。
李沐和Alex Smola都是AI领域的知名人物。李沐此前是亚马逊的首席科学家,而Alex Smola是杰出科学家,此外Alex Smola也是CMU的教授,还是李沐的博士导师。他们都在机器学习领域有深厚的造诣。
4.帮助企业自动化后台办公流程,Kognitos获Khosla Ventures领投的2000万美元A轮融资
官方网站:www.kognitos.com
Kognitos是一家专注于帮助企业自动化后台办公流程的公司,它近日完成了2000万美元的A轮融资,由Khosla Ventures领投,Clear Ventures、Engineering Capital和Wipro Ventures参投。这使得这家拥有35人的公司的总融资额达到了3000万美元。
Kognitos是利用AI自动化企业的业务和办公流程,消除低效率,它的直接竞争对手包括UiPath和AdeptAI。Kognitos的创始人Binny Gill声称,Kognitos能完成比现有产品更复杂的业务,而且操作更加直观。除了能够构建自动工作流外,它还能自动标记这些工作流中的错误。
Kognitos的解决方案既适用于设定公司业务流程的业务流程专家,也适用于基层员工,即使是具有中等技术能力的用户也可以在不需要编码经验的情况下使用Kognitos的界面。
Kognitos目前可以自动化涉及多个市场和模式的任务,如语音转录、轻量级图像编辑、二维码扫描、创建数据可视化和填写表格。
Kognitos的创始人Binny Gill曾是IBM的研究员,并担任过Nutanix的首席技术官(CTO)。这些经历为他在技术和商业领域积累了深厚的知识和经验,特别是在人工智能和自动化技术方面。
5.视觉障碍AI辅助设备提供商Biped.ai获120万瑞士法郎种子轮融资
官方网站:www.biped.ai
Biped.ai是世界首个面向盲人和视障人士的AI Copilot提供商,它最近完成了120万瑞士法郎(约合136万美元)的种子轮融资。本轮融资吸引了一系列知名投资者,包括Serpentine Ventures、Juchum Foundation和部分著名商业天使投资者。
当前,全球有近2.7亿视障人士,其中75岁以上的有2.5亿人。为了帮助该人群获得独立的移动能力,Biped.ai开发了创新AI导航系统赋能的智能导航安全带。这款设备是一种900克的可穿戴装置,配备了3D摄像头和人工智能算法与导航系统,可以实时指导用户并避开障碍物,提高他们的独立性和安全性。
Biped.ai的首要目标是欧美市场。进入美国市场是其当前的战略举措,旨在为北美广大的视障人士群体提供先进的AI移动解决方案。
Biped.ai的创始人是Maël Fabien,他毕业于瑞士洛桑大学的附属商学院。Biped.ai的团队还包括Paul Prevel(机器人工程师)、Bruno Vollmer(CTO)等5名软件/机器人工程师、250名beta测试人员和10名来自欧洲和美国的合作伙伴。
6.致力于用AI研发精准精神病学药物的Alto Neuroscience获4500万美元C轮融资
官方网站:www.altoneuroscience.com
通过人工智能驱动的生物标志物平台研发精准精神病学药物的Alto Neuroscience近日完成了4500万美元C轮融资,本轮融资由InVivium Capital领投,Franklin Templeton、Point72、Eli Lilly and Company和Alexandria Venture Investments等跟投。目前,Alto Neuroscience的累计融资额达到1.8亿美元。
心理健康状况是由独特的生物因素驱动的,具有相同诊断的人可能对特定药物有不同的反应。从此前的药物开发历史上看,临床试验设计没有充分考虑这些差异,导致精神病学药物开发持续缺乏创新。
Alto Neuroscience研发的人工智能驱动的精准精神病学平台通过分析脑电图活动、行为任务表现、可穿戴设备数据、遗传学和其他因素来测量大脑生物标志物,以便为每位患者匹配合适的药物。
该公司在识别和分类心理功能核心领域(认知、情绪和睡眠过程)方面的工作中,形成了一种支持可靠药物反应预测的多模式方法。Alto Neuroscience最初的临床研究重点是抑郁症和创伤后应激障碍,但是其研发的的产品线和生物标志物平台旨在广泛应用于各种精神疾病和神经病学。
Alto Neuroscience由斯坦福大学的精神病学教授Amit Etkin创立,团队成员还包括Dan Segal(COO),吴伟博士(首席数据科学官),Adam Savitz博士(首席医疗官)等。创始人领导的世界级跨学科团队参与了 25 种药物的审批和100多种药物的研究,带来了临床试验、数据科学和计算方面的丰富经验。
7.AI驱动的活动智能平台Vendelux获FirstMark领投的1400万美元A轮投资
官方网站:vendelux.com
人工智能活动平台Vendelux近日获得FirstMark Capital领投的1400万美元A轮投资,其他投资人包括Cervin Ventures以及其中一些活动组织者和营销商的创始人,目前它的累计融资额达1640万美元。
活动几乎总是所有B2B营销预算中最大的单项项目,但活动营销的几乎每个方面都是不透明的。B2B的CMO们很难说清楚嘉宾邀请和活动的投资回报率等细节。
在AI和预测模型的支持下,Vendelux的平台使活动营销人员和CMO能够分析客户和竞争对手的行为,就参加或赞助哪些活动做出明智的决策,并最终吸引更多客户以提高投资回报率。
凭借来自超过160,000场全球活动的6500万个数据点以及深入的CRM集成,Vendelux的数据驱动解决方案实现了行业首创:全球范围内的现场活动、贸易展览和会议的可量化业务影响。
Vendelux由两位前Shutterstock高管Alex Reynolds(CEO)和Stefan Deeran联合创立,Alex Reynolds曾担任Shutterstock平台解决方案总经理,并在Bain & Company担任管理咨询职务。Stefan Deeran此前在Shutterstock组建并领导了平台解决方案部门的新业务团队。
8.人工智能材料开发平台Osium AI获得240万美元种子轮融资
官方网站:osium.ai
近日,用AI技术加速材料科学创新的初创公司Osium AI获得240万美元种子轮融资,该轮融资由多位投资者共同参与,包括Y Combinator、Singular、Kima Ventures、Collaborative Fund、Raise Phiture 和Julien Chaumond、Thomas Clozel、Isaac Oates、Liz Wessel、Ebert Hera Group等。
在材料学界,目前的材料开发技术仍然是非常手工的,需要依靠大量的试错,很多方法依靠直觉,大量的实验和试错拖慢了开发进程。
在AI技术的帮助下,利用数据驱动方法优化材料配方和测试之间的反馈回路,成功变革了材料开发周期,大大加速了新材料开发的速度。利用这项专有技术,工业公司可以根据一系列标准预测新材料的物理性质。
之后,Osium AI 还能帮助完善和优化这些新材料,同时避免试错过程中常见的错误。在早期实践中,Osium AI 帮助客户将材料的开发和分析速度提高10倍。
Osium AI由Sarah Najmark和Luisa Bouneder联合创立。Sarah毕业于斯坦福大学,曾在斯坦福大学担任过研究助理,领导了数项AI科研项目,积累了AI领域的专业知识;毕业后,她还加入了谷歌的X创新实验室,并合作研发了数项专利。Luisa和Sarah是斯坦福大学的同学和朋友,毕业后曾在Emerton担任过策略&数据工程师,目前在Osium担任CTO。
本文由阿尔法公社综合自多个信息源,并在ChatGPT的辅助下写作,封面图片由Hidream.ai的Pixeling(千象)生成。
关于阿尔法公社