AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的资讯周报。阿尔法公社希望发现和投资非凡创业者(AlphaFounders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。
本周,我们观察到以下AI领域的新动向和新趋势:
1.Meta发布Llama 2大模型,这款大模型的意义不在于参数和性能的提升,而是完全开源和免费商用,它帮助AI领域的创业者节省了99%的模型训练算力成本,跨越算力鸿沟。
2.RetNet打破AI的不可能三角,微软亚洲研究院和清华大学的研究者提出的新型网络架构RetNet实现了低成本推理、高效长序列建模、媲美Transformer的性能和并行模型训练,打破了“不可能三角”。
3.Replicate连获2轮融资,它是提供机器学习模型部署的初创企业,帮助客户公司以最短的时间、最高效的方式搭建自己的“ChatGPT”平台。在今年2月获得1250万A轮融资后,它又获得3200万美元新融资。
1.开源大模型重击OpenAI!小扎放出Llama 2炸裂科技圈,联手微软高通冲击市格局
Meta发布的Llama 2,是一个免费、可直接商用的、能力强大的模型。Llama 2分为70亿、130亿、340亿以及700亿参数的不同规模的模型。
模型的预训练过程,相较于上一代参数增长40%,上下文长度也增加了一倍,并采用分组查询注意力机制(GQA)来提升性能。微调阶段,其版本称为Llama 2-Chat,共收集了超100万条人工标注用于SFT(监督微调)和RLHF。
Llama 2对于创业者最大的意义在于开源和免费商业化,它帮助创业者节省了99%的模型训练算力成本,跨越了算力鸿沟,而99%的企业需要第三方模型服务。大模型的开放之路,让人们看到了产业AI化的曙光。
2.ChatGPT重磅上新!教练、营养师人格任你选,自定义指令秒变“高级个人AI助理”
ChatGPT近日发布了最新功能—自定义指令。它让用户可以设定背景信息,以及期望ChatGPT输出的格式,使其变成个人助理,教练,营养师等角色。
自定义指令功能的推出,让每个人都能根据自己的想法,打造自己的ChatGPT。例如,老师在制定课程计划时,不用每次都向ChatGPT重复自己正在教授的是三年级科学课程,只需在“自定义指令”中输入背景和输出格式,ChatGPT会在以后的每次对话考虑指令。
目前这个功能仅向Plus用户开放,且无法在英国和欧盟使用。此外,OpenAI宣布下周向所有Plus用户解禁GPT-4的能力,从原来的每3小时25条,增加到50条。
DeepMind利用基础模型(Foundation Models)来打造统一的强化学习智能体。DeepMind的研究者设计了一个全新的框架,该框架将语言置于强化学习机器人智能体的核心。
智能体首先需要将视觉输入映射到文本描述;然后用文本描述和任务描述对LLM(大语言模型)进行提示工程,以向智能体提供语言指令。最后,智能体需要将LLM的输出转化为行动。
这种方法可以解决强化学习设置中的一系列基础问题,如高效探索稀疏奖励环境、重新使用收集的数据来有序引导新任务的学习、调度学得的技巧来解决新任务、从专家智能体的观察中学习等。这种以语言为中心的智能体框架为解决强化学习中的一系列基本挑战提供了一个新的统一的框架。
Meta发布了首个单一多模态模型——CM3leon,这是一款基于Transformer的模型,能在文生图和图像理解领域实现突破。
CM3leon的创新之处在于,它将多模态组合成单一模型,能理解、编辑、生成图像、视频、文本等。
CM3leon采用了基于tokenizer的自回归模型,这种模型在文生图领域不仅比基于扩散模型的方法更有效,而且训练的计算量还比此前基于Transformer的方法少了五倍。CM3leon不仅可以准确渲染图像,还可以根据任意格式的文本指令对现有图像进行编辑,并为图像生成标注、回答有关图像内容的问题,甚至可以根据边界框和分割图的文本描述创建图像。
斯坦福大学的博士Tri Dao开发的FlashAttention-2是一种新的注意力算法,可以显著提高Transformer模型的运行速度和上下文长度。Tri Dao最近还加入了生成式AI初创公司Together AI担任首席科学家。
FlashAttention-2可以加快Attention(Transformer模型的核心算法)的运行速度,并减少其内存占用。相比于其前身FlashAttention,FlashAttention-2的速度提升了2倍,相较于PyTorch的标准注意力,其运行速度最高提高了9倍。
FlashAttention-2的出现,不仅可以加速现有模型的训练、微调和推理,还可以用更长的上下文来训练AI模型,这对于理解长篇书籍和报告、高分辨率图像、音频和视频等任务具有重要意义。
Stability AI的新产品Stable Doodle是一款可以将简单草图转化为电影级大片的作图神器。用户只需要简单勾勒出草图,Stable Doodle就能将其转化为色彩丰富、完全渲染的大片级图像。
Stable Doodle的强大之处在于,它不仅可以根据用户的草图生成图像,还可以根据用户的prompt进一步优化图像。例如,用户可以画出一个建筑物的轮廓,然后输入prompt「Cityspace with full moon(满月下的街景)」,Stable Doodle就能生成相应的图像。
Stable Doodle的背后技术是Stability AI的SDXL和Tencent ARC开发的T2I-Adapter。T2I-Adapter是一个由大约770万个参数组成的网络,它可以在冻结原始大型文本到图像模型的同时,为预训练的文本到图像模型提供额外的引导,以增强对生成过程的控制。
微软亚洲研究院和清华大学的研究者提出的新型网络架构——RetNet。RetNet是一种retentive网络,它实现了低成本推理、高效长序列建模、媲美Transformer的性能和并行模型训练,打破了“不可能三角”。
RetNet引入了一种多尺度retention机制来替代多头注意力,它有三种计算范式:并行、循环和分块循环表征。
实验结果表明,RetNet在scaling曲线和上下文学习方面始终具有竞争力。对于7B模型和8k序列长度,RetNet的解码速度是带键值缓存的Transformers的8.4倍,内存节省70%。
在训练过程中,RetNet也能够比标准Transformer节省25-50%的内存,实现7倍的加速,并在高度优化的FlashAttention方面具有优势。
字节跳动团队提出一种多模态大语言模型-猞猁Lynx。Lynx模型的训练策略包括网络结构、训练数据、指示等多个方面。字节跳动团队通过实验得出了多模态大模型的指示遵循能力不如普通大模型,训练数据的质量对模型的性能至关重要,任务和提示对零样本能力非常关键,平衡正确性和语言生成能力十分必要等结论。
Lynx模型采用了prefix-finetuning为主要结构,进行了两阶段训练,实验结果显示Lynx模型在多模态理解准确度和多模态生成能力上都表现出色。此外,论文还首次提出了包括图像和视频任务的开放式视觉问答评估集Open-VQA,用于评估和比较这些模型。
彭博社爆料,苹果正在开发自己的聊天机器人,代号Ajax,也被内部工程师称为AppleGPT。
这个项目由机器学习和AI战略高级副总裁John Giannandrea和软件工程师高级副总裁Craig Federighi共同领导,目前已经有多个团队加入到该项目的开发中。
据报道,苹果希望在明年某个时候发布“与人工智能相关的重大公告”。此外,苹果一直在积极收购初创公司,以加强自己的人工智能布局。公开的收购进展中,2020年起码有四个被收购的AI初创公司,包括Xnor.ai和Vilynx等。
1.开源的类ChatGPT平台Replicate再获3200万美元新融资
官方网站:https://replicate.com/
开源人工智能初创公司Replicate获得3200万美元融资,这是它继2月获得a16z领投的1250万美元A轮融资后,再次获得新融资,它的投资者名单上还有YC和红杉资本的名字。
Replicate AI是一家提供机器学习模型部署的公司,主要业务是提供机器学习模型部署服务。开发人员可以在其人工智能平台上以最少的代码部署大模型,从而提高流程效率。
Replicate的开源机器学习平台不仅能提供类似ChatGPT的文生文功能,还提供了类似Midjourney的图片生成、图像修复、自动生成视频、自动生成音频、二次元生成等上千个机器模型。简单来说,Replicate可提供AI自动处理文本、图片、视频、音频的功能,并且支持自然语言描述。
Replicate通过开源的方式帮助那些想尝试AIGC产品的企业快速成长,以最短的时间、最高效的方式搭建自己的“ChatGPT”平台,为企业进一步节省算力资源和技术维护成本。
Replicate AI创始人Andreas Jansson是机器学习和音乐信息检索方面的专家,曾在Spotify从事研究工具和基础设施的开发,拥有音乐机器学习方面的博士学位。联合创始人Ben Firshman是一位资深的软件工程师和产品经理,曾在Docker担任产品负责人,是Docker Compose的创造者。
2.AI语音初创公司Resemble AI获得800万美元A轮融资
官方网站:www.resemble.ai/
AI语音初创公司Resemble AI获得由Javelin Venture Partners领投,Craft Ventures和Ubiquity Ventures跟投的800万美元A轮融资。
ResembleAI是一个使用生成式人工智能来克隆逼真声音的平台,可以将声音“转换成”其他语言,生成来自配音演员的个性化信息,并创建实时的对话代理。
Resemble AI可以在50多种最流行的语言中生成跨语言和自然说话的声音,还可以创建编程音频,编辑和替换音频片段中的单词。
Resemble Detect则使用人工智能模型来验证音频数据的真实性。该模型本质上是“看到”不同的频率,然后对剪辑的“真实性”进行预测。
通常情况下,语音翻译平均需要两个月的时间,并可能花费公司数十万美元,ResembleAI声称可以在数秒内大规模克隆声音,提供最大的创造性灵活性和效率。
Resemble由Ahmed和Saqib Muhammad创立。Ahmed曾在Magic Leap担任首席软件工程师。
3.人工智能驱动的老年护理公司CarePredict获2900万美元A-3轮融资
官方网站:www.carepredict.com/
CarePredict获得由Aspire Healthtech Partners和SV Health Investors等共同领投的2900万美元A-3轮投资。
CarePredict是一家可穿戴设备开发商,其产品主要是应用于辅助记忆保健、独立生活服务以及整体的家庭护理服务等领域,通过提供个性化的护理和监测解决方案,帮助老年人们更好地管理和关注他们的健康和生活质量。
CarePredict为老年护理提供的人工智能平台,结合了可穿戴技术、室内位置跟踪、机器学习和预测分析。其可穿戴设备Tempo包含传感器,可以检测人们的日常生活活动,包括洗澡、喝水、吃饭、如厕、行走、睡眠等。
它还包括一个触摸按钮呼叫系统,用于与护理人员沟通,并提供个人的准确室内位置。此外,Tempo也能进行接触者跟踪、位置跟踪、路径跟踪和房间流量,透过使用室内定位技术来识别工作人员或患者在设施中的位置以及他们与谁接触过。
4.人工智能初创公司Nomic AI获得1700万美元A轮融资
官方网站:https://home.nomic.ai/
人工智能初创公司Nomic AI宣布完成由Coatue领投的1700万美元A轮融资,Contrary Capital、SV Angel、Story Ventures以及众多天使投资人参投,Nomic目前估值约为1亿美元。
Nomic成立于2022年,目前已经发布了两款产品,一款是与ChatGPT类似的开源大型语言模型GPT4 ALL,提供任何人免费下载使用。
另一款Atlas是可视化非结构化数据集的工具,使任何人都能在他们的浏览器中可视化、组织、交互和搜索大规模数据集,可用于构建其他大语言模型,目标是提升模型训练中数据集的可见性,并民主化访问AI模型的途径。
Nomic AI的联合创始人Andriy Mulyar表示:“我们希望让人们能够访问专门针对他们关心的用例的最强大的模型,并自己构建这些系统。他们需要能够理解哪些数据进入了这些系统。”他计划将新融资用于招聘和产品开发。
Nomic表示,其产品已被包括Hugging Face在内的多家公司使用。它还与MongoDB和Replit建立了合作关系。
5.AI驱动的客户数据平台公司Lantern完成680万美元种子轮融资
官方网站:www.withlantern.com/
Lantern获得Primary Ventures和Moxxie Ventures领投的680万美元种子轮融资,其他投资者包括8-Bit Capital、Coalition Operators、8VC等。
在众多供应商争夺关注的情况下,与客户进行连接变得更加困难。面向客户的团队应该主动提供价值,而不是盲目地向客户发自动化邮件。Lantern是一个旨在提高净收入保留率(Net Revenue Retention)的全能客户数据平台,帮助B2B公司通过利用现有客户,开辟全新的销售渠道。
Lantern的实时B2B用户数据平台可以一键式连接用户的各种数据来源。然后,通过一系列基于人工智能技术的工具,为用户提供洞察力,例如自动检测客户扩展和流失。
它的其中一项工具有助于确定最有可能接受升级销售的客户,而最新的工具则帮助销售人员找到近期换了工作的客户,并自动创建潜在客户以针对他们的新账户进行定位。该平台将客户成功、销售和产品团队整合起来,加快价值实现,并在最重要的时刻与客户进行连接,将用户团队的工作方式从被动变为主动。
6.Flagship获得Insight Partners领投的500万美元种子轮融资
官方网站:https://flagshiprtl.com/
零售库存规划平台Flagship获得由Insight Partners领投的500万美元种子轮融资。
低效和不成熟的库存规划给品牌和零售商每年造成数百万的损失,Flagship的一站式Saas平台解决了零售行业中的库存规划问题。借助先进的机器学习和人工智能模型,Flagship提供预测智能,供零售商用于优化库存决策。
Flagship的解决方案结合了客户级别和产品特征级别的数据,从而实现更准确的需求预测和更智能的库存管理。平台的回测中显示改进的库存决策仅从提前售罄方面,就可以为目标市场中的品牌每个商品节省4万美元至15万美元不等。
Flagship的首席技术官Haftan Eckholdt在数据科学领域拥有丰富的经验。在加入Flagship之前,他曾在AIG、Audible和Understood.org等公司担任数据科学的高级管理职位。
7.基于AI的数字交易平台Revolear获得600万美元种子轮融资
官方网站:www.revolear.com/
近日,Revolear获得600万美元种子轮投资,投资者来自销售和CRM行业高管Craig Ramsey、Mark Armanante、Young Sohn、Matt Wallach和James Ramsey,他们共同创立了Veeva(纽约证券交易所代码:Veev)和Vlocity,后者被Salesforce以15亿美元收购。
Revolear是一个基于AI的企业级SaaS数字交易平台,它致力于解决企业在B2B决策过程中面临的协调和交易达成问题。Revolear的核心是其专有的DealCraft解决方案建模技术,该技术使平台能够轻松适应各种行业和商业结构。
“我们在平台的每个方面都注入了AI——从使用机器学习预测优化价格,到使用GPT合成需求和草案提案,再到智能地自动化审批工作流。”Revolear的创始人兼CEO Raja Singh表示。
Raja Singh在设计CRM产品方面拥有近25年的经验,最初在CRM先驱Siebel Systems担任金融服务产品线负责人,后来担任Vlocity的高级副总裁兼产品总监。2022年他离开了Salesforce的高级副总裁兼总经理职位,创立了Revolear。
本文由阿尔法公社综合自多个信息源,并在ChatGPT的辅助下写作。
关于阿尔法公社