AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社希望发现和投资非凡创业者(AlphaFounders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。
本图由Pixeling(千象)生成
本周,我们观察到以下AI领域的新动向和新趋势:
1.ChatGPT多模态能力即将上线,ChatGPT将能处理音频和视频内容,这个能力主要由GPT-4V大模型支持。此外,OpenAI的Sam Altman被曝与孙正义,苹果原设计总监Ive合作打造AI硬件。
2.Anthropic获亚马逊投资的40亿美元融资,此前Anthropic已累计获得7亿美金融资,新融资将支持它继续紧追OpenAI(OpenAI被曝估值已超过800亿美元),而这也被认为是亚马逊为了与微软和谷歌在AI领域竞争的重要动作。
3.DeepMind创始人斩获“诺奖风向标”拉斯克奖,同时获奖的还有John Jumper,该奖项奖励了他们联合发明的AlphaFold在蛋白质三维结构预测方面做出的革命性贡献。
1.多模态能力即将上线,GPT-4V让ChatGPT能说会看
9月25日,OpenAI宣布对ChatGPT进行重大更新,推出了多模态功能,这使ChatGPT能够基于图像进行分析和语音对话。
新的图像识别功能允许用户上传图像与模型进行交互,可应用于多种日常场景。此外,移动端App还将加入语音合成选项,使用户能够与AI助手进行口头对话。ChatGPT的新语音合成功能由OpenAI的新文本到语音模型驱动,用户可在应用设置中选择语音对话,并从多种合成声音中选择。OpenAI计划在未来两周内向Plus和Enterprise订阅者推出这些新功能。
在背后支撑一切的是GPT-4V大模型,这个模型背后的技术主要来自GPT-4。为确保GPT-4V更加安全,OpenAI在内测期间开展了大量对齐工作,进行了定性和定量评估、专家红队测试、以及缓解措施。
OpenAI目前估值已达800亿至900亿美元,成为全球估值最高的初创公司之一。微软目前持有OpenAI 49%的股份。OpenAI预计今年的收入将达到10亿美元,而到2024年,公司收入会更高,达到几十亿美元。
2.Sam Altman被曝与苹果传奇设计师、软银孙正义秘密接触,全新AI硬件酝酿中
OpenAI的CEO Sam Altman近期被曝正在秘密接触前苹果首席设计师Jony Ive和软银集团CEO孙正义探讨全新AI硬件的可能性。这一消息震动了科技界,引发了对未来AI硬件产品的广泛猜测。
有观点认为,如果合作成功,可能会见证设计、科技和硬件三方面的顶尖人物的联合,将是一次具有历史意义的结盟。
目前为止,Altman已经投资了一家消费硬件初创公司Humane,并是该公司最大的投资者之⼀。这家公司由苹果前员工Imran Chaudhri和软件工程师Bethany Bongiorno创立。Humane计划开发一种无屏幕的可穿戴设备,通过语音提示和手势进行操作,同时将信息投射到物体表⾯。
3.特斯拉“擎天柱”机器人由端到端AI大脑加持,挑战高难度瑜伽
自去年发布后,斯拉的人形机器人“擎天柱”近期展示了其令人震惊的能力和进展。它采用了端到端的神经网络,能够精准分类物体和维持身体平衡。它可以自主对对象进行排序,精确操控手部和腿部的动作,更高效地学习各种任务。
它能够自动分类不同颜色的积木块,即便在干扰下也能保持工作。擎天柱还展示了自主纠正的能力,能够在积木倒下时将其重新摆正。此外,它还能执行与之相反的动作,如将积木再拿出来。
特斯拉的这一创新不仅是在机器人技术方面的突破,更是在AI技术的应用和发展上迈出了重要一步。
4.DeepMind创始人斩获“诺奖风向标”拉斯克奖,AlphaFold成“AI for Science”标杆
近日,生理学和医学领域的顶级大奖拉斯克(The Lasker Awards)奖揭晓,今年拉斯克奖的基础医学研究奖授予了来自Google DeepMind的Demis Hassabis(创始人)和John Jumper,他们发明的AlphaFold在蛋白质三维结构预测方面做出了革命性的贡献。
AlphaFold是一种人工智能系统,能够仅基于氨基酸序列(1D)预测蛋白质结构(3D)。这一突破性技术已经改变了生物学研究的格局,使科学家能够更加深入地研究蛋白质,以了解其生物功能并指导药物的开发。AlphaFold的精确度可与实验技术相媲美,其源代码和庞大的蛋白质数据库已向公众开放。
5.投资多家AI独角兽后,SAP推出企业级AI助手Joule
德国企业服务巨头SAP近日发布了一款名为“Joule”的新AI助手,旨在为企业客户“赋能”,帮助他们实现更好的业务成果。
Joule的能力包括多语言回答问题和基于SAP各种服务和第三方数据源提出解决方案。这使得Joule在如帮助制造商识别销售问题和提供与供应链相关的可行解决方案等场景中具有极高的价值。
Joule将整合到SAP的全面云企业套件中,使客户能够跨SAP应用和程序进行访问,类似于微软的Windows Copilot。SAP已经构建了一个“AI基础设施”,确保Joule和其他SAP AI产品能够提供可信、安全、私密且符合合规的AI。
SAP在今年早些时候投资了Aleph Alpha、Anthropic和Cohere等AI独角兽,Joule的基础AI能力很可能由这些公司的技术支持。
6.阿里140亿大模型开源,10项任务超340亿Llama2
阿里巴巴近期开源了一款名为Qwen-14B的大语言模型,其参数量达到140亿。Qwen-14B在多个任务榜单中均取得了第一的成绩,超过了Meta的340亿参数Llama 2版本。该模型的训练数据量达到了3万亿tokens,涵盖了中英文,并且序列长度可达8192。
Qwen-14B不仅在语言理解方面表现卓越,还展现了出色的代码编写能力,例如能够编写出完整的贪吃蛇游戏代码。此外,该模型还能自行调用工具,执行Python代码,进行数学计算、数据分析和数据图表绘制等。阿里巴巴此前还开源了Qwen-7B和Qwen-VL模型,分别具备中英文通用模型和视觉语言大模型的功能。
7.无惧图像中的文字,TextDiffuser提供更高质量文本渲染
近年来,文生图(Text-to-Image)领域在AIGC时代取得了巨大进展。但现有模型在稳定生成包含文本的图像方面仍面临挑战,生成的文字部分常常是不可读的。
为解决这一问题,研究者提出了TextDiffuser模型,它能更灵活、全面地生成包含易读文本的高质量图像,有助于辅助设计师的工作并激发设计灵感。
TextDiffuser模型包含两个阶段,第一阶段生成Layout,第二阶段生成图像。模型接受一段文本Prompt,根据Prompt中的关键词确定每个关键词的Layout,然后渲染出文本。TextDiffuser在文本渲染领域取得了显著的进展,未来将进一步提升其效果。
8.AI独角兽Cohere提出新方法:只需更新0.32%的参数就能完成模型微调
由Transformer论文作者Aidan联合创立的AI独角兽Cohere近日提出了一种极其参数高效的AI模型微调方法,该方法结合了混合专家(MoE)方法与参数高效型微调(PEFT),仅需更新不到1%的参数,就能让微调后的模型在陌生任务上实现与完全微调模型相当的性能。
这一新框架名为Mixture of Vectors(MoV)和Mixture of LORA(MoLORA),特别适合大规模Transformer模型,它能在有限的计算环境中发挥MoE的优势,显著减少内存消耗和计算开销。Cohere的这一突破性研究为AI领域带来了新的可能性,使得在更加现实和受限的设置中使用MoE成为可能,为未来的AI模型开发和应用提供了新的方向和思路。
9.大模型的最大bug,回答正确率几乎为零,GPT到Llama无一幸免
最近,研究人员发现了大模型在逻辑推理方面的主要缺陷,即“逆转诅咒”(Reversal Curse),GPT和Llama都无法避免。这一问题表现为,当模型学会“A是B”这一知识后,却无法正确推理出“B是A”。
例如,模型能正确回答“奥拉夫·朔尔茨是谁?”(德国第九任总理),但无法回答“德国第九任总理是谁?”。这一现象不仅出现在合成数据的实验中,还在实际名人及其父母的事实测试中得到验证。
研究人员尝试了多种方法来解决这一问题,例如使用不同大小的模型,改变训练数据集中句子的形式,但这些方法都未能实现模型的泛化。这一发现引起了广泛关注,有人认为这揭示了训练数据和上下文在知识泛化过程中的重要性。未来的研究将进一步探索大模型是否能逆转其他类型的关系。
1.超级AI独角兽Anthropic再获亚马逊40亿美元投资
官方网站:www.anthropic.com
Anthropic被视为OpenAI的主要竞争对手,最近获得了亚马逊高达40亿美元的投资。它由OpenAI的前研究副总裁Dario Amodei和GPT-3论文的第一作者Tom Brown等人于2021年共同创立。
它的主要产品是与ChatGPT直接对标的Claude系列人工智能助手,最新的Claude 2能够实现更长文本的响应,并在编程、数学、推理等方面有大幅提升。
Anthropic此前已经获得超过7亿美元的资金,企业投资者包括谷歌和SK Telecom。亚马逊的投资将使Anthropic使用亚马逊的AWS进行关键任务工作负载,并利用AWS Trainium和Inferentia芯片来构建、训练和部署其未来的基础模型。
Anthropic的模型已在多个行业得到应用,包括法律、资产管理和旅游。此次亚马逊的投资被视为是微软、谷歌和亚马逊之间的“大战”的一部分。
2.企业非结构化数据管理平台Pryon获得1亿美元B轮融资
官方网站:pryon.com
Pryon近日完成由U.S. Innovative Technology Fund领投的1亿美元B轮融资,Aperture Venture Capital, Duke Capital Partners, Good Growth Capital等机构参投。这笔融资使Pryon的融资总额达到1.37亿美元,投后估值达到5亿至7.5亿美元之间。
Pryon是人工智能驱动的企业搜索服务平台,它直接对标亚马逊的Kendra。Pryon利用连接器来统一和索引数据库中的信息源,该平台可以与第三方聊天机器人交互,提取音频、图像、文本和视频等非结构化数据,并将其转换为可由连接到它的任何前端搜索和使用的格式。
Pryon声称它的准确度比Kendra高2倍,提取数据的速度快10倍,并且可以索引数十亿文档,而Kendra的文档限制为十万个。Pryon以保护隐私的方式在平台上创建,更新或删除内容只需要不到一秒钟的时间,而且该平台不会留下任何索引工作的痕迹。
Pryon的创始人Igor Jablokov曾经领导了IBM的多模式人工智能研究团队,并且创立了语音识别初创公司Yap,这家公司后被亚马逊收购。
3.AI书面内容输出平台Writer获得由ICONIQ Growth领投的1亿美元B轮融资
官方网站:writer.com
Writer近日完成由ICONIQ Growth领投,Insight Partners、Aspect Ventures以及自身客户埃森哲和Vanguard参投的1亿美元B轮融资;该轮融资使Writer的融资总额达到1.26亿美元,公司的投后估值在5亿至7.5亿美元之间。
由于其业务集中在文字处理领域,所以它的竞争对手众多,包括OpenAI、Anthropic、AI21 Labs、Jasper、Cohere和Typeface等。
Writer声称自己的竞争优势在于更困难,更深层的用例,这些用例需要增强检索、数据收集清理以及工作流程构建。它允许客户将其模型连接到业务数据源,以提高其研究、事实核查和回答问题的能力。此外,Writer允许公司在其平台上的模型中执行监管、法律和品牌规则。
它技术上的独特之处在于,它在不受版权保护的商业写作上训练了其可微调的模型,在美国AIGC作品的版权仍然有些模糊的现状下,这可能是一个重要的优势;公司还表示其模型比平均水平“小”,因此更具“性价比”。
目前,Writer的客户包括United Healthcare、UiPath、Spotify、L'Oreal、Uber和Accenture等。它声称自己过去两年收入增长了10倍。
Writer由May Habib和Waseem AlShikh于2020年共同创立。Habib毕业于哈佛大学,曾担任雷曼兄弟的分析师;AlShikh则在多家公司担任过高级软件工程师,同时是CloudAppers的工程总监和iMENA的CTO。二人都是成功的连续创业者,曾经联合创立了软件开发公司Qordoba。
4.人工智能赋能保健的Corti获得6000万美元B轮融资
官方网站:www.corti.ai
Corti利用人工智能帮助医疗保健提供商在正确的时间为患者提供正确的医疗保健。它近期获得由Prosus Ventures和Atomico共同领投的6000万美元B轮融资,Eurazeo、EIFO和Chr.等现有投资者也参与了投资,其累计融资超过8600万美元。
Cortize为医疗保健专业人员提供AI助手,帮助医生在与患者互动过程中提供优质的护理,同时将管理工作量降至最低。
它的AI助手涵盖了许多可能适用的领域:在患者互动期间进行分类,记录整个互动,包括机构可能使用的管理编码,对这种互动进行分析,以指导决策,有时给出可能与临床医生想法相反的“第二意见”,并在实时和会后提供注释,以确定需要改进的领域并培训临床医生。
Cortize由Andreas Cleve(CEO)和Lars Maaløe(CTO)联合创立,他们都在人工智能和软件方面有丰富经验。Cleve是成功的连续创业者,是Ovivo的联合创始人;Lars Maaløe则是丹麦技术大学的机器学习博士,在苹果、Issuu等多家公司担任机器学习研究员。
5.人工智能房地产空间规划公司Qbiq获得1000万美元种子轮融资
官方网站:qbiq.ai
人工智能房地产空间规划平台Qbiq获得由JLL Spark Global Ventures、Ocean Azul、Randomforest和M-FUND等多个战略投资者投资的1000 万美元种子轮融资。
qbiq的生成式人工智能和可视化平台可以在几分钟内生成优化的房屋布局和3D可视化,而传统方法可能需要几周时间。用户可以在这个平台上输入空间布局和设计要求,平台则提供量身定制的规划包。
qbiq使房产经纪人、房东和建筑师能够更快地做出决策、更有效地完成交易、降低空置率并提高规划能力。
qbiq由Leeor Solnik、Elad Kaminer和Noam Diamantstein联合创立,他们在软件、系统架构、机器学习、大数据、云和网络方面拥有丰富经验,也在营销,商务等方面有所建树。
6.AI学习初创公司Gizmo获由NFX、Ada Ventures投资的350万美元种子轮融资
官方网站:gizmo.ai
Gizmo获由NFX、Ada Ventures和Capital T投资的350万美元种子轮融资。
Gizmo是一家利用游戏化测验来吸引学习者的生成式人工智能学习初创公司。他们的目标是用生成式AI帮助人们以有趣的方式增强学习时的记忆。
例如,它可以从PDF、PPT、网页甚至视频中提取信息,并做成带有测试题目的学习卡片。个性化的学习卡片可以帮助人们增强记忆。它也可以用排行榜或签到等方式提高人们的学习参与度。
目前它的订阅费用是8.80美元或每年52.80美元。已经拥有30万名用户,目前月环比增长50%。
Gizmo由剑桥大学校友Petros Christodoulou、Paul Evangelou (CPO) 和Robin Jack (CTO) 联合创立,他们在机器学习、营销、教学、教育科技等方面拥有丰富经验。
7.KudoAI获得由微软、OpenAI和GitHub投资的98000美元融资
官方网站:github.com/kudoai/
人工智能程序开发公司KudoAI获得98000美元的早期融资,金额不多,但投资者名单豪华,他们包括微软、OpenAI和GitHub。
尽管生成式AI降低了编程的门槛,但是基于AI的自由开发仍然无法做到,KudoAI致力于让更广泛的人群使用高级AI。它的旗舰产品chatgpt.js是一个广受好评的JavaScript库,该库使开发人员能够在从聊天机器人到创意内容生成的各种应用程序中利用AI的潜力。
它的另一个主流产品是BraveGPT,BraveGPT是基于GPT4.0构建的智能搜索AI。BraveGPT会在侧边栏中显示ChatGPT的答案以及Brave搜索结果,支持Chrome,Firefox,Edge,Opera,Brave,Vivaldi,LibreWolf和QQ。
KudoAI由Adam Lui在2023年2月创立,他是社交媒体technodon的创始人,在LLM模型与人工智能领域有丰富的开发经验。
8.人工智能法律初创公司Paxton AI获得600万美元种子轮投资
官方网站:www.paxton.ai
Paxton AI获得由25madison、Kyber Knight Capital和WVV Capital共同领投,R&R Ventures、Gaingels、AI Fund和Voyager Capital等投资机构参投的600万美元种子轮投资。
Paxton AI利用生成式AI的能力帮助企业解决法律的合规问题,它在工作过程中会不断扫描政府网站、官方公报和法律数据库等大量来源,以检测和识别任何新的监管变化或更新。
Paxton AI提供有关新法规如何影响特定部门或业务的具体见解,生成根据特定用户需求定制的报告。在用户向Paxton AI提出查询时,其响应是根据实际法律文本和既定判例法生成的,从而确保准确性和相关性。
Paxton AI成立于2023年,由Tanguy Chau(CEO)和Michael Ulin(CTO)联合创办。Tanguy Chau是MIT博士,目前在斯坦福大学SCPD攻读计算机科学,Tanguy Chau和Michael Ulin都是连续创业者,分别具有法律和AI方面的创业经历。
9.为品牌生成电商内容的Genus AI获得1100万美元种子扩展融资
官方网站:genus.ai
Genus AI近日获得600万美元的种子轮+融资,这使它的总融资额达到1100万美元。它的投资者包括社交媒体平台Aleph Group Inc.,企业天使投资人Kazuki Ohta,Magnus Lundin等。
Genus AI是一款为D2C和电商品牌设计的生成式AI平台。它能生成产品目录图像、种子受众、文案和视频,帮助品牌在Facebook、Instagram、TikTok、Pinterest等社交渠道上高效增长。全球领先品牌已经在使用该平台,仅在2023年它就生成了1000万个产品图像。
Genus AI由科技企业家Dr. Tadas Jucikas和Viktoras Jucikas创立,其使命是使各种规模的品牌都能轻松访问AI。
本文由阿尔法公社综合自多个信息源,并在ChatGPT的辅助下写作,封面图片由Hidream.ai的Pixeling(千象)生成。