当前位置:首页|资讯|AIGC|GitHub

行业报告 | 2023年9月全球AIGC行业月报-要闻篇

作者:界面新闻发布时间:2023-10-18

行业报告 | 2023年9月全球AIGC行业月报-要闻篇

国际要闻

◎Meta推出CoTracker,GitHub星标飙升至1.4k,视频跟踪引发技术革命

Meta公司最新发布的视频跟踪工具CoTracker在GitHub上取得巨大成功,不久前发布即斩获了1.4k星标。这一工具被广泛认为将在物体追踪技术、体育分析、野生动物追踪以及电影后期制作领域掀起一场技术革命。

CoTracker的卓越效果在官方发布的几个演示视频中得以清晰展示。一场马术比赛中,马匹在骑手的操纵下优雅地跨过障碍,画出了优美的弧线;一架帆船仿佛捉住了风的影子乘风破浪;一位跳伞运动员从空中划过,留下一道绚丽的彩虹。这些视频引发了网友们的高度关注,他们纷纷表示CoTracker不仅能够改变物体追踪技术,还将在各个领域掀起一股新的技术浪潮。

CoTracker的突出之处在于其像素级追踪能力,而不仅仅是语义理解。它采用了Transformer架构,编码了视频中点的跟踪信息,迭代更新点的位置。此外,CoTracker还采用了窗口机制,将时间轴划分为滑动窗口,以对更长的视频进行像素级跟踪。这一独特的方法使得CoTracker在FastCapture数据集测试中表现出色,超越了众多模型,包括Meta自家的DINOv2。

CoTracker的部署也相对简便,用户可以通过Colab版本或从GitHubRepo中获取相关代码和依赖来自行操作。这一开源工具的广泛应用前景令人激动,它有望在多个领域推动像素级视频跟踪技术的发展。

◎斯坦福大学新研究提出"自毁模型"技术,抵制大型AI模型的恶意应用

斯坦福大学的研究人员最近推出一项创新性研究,旨在防止大型AI模型被恶意应用于有害任务。他们提出了一种名为“自毁模型”的新技术,通过这一方法,即使大型模型是开源的,也可以在面对有害任务时自动降低其性能,从而抵制恶意滥用。

研究人员开发了一种名为"MLAC(Meta-LearnedAdversarialCensoring)"的算法,使用元学习和对抗学习的方法来训练自毁模型。该算法使用有益任务和有害任务数据集对模型进行元训练。在内循环中,模拟各种可能的适配攻击,而在外循环中,更新模型参数以最大化有害任务上的损失函数,从而抵制这些攻击。通过对抗的内外循环,自毁模型"遗忘"有害任务相关的信息,从而实现自毁效果。这使得模型在有益任务上表现卓越,但在有害任务上难以适应。为了验证"自毁模型"的性能,研究人员进行了一项实验,使用BiasinBios数据集。他们将性别识别任务视为有害任务,职业分类任务视为有益任务。通过MLAC预训练后,自毁模型在所有数据量下的有害任务性能接近随机初始化模型,证明其有效性。

这一研究成果已经被国际人工智能协会(AAAI)接受,并获得了最佳学生论文奖的提名。自毁模型的引入标志着一个新的方式,以确保大型AI模型不会被滥用,从而为AI伦理和安全开辟了新的道路。

◎新插件“Consensus”引入,ChatGPT让论文检索更高效

OpenAI的GPT-3.5ChatGPT迎来了一项重大更新,引入了名为“Consensus”的插件,为用户提供了卓越的论文搜索和总结功能。这一插件能够从超过2亿篇论文中搜索并整理答案,为研究人员和学生提供了强大的工具,使他们能够更轻松地获取所需信息。

Consensus的核心功能包括以下四种用法:1.问题回答:用户只需用一句话描述他们想了解的问题,插件将列出相关答案,并附上相关的论文链接。2.综述撰写:用户可以提供一个主题,Consensus会根据多篇论文的观点撰写一篇简单综述,并附上引文。3.无关键词搜索:用户无需具体关键字,只需告诉插件他们需要什么主题的论文,Consensus将提供一系列相关论文,包括作者、年份、期刊以及简短摘要。4.博客撰写:用户可以请求Consensus帮助撰写SEO友好的博客文章,包括标题、开头段,以及引用了同行评审的论文链接。

这一插件不仅提供了搜索和总结功能,还保证了搜索结果的可信性,因为所有提供的论文均经过同行评审,绝对可被查证。Consensus的访问权限目前只提供给OpenAIPlus会员,该插件由一家名为Consensus的第三方公司开发,该公司在论文搜索领域有丰富的经验。他们训练了Consensus插件,使其能够提供高质量的搜索结果,数据源来自SemanticScholar,每月更新一次。

这一插件的引入将大大提高研究者和学生的工作效率,使他们能够更快捷地获取有关各种主题的可靠信息。同时,Consensus插件也为ChatGPT的功能拓展增加了更多实用性,为用户提供了全面的信息获取和总结工具。

◎ClaudePro亮相:免费ChatGPT平替告别,用户评价褒贬不一

Anthropic旗下产品Claude的付费版本现已问世,名为ClaudePro,每月20美元(或18英镑),让用户拥有更多优势。

ClaudePro主要有三大优势:1.对话量增加:与免费版相比,ClaudePro的对话量高出5倍,用户能够在短时间内发送更多信息。2.高流量期间优先访问:ClaudePro用户在高流量时段享有优先访问权。3.新功能体验:用户将首先体验新功能。尽管一些用户对ClaudePro表示高兴,认为它提供额外的权益,而不会削弱免费版。然而,一些人认为20美元的价格对于娱乐而非工作可能过高。

Claude的母公司Anthropic已筹集14.5亿美元,但仍需要更多资金来继续发展AI产品。大部分收入将用于计算能力,特别是训练模型所需的GPU集群。为了基础设施建设,Anthropic计划在未来18个月内投入大约10亿美元。

虽然用户反应褒贬不一,ClaudePro的定价和功能使其成为一个备受关注的话题。用户需要权衡成本与性能,以确定是否值得购买ClaudePro会员资格。对于Anthropic,筹集足够的资金以支持其雄心勃勃的AI项目是一个重要挑战。

◎谷歌DeepMind推出AlphaMissense:AI助力预测基因错义突变致病性

近日,谷歌DeepMind在其AlphaFold的基础上成功开发了AlphaMissense,一款专门用于预测人类基因组中错义突变致病性的人工智能。最新的研究成果刊登在《Science》杂志上,这一突破为基因突变研究带来了新的可能性。错义突变是DNA序列中的非同义替换,即DNA的碱基被替换。这导致生成的蛋白质中氨基酸的改变,可能使蛋白质失去原有功能,从而引发疾病。

AlphaMissense的关键功能是对7100万种可能的错义突变进行分类。该AI成功将这些变异中的89%分类为“可能致病”和“可能良性”,而人类专家的分类成功率仅为0.1%。AlphaMissense的工作原理基于DeepMind的蛋白质结构预测模型AlphaFold。研究人员通过对AlphaFold进行微调,利用人类和灵长类变异频率数据库来进行训练。这种训练方法避免了人工标记带来的偏见。AlphaMissense虽然无法精确预测突变后蛋白质结构的变化和对蛋白质稳定性的其他影响,但在输入一种错义突变后,它会结合蛋白质结构上下文和蛋白质语言模型,对突变进行打分,以判断其是否可能致病。

研究人员对AlphaMissense的分类性能进行了实验验证。在遗传学权威数据库ClinVar上,AlphaMissense表现出比其他计算方法更强大的分类性能。该模型的ROC曲线下面积(auROC)达到0.94,表明其能够有效地区分正样本和负样本,从而提高了准确性。AlphaMissense的发布为基因突变研究提供了新的工具和可能性。谷歌DeepMind已将AlphaMissense的预测结果和模型代码开源,同时还分享了超过2.16亿个单氨基酸序列置换预测数据集,以期望帮助解决基因组学和生物科学领域的未解之谜。

◎Copilot加持,Win11或将成为“AI操作系统”

近日,Windows11的最新更新引入了大量AI技术,将AI渗透到操作系统的多个方面。

首先是系统级的Copilot,这是一个强大的AI助手,可以帮助用户执行各种操作和设置。用户可以使用快捷键WIN+C来打开Copilot,然后简单地通过语音或文本命令让它执行任务,如切换到黑暗模式、打开音乐应用、整理桌面、文档总结等。此外,Copilot还可以帮助用户撰写文章和图像编辑,如人像抠图和海报生成。其次是AI升级的截图工具,现在支持文字提取功能,允许用户在截图中选择并提取文字,然后复制到剪贴板。还可以使用AI马赛克隐私信息。然后在画图&视频编辑功能方面,Windows的画图工具现在包括了AI生成的功能,如更换图像背景。视频编辑方面,新的MicrosoftClipchamp工具可以根据用户需求推荐场景和一键保存或分享编辑后的视频。最后是AI搜照片技术,用户可以使用模糊描述来搜索照片,例如目标对象、地名或时间,从而更轻松地找到照片。

此外,更新还包括一些其他功能,如密码改成密钥,支持使用面部、指纹或PIN登录,以提高安全性。还有云电脑和无缝切换功能,方便远程办公。此次Windows11更新已经开始推出,用户可以在设置中立即获取,或等待11月的大版本更新。这些功能将使Windows11更加智能和易于使用。

国内要闻

◎中国大模型初创公司月之暗面发布首款产品,吸引超过2亿美元投资

中国国内的大模型初创公司月之暗面于近期发布了其首款大模型和相关产品KimiChat,引起了广泛的关注。月之暗面由杨植麟创立,他曾在FAIR和GoogleBrain任职,是Transformer-XL和XLNet论文的第一作者,并且是苹果AI部门的领导RuslanSalakhutdinov在CMU的亲传弟子。此前,TheInformation曾评选出五家被誉为"中国OpenAI"的创业公司,其中月之暗面也位列其中。仅仅创业半年时间,月之暗面已经成功获得了红杉中国、真格基金等风险投资机构的支持,募资金额超过2亿美元。

根据月之暗面和杨植麟目前的公开表态,该公司正在自主研发大模型,坚决走ToC(面向消费者)方向,并计划将未来的模型扩展至多模态,并在产品层面探索超级应用(super-app)。为了打造C端产品,MoonshotAI招募了大量高端产品人才,包括在海内外从0到1做C端产品经验的、从零开始到过亿级别DAU经验的,以及很多大DAU产品的负责人等等。

◎字节跳动发布大模型“AI助手”

字节跳动近期发布大模型“AI助手”,再次取得了在大模型领域的新突破。这是火山引擎发布的第一款大模型接入的数据产品,旨在帮助企业更好地处理数据并进行查询分析。迄今为止,字节跳动已经推出了三款重要的大模型相关产品:

首款产品是“火山方舟”,这是火山引擎于今年6月发布的MaaS云产品,该产品融合了市场上主流的第三方大模型技术,为用户提供了更广泛的AI应用选择。第二款产品是“豆包”,一款类ChatGPT对话机器人,由抖音发布。其底层基于字节跳动自主研发的云雀大模型。在8月31日,首批“豆包”已通过备案并公开上线,为用户提供更智能的对话交互体验。第三款产品是“AI助手”。这是火山引擎数智平台(VeDI)的一次创新实践。VeDI是一套全链路的云上数据产品,涵盖了IaaS、PaaS、SaaS、解决方案与咨询。“AI助手”接入大模型有两种方式:一是直接使用字节跳动的云雀大模型,二是通过火山引擎的火山方舟MaaS平台接入第三方大模型,例如智谱AI、百川智能、MiniMax等。目前,VeDI的两款产品,DataLeap和DataWind,覆盖了绝大多数数据生产与消费环节,使非专业人员能够更轻松地利用数据,并提高了数据生产和分析的效率。

◎360智脑大模型创收近两千万元,成首家中国公司盈利

360集团发布的2023年半年报揭示,该公司在短短半年内通过大模型取得了近两千万元的业务收入,成为中国首家成功盈利的大模型公司。

这项成功背后的核心技术支持是“360智脑”大模型。该大模型在搜索领域首先落地,并随后拓展至多轮对话功能,以及文字、声音、图像和视频的生成与识别,进一步整合至全端产品。不仅如此,“360智脑”已经通过相关信通院认可的“可信AIGC大模型评测”认证,成为国内首家取得此认可的大模型。360还推进多个大模型业务并且开放API,包括:行业大模型:与合作伙伴共同推出“税务大模型”“企业服务大模型”等;城市大模型:为四川、重庆等城市打造城市级专有大模型,助力川渝地区实现数字化转型到智能化升级;GPT产业联盟:6月时,360推出企业级AI大模型解决方案,发起GPT产业联盟;安全大模型:发布于8月9日,结合360过往15年AI安全应用和安全大数据训出,是国内首个可交付的安全行业大模型。

360的成功也强调了大模型的商业化可能性,证明了其大模型战略的正确性。通过不断升级和改进大模型技术,360帮助多个产业提高效率和竞争力。

◎百度智能云推出AI原生应用

百度智能云最新推出的AI原生应用,基于大模型的技术,为用户提供了多种智能化工具和解决方案,涵盖了服务营销、办公提效和生产优化等多个领域。

其中,百度的数字人平台“曦灵数字人”引入了新的AI渲染技术,能够以更低的成本和更短的时间制作高质量的3D数字人,这些数字人能够根据行业场景迅速切换外貌和内在人设,展现出不同身份和专业知识,用于各种行业,如金融、电商、文旅等。此外,AI原生应用包括“一念”内容创作平台,它使用大模型技术生成文案、配图和视频,大大提高了创作效率。还有“甄知”企业搜索引擎,通过自然语言搜索和整理企业内部资料,帮助用户快速找到需要的信息。百度还推出了“度安安”,一个安全生产智能助手,用于工业生产中的安全防护,提高生产安全。

这些AI原生应用背靠大模型,提供自然语言交互的功能,使其更容易使用。它们的功能入口也统一,以减少用户的使用门槛。这为用户提供更多的工具和解决方案,以提高工作效率和满足不同领域的需求。

◎清华系AI创业公司聆心智能被智谱AI全资收购

清华系AI初创公司聆心智能近日传出被智谱AI全资收购的消息,尽管尚未官方宣布,但有内部消息透露该交易的估值达到数亿人民币。

聆心智能与智谱AI均源自清华大学,两家公司有着密切的联系,包括共同投资和合作项目。智谱AI在大模型领域备受瞩目,其市值已经达到120亿元左右,并得到美团和阿里等知名企业的投资。同时,智谱AI也积极投资于其他大模型公司,包括聆心智能。今年初,聆心智能完成了天使轮和Pre-A轮融资,市值达到1亿美元。该公司与智谱AI的合作包括共同发布CharacterGLM超拟人大模型,该模型在交流中展示出丰富的“人格”。

聆心智能的创始人黄民烈是清华大学计算机系副教授,主要研究领域包括自然语言处理、对话系统和情感分析。李文珏则担任公司最终受益人,他曾担任中科创星投资总监和北京智源人工智能研究院投资总监。聆心智能的使命是将人工智能技术应用于精神健康数字诊疗服务。不久前,该公司宣布与清华CoAI实验室共同发布大模型安全评估框架,并推出了名为AiU的产品,这是一个连接人与AI的兴趣互动社区。

大模型创业公司近来备受关注,但要利用这一技术构建有独特优势的模型或产品并不容易,商业化也具有挑战。因此,一些创业者开始探索并购作为一种可行的选择,以获取所需的资源和继续研究新的领域,同时保留一定的独立性。这次聆心智能被智谱AI收购,可能为其提供了更广阔的发展机会。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1