图片来源@视觉中国
文 | 太平洋科技
2023年,可以称为AI元年,在这一年,关键技术的突破,如前沿算法的优化、学习效率的提升以及大语言模型(LLM)的创新,共同推动了AI的能力跃升至新的高度。AI的应用也实现了跨行业的渗透与扩散,尤其是在健康医疗、教育、自动驾驶以及供应链管理等关键领域,AI技术不仅提升了效率,也催生了新的商业模式。面对AI技术的快速发展,全球范围内的政府和监管机构开始制定更为全面和成熟的法律与规范,以确保技术的合理使用和风险控制。
AI如果是下一个诺亚方舟丨Midjourney V6
资本市场对AI的投资达到了前所未有的热度,从而加速了AI研发的步伐并扩大了其市场影响力。AI技术日益普及的同时,社会对它的认知也日渐深入,公众对于AI带来的生活改变和潜在问题有了更加复杂和成熟的理解。这些因素综合之下,2023年成为AI历史上的一个里程碑,也是AI开始“统治这颗星球”的第一年。
2023·Q1丨Midjourney V6
1月
1月15日:ChatGPT迅速崛起,成为历史上用户增长最快的消费者应用程序。
在2022年11月30日,OpenAI推出了一款创新的AI互动式问答平台ChatGPT,这个平台允许用户提出问题并即时获得反馈,仿佛与另一个人进行对话。它迅速引起了公众的广泛关注,在发布后的五天内就吸引了超过一百万用户。根据瑞银集团于2023年1月发布的报告,短短两个月内,该平台的月活跃用户数已经超过了一亿,创纪录速度超越TikTok、Instagram。
1月27日:微软对OpenAI进行了重大投资,金额高达100亿美元。
“The tech giant aims to remain at the forefront of generative artificial intelligence with its partnership with OpenAI.”(这家科技巨头希望通过与 OpenAI 的合作,保持在生成AI领域的领先地位。)——《纽约时报》
2月
2月10日:微软发布了集成AI的Bing搜索引擎升级版——“New Bing”。
2月17日:乐队Linkin Park突破性地推出了首个由AI制作的音乐视频,预示着动画AI视频进入大众视野。
这段视频采用了无限缩放技术,并与动漫风格图形无缝结合。AI对歌曲主题的解读在一个动态演变的景观中不断展开,连续不断地旅行,反映了歌词中传达的内心斗争。依靠Kaiber AI神经网络实现。
2月22日:Spotify引入了名为“DJ”的AI功能,旨在改善用户体验。
2月24日:亚马逊云计算服务AWS与AI研究公司Hugging Face宣布合作。
2月28日:Snapchat加入AI聊天机器人行列,推出名为“My AI”的新功能。
3月
3月1日:OpenAI推出ChatGPT和Whisper的API服务。
3月17日:OpenAI发布了更先进的语言模型GPT-4。
Ai时刻 Vol.1:理解图片!告别译制文!GPT-4发布
总结一下,升级的 GPT-4 是 GPT-3系列的进化版,拥有更多的参数和更强大的学习能力,使其在理解和生成语言方面有了更显著的提升。GPT-4 可以处理文本输入,还可以处理图像输入,进而输出相关文本。在诸多专业领域和学术基准测试中,GPT-4 展现出了与专家相媲美的表现,如律师资格考试和提供医学建议。这意味着 GPT-4 已经在一定程度上跨越了AI与人类专业水平的鸿沟。
3月21日:AI在短短30天内提出了新的癌症治疗方法,展现了AI在医疗领域的巨大潜力。
3月22日:Google发布了ChatGPT的竞争对手Bard,但其股价随后出现下跌。
【Ai时刻】Google Ai对话Bard开放!异军突起还是风大雨小?
与百度的“文言一心”一样,尽管谷歌推出的Bard存在一定的进步空间,我们仍然希望AI市场能够吸引更多的参与者,实现日益繁荣的发展。一个充满活力和竞争的AI市场将有助于推动多元化的竞争,将激发各个参与者不断完善和优化他们的技术,从而为用户带来更加智能、高效和便捷的Ai工具。
3月22日:Adobe进军AI图像领域,发布了名为Adobe Firefly的AI图像生成器。
【Ai时刻】上手Adobe firefly,平面设计师的最大对手出现了吗?
创意字的生成是令我感到最惊喜的,这也是其他家Ai绘画程序暂时还未达到的高度,不仅能够很好地将所需要的Prompt元素很好地与文本相结合,同时也能达到合理的建设效果,增添创意字的设计感。
3月24日:OpenAI发布了ChatGPT插件平台,被广泛认为是“AI的应用商店”。
3月24日:设计软件公司Canva在其Canva Create活动中推出了新的AI工具。
3月28日:Zoom推出了AI助手Zoom IQ,进一步提升在线会议体验。
3月30日:埃隆·马斯克与AI专家联合呼吁,暂停开发超越GPT-4的更强大AI系统6个月,以评估社会影响和风险。
【Ai时刻】真害怕还是拖时间?众多大佬联名呼吁Ai发展“减速”!
不论该联名信是否真实,都足以给我们当前处于“Ai狂欢”中敲响一记警钟,过度依赖Ai无疑是将人类的命运悬挂在达摩克利斯之剑下,将我们的文明与历史全权地向Ai脱出,让其成为我们唯一的科技领袖,是否真的安全与理性?这个问题还有待我们去思考。
2023·Q2丨Midjourney V6
4月
4月3日:意大利宣布禁止ChatGPT,引发全球对AI监管的关注。
4月6日:Meta发布了“Segment Anything Model”,这是一项AI技术,能够从图像或视频中提取任何对象。
4月11日:阿里巴巴宣布推出了ChatGPT的竞争产品“通义千问”。
4月14日:亚马逊及其云服务部门AWS发布了基础设施服务Bedrock和AI编程助手CodeWhisperer。
4月17日:埃隆·马斯克启动了xAI项目,尽管细节仍不明朗。
4月21日:Google旗下的两大AI研究团队Google Brain和Google DeepMind宣布合作。
一路走来,我们很幸运地拥有两个世界一流的研究团队,通过基础性突破引领整个行业向前发展,开创了AI的新时代。现在的进步速度比以往任何时候都快。为了确保通用AI的大胆和负责任地发展,我们正在创建一个部门,帮助我们更安全、更负责任地构建更强大的系统。
4月25日:艺术家Grimes同意使用她的声音制作AI生成的音乐。
4月25日:AI发现了一颗全新的行星。
5月
5月2日:AI先驱杰弗里·辛顿从谷歌退休,并对AI的潜在危险发出警告。
辛顿强调,随着AI生成的假照片、视频和文本在网上日益泛滥,人们正在变得更难以分辨虚假信息。他还提到,聊天机器人的智能程度可能会超过人类,并可能被心怀不轨的人利用,例如,它们可以自动大批量生成文本,从而制造出极为有效的垃圾信息机器人。他还担心AI可能会取代律师助理、个人助理及其他重复性工作,并认为未来可能会取代更多工作。
5月3日:Inflection AI发布了新的AI工具Pi。
5月10日:Meta推出了一种新的AI研究模型ImageBing。
5月11日:谷歌在其年度I/O大会上宣布了一系列AI的重大进展。
5月12日:Anthropic扩大了其AI模型Claude的窗口至100,000用户。
5月19日:OpenAI发布了免费的ChatGPT iOS应用程序。
【Ai时刻】终于等到!OpenAI发布ChatGPT移动端应用
与它的桌面版本类似,ChatGPT应用为用户提供了与AI聊天bot互动的机会,无需经过传统的网络搜索即可提出问题,获取建议,寻找灵感,或用于学习和研究。
5月19日:苹果公司禁止其员工使用ChatGPT。
【Ai时刻】睿智冷静的Old Money!为什么苹果很少提及“Ai”
也许有一天,当Ai炒作热潮消退时,苹果会重新设计Siri,让她的外观和声音更像是ChatGPT。届时,所有苹果的机器学习和神经网络技术都会汇聚成一个引人注目的“one more thing”,苹果也会以尽可能避免强调Ai的语调来宣传。然而,对于现阶段的苹果公司来说,保持低调、关注用户隐私和安全仍是其核心竞争力所在。
5月24日:微软推出了集成AI的Windows 11 AI Copilot、Bing插件、Bing浏览器。
6月
6月2日:NVIDIA Research开发出Neuralangelo,该工具能够从2D视频剪辑进行3D重建。
6月13日:德国一座教堂举行了300多人参与的AI宗教服务。
6月19日:Meta发布了Audiobox,这是一款新的文本转语音AI技术。
6月22日:超过100,000个ChatGPT账户信息遭到泄露,引起了安全和隐私的担忧。
6月27日:开创性的AI研究项目宣布,它们已能理解和解码鲸鱼之间的交流。
6月28日:百度推出了其AI模型ERNIE 3.5。
6月29日:ChatGPT通过微软的Bing搜索引擎推出了移动搜索服务。
2023年第二季度,AI技术在监管、研发创新、产品发布和应用等多个领域取得了快速发展,同时也引发了社会各界对其在安全性、伦理性等方面的广泛讨论。这一时期取得的进展表明,AI技术正在渗透到人类生活的各个层面,它将在人们的日常工作和生活中扮演越来越重要的角色。
2023·Q3丨Midjourney V6
7月
7月3日:Humane推出“AI Pin”,这是一种旨在取代智能手机的便携式设备。
AI Pin是一款可穿戴设备,通过语音、手势和内置投影仪进行交互,连接到AI模型(如GPT-4)提供通信、信息查询和翻译等功能,通过Cosmos操作系统自动处理用户请求,无需传统应用管理。
7月4日:Midjourney推出新的“Panning”功能,改进了其旅游和探险类AI服务。
7月6日:OpenAI引入超级对齐概念来解决超级智能对齐问题。
7月10日:研究显示AI在治疗脑癌方面显示出潜力。
7月12日:Anthropic推出其AI模型Claude的升级版Claude 2。
GPT-4支持更多语言,适合全球化应用;Claude 2生成文本更自然。GPT-4代码生成能力强;Claude 2擅长代码优化。GPT-4任务范围广,集成搜索;Claude 2适合深度文档分析。GPT-4理解和推理能力较强;Claude 2写作、数学和编码表现较好。
7月17日:好莱坞因AI在影视制作中的应用而发起罢工。
7月19日:Meta和Microsoft联合发布Llama 2,这是一款新的AI模型。
【Ai时刻】先圈地再盖城!高通&Meta就移动端LLM展开合作
7月26日:日本经济产业省宣布计划开发AI超级计算机。
8月
8月7日:苹果CEO蒂姆·库克表示,公司正在将AI技术融入所有产品中。
苹果CEO蒂姆·库克表示,AI和机器学习技术已经深深融入苹果几乎所有产品,是其成功的关键所在。尽管最近的开发者大会没有提及AI,但库克证实,苹果多年来一直在持续研发这些前沿技术,并持续增加在该领域的投入。这表明苹果并未落后竞争对手,AI仍是其产品设计的核心。库克强调,苹果长期以来一直将AI和机器学习作为战略核心,并将继续加大研发投入,以进一步提升产品和服务的AI能力。
8月11日:HeyGen宣布推出AI生成的虚拟形象克隆技术2.0版。
8月23日:Meta开源了名为SeamlessM4T的AI模型。
8月24日:研究者利用大脑植入物和AI使瘫痪患者得以沟通。
8月30日:特斯拉推出了价值3亿美元的新型AI超级计算机。
特斯拉计划部署配备1万块Nvidia H100 GPU的强大超级计算集群,其运算能力可达340 FP64 PFLOPS,是全球最强之一。该集群将大幅提升特斯拉的AI训练能力,加速其全自动驾驶技术开发。同时,特斯拉还在自主研发代号Dojo的定制化超级计算机,预计投资超过10亿美元。Dojo采用专门优化的芯片,性能更强,将与Nvidia集群形成协同,使特斯拉拥有汽车行业前所未有的计算实力
9月
9月4日:研究人员创建了一种AI模型,能够预测化学品的气味。
9月8日:微软与Paige合作开发了一种新的癌症检测AI。
Paige利用了其庞大的数字病理学数据库,这个数据库包含了超过50万张切片样本,总计约10亿张图像。这些图像覆盖了多种类型的癌症,为深度学习模型提供了丰富的训练数据。大数据集能够让AI模型学习到更多关于癌症的特征,提高诊断的准确性和泛化能力。Paige团队拥有丰富的数字病理学专业知识,能够确保AI模型不仅仅关注图像的通用特征,还能够识别和解释对于癌症诊断和治疗至关重要的细微差异。
9月13日:可口可乐使用AI创造了一个全新的神秘口味。
9月20日:Google推出了Bard Workspace扩展,旨在提高工作效率。
9月21日:OpenAI发布了DALL-E 3,进一步提升了图像生成技术。
9月22日:微软推出了名为Copilot的“您的日常AI伴侣”。
9月26日:ChatGPT实现了对语音和图像的多模式识别。
【AI时刻】GPT长眼睛了!史诗级功能悄咪咪发布!— OpenAI发布GPT-4V多模态模型
在经历法规限制、算力紧张、AI伦理大讨论以及各新进竞争者围追堵截后,北京时间9月26日凌晨,OpenAI悄咪咪发布了其GPT-4V模型,即多模态模型,其中最引人注目的还是视频识别功能
9月27日:CIA为英特尔构建了一个专有的AI系统。
9月28日:OpenAI宣布ChatGPT的浏览功能回归。
9月29日:Mistral AI推出了一款开源的7B级别的语言模型。
2023年第三季度,AI技术继续在多个领域获得广泛应用,在业务增长、医疗保健、娱乐产业、企业服务等领域实现重大突破。在企业界的竞争与合作推动下,AI技术获得较快发展,同时也引发社会各界对其影响的关注,如好莱坞对新技术的抵制。随着AI进一步融入各行各业,其在伦理、就业和法律等方面的影响将受到更广泛的讨论。
2023·Q4丨Midjourney V6
10月
10月3日:Rewind推出Rewind Pendant,这是一款可捕捉现实世界对话的可穿戴设备。
10月4日:LinkedIn展示了其跨产品的新AI工具。
10月13日:Meta的AI角色聊天机器人上线,但遭到强烈反对。
10月16日:AI破译了被烧毁的赫库兰尼姆古卷中的第一个文字。
11月
11月6日:Elon Musk的xAI推出Grok,一款基于X上的AI聊天Bot。
11月7日:OpenAI在DevDay上展示了GPT Builder、GPT-4 Turbo、Assistants API等。
【AI时刻】首届AI春晚!OpenAI野心也太大了吧!
GPTs允许任何人都可以基于ChatGPT创建定制版本,应用于日常生活、专业工作等不同场景,无需编程就可以构建属于自己的AI助手。用户可以给GPTs输入特定知识,设置使用范围,然后分享给他人使用。
11月9日:亚马逊投资训练一个代号为“Olympus”的大型语言模型。
11月14日:OpenAI确认正在开发GPT-5和高级AI代理。
11月16日:Forward Health推出AI医疗舱。
11月17日:YouTube和Google DeepMind展示了一种名为“Lyria”的新AI模型。
11月17日:Sam Altman被解雇OpenAI首席执行官一职。
11月22日:Sam Altman重新受聘为OpenAI首席执行官。
11月29日:Pika推出Pike 1.0,一款文本转视频生成器。
11月30日:Google DeepMind的“GNoME”生成新无机化合物的配方。
12月
12月1日:微软向英国AI基础设施投资3.2B美元。
12月6日:Google DeepMind发布Gemini。
Gemini系列包括轻量级的Gemini Nano、强大的Gemini Pro和高端的Gemini Ultra三个模型。Gemini Nano用于在Android设备上本地离线运行;Gemini Pro将赋能许多谷歌AI服务,也是新产品Bard的底层模型;Gemini Ultra是谷歌迄今创建的最强大语言模型,面向数据中心和企业应用。
在与OpenAI的GPT-4进行的32项基准测试中,Gemini在30项上占优,特别是在处理视频、音频和多模态数据方面。Gemini也比谷歌早期模型的运算效率更高,基于自主研发的TPU v5p芯片。谷歌计划将Gemini应用到搜索、广告、Chrome浏览器等旗下各大产品,它被视为谷歌AI未来发展的关键。
12月12日:法国初创公司Mistral AI发布Mixtral。
12月13日:微软研究院发布Phi-2。
12月20日:微软与Suno AI合作进行AI歌曲生成。
12月22日:Apple研究展示了适用于iPhone的AI技术。
12月24日:Midjourney V6测试版更新
【AI时刻】这次太真了,真的有点侵权了!—Midjourney V6更新体验
V6版将数据源和算法进行了显著改进,能够生成更为逼真、精细且细节丰富的图像。它在材质、人物肖像以及光影效果的刻画上实现了深度的优化,提升了图像的整体质感和真实度。
但,越来越多的人发现,Midjourney V6之所以能够拿出极其逼真的图画,可能是因为它的训练来源已经深入到了影视作品的每一帧画面上,而且并不掩饰生图时的一致性。Midjourney V6所创造的动画和漫画风格图像,在细节上与原始作品极为吻合,这暴露了当前AI绘画技术在版权合规方面的模糊边界。目前尚无专门机构负责审核AI训练用数据集的版权合法性,这为企业在版权法的监管空白区域中提供了操作的余地。
12月27日:OpenAI正在洽谈以100B+估值筹集额外资金。
12月28日:《纽约时报》起诉微软和OpenAI侵犯版权。
2023年尾,AI技术正在多方面蓬勃发展,其影响力正在渗透到社交媒体、军事、医疗保健、内容创作等领域。与此同时,围绕AI伦理、安全性和知识产权的讨论也日益激烈。各大公司和研究机构在这一领域不断增长的投资和研发活动,彰显了人们对AI技术未来发展的积极期待,以及它对全球经济的潜在重大影响。