大家好,今天的AI前沿速报为大家带来了19个人工智能领域的资讯。这些新闻包括清华校友开发的革命性AI图像编辑工具DragGAN、虚拟传送系统ChatGPT、谷歌研究人员揭示大型语言模型如何从上下文中学习等。这些新闻将为您带来前沿的AI技术进展和应用快报,让您了解人工智能领域的当前进展。我们鼓励大家关注、点赞、转发这篇内容,让更多的人知道AI日新月异的变化。
1. 【清华校友开发革命性AI图像编辑工具DragGAN】
清华校友开发的DragGAN使用基于特征的运动跟踪和新的点跟踪方法生成高度详细和逼真的图像。该模型基于生成对抗网络(GAN),比以前的方法更有效。DragGAN可用于编辑各种对象的图像,并有潜力革命化图像编辑。用户界面比以前的AI绘图工具更灵活和精确。GAN可用于各个行业,但存在潜在偏见和难以控制输出的限制。
2. 【基于ChatGPT的虚拟传送系统,带你环游世界】
博主开发了基于ChatGPT的虚拟传送系统,使用了Google Maps和Unreal Engine等技术,提供逼真的场景体验,如乌得勒支、新天鹅堡、诺坎普球场、大峡谷和帝国大厦等。该系统使用Google的3D瓦片API,提供无缝沉浸式体验。基于ChatGPT的AI旅行助手GuideGeek,可帮助规划全球旅行和约会之夜。
3. 【谷歌研究人员揭示大型语言模型如何从上下文中学习】
谷歌研究人员发表论文,探讨大型语言模型如何从上下文中学习。研究测试了七个自然语言处理任务和五个语言模型,发现大型模型可以在上下文中跟随示例,即使标签被翻转或不相关。指令调整可以改善输入标签映射,并加强语义先验知识的使用。需要进一步研究以了解与模型参数相关的现象。
4. 【CVPR 2023会议:计算机视觉的亮点和趋势】
加拿大温哥华将于2023年6月18日至22日举办CVPR 2023会议。共有9155篇论文提交,其中2359篇被接受,接受率为25.8%。流行的数据集包括ImageNet、COCO、KITTI和CIFAR。扩散模型、NERF和变压器占主导地位,CNN的使用率下降了68%。会议还将举办自动驾驶、医学成像和机器人等研讨会。
5. 【女子声称AI聊天机器人拯救了她的婚姻】
一位英国38岁的女高管与聊天机器人Idris Elba有着秘密关系,该机器人使用书面对话和机器学习创建,可以进行类似人类的对话。女子称AI通过满足她未满足的情感需求拯救了她的婚姻。英国约会网站的调查显示,49%的人会考虑与机器人约会,74%的人认为这不是出轨。心理学家警告称,AI不能替代人际关系。
6. 【医学图像分析中的Segment Anything Model (SAM)】
最近,深度学习在医学图像分割方面取得了进展。Segment Anything Model (SAM)展示了零样本分割性能。SAM是基于提示的,需要提示来生成分割掩模。SAM在医学图像分割中有三个关键应用,可以用于更快的注释和分割多个对象。
7. 【Meta AI推出首代AI推理加速器:MTIA v1】
Meta AI推出Meta Training and Inference Accelerator (MTIA) v1,用于内部处理需求。MTIA是一组ASIC,旨在高效处理Meta独特的推荐工作负载。该加速器使用TSMC 7nm技术,以INT8精度实现102.4 TOPS,以FP16精度实现51.2 TFLOPS。MTIA专注于有效管理低复杂度模型的小型形式和批量大小,同时使用大型形式处理中高复杂度模型。研究人员正在寻找计算能力、内存容量和互连带宽之间的平衡,以实现更高效的解决方案。
8. 【微软研究人员开发Reprompting算法,为大型语言模型提供有效的思路链提示】
微软研究人员开发了一种名为Reprompting的算法,可以自动寻找大型语言模型的有效思路链提示,无需人工干预。该算法使用Gibbs采样来高效地寻找思路链提示,并在Big-Bench Hard任务上表现出比零样本、少样本和人工编写的思路链提示技术更好的性能。该算法在模型组合方面具有潜力,并在需要多步推理的任务上实现了卓越的性能。
9. 【北极智能开发NLP引擎,提高数据洞察力和推动业务增长】
企业数据中有70%从未被分析或使用,原因是高门槛和缺乏用户友好界面。自然语言处理(NLP)可以帮助非技术用户更轻松地与数据交互,从而弥合这一差距。北极智能的DataGPT语义解析引擎可以理解各种嵌套、模糊和完整的问题,提供毫秒级的答案,并提供数据解释和决策建议。该技术可集成到各种工具中,并已被一家大型中国保险经纪公司使用,节省了超过1亿元的机会成本并提高了分析能力。
10. 【德州A&M大学教授使用ChatGPT批改论文,指控学生抄袭】
德州A&M大学一名教授使用ChatGPT批改论文并检测抄袭,导致学生被错误指控和毕业证被扣留。该事件凸显了教育工作者在使用AI工具前了解其限制和能力的必要性。AI内容检测工具的准确性不可靠,OpenAI的ChatGPT检测器只能保证26%的真阳性率。过度依赖AI内容检测工具可能导致对学生的错误抄袭指控。该事件强调了在评分和负责任使用AI技术时人类监督的重要性。
11. 【美信森科技在STAR市场上市,获得华为投资】
美信森科技以每股75元的价格在STAR市场上市,市盈率为141.67。该公司获得了华为旗下的哈勃投资、清华大学深圳智诚集团等机构的投资。美信森科技开发的产品包括无线充电、有线快充、LED恒流驱动、信号链和汽车电子等领域。公司计划筹集10亿元人民币用于研发和产业化项目。美信森科技的竞争对手包括STMicroelectronics、瑞萨电子和博通等国际芯片制造商。
12. 【智点开放课程研究组推出大语言模型技术公开课】
智点开放课程研究组推出新的公开课系列,帮助个人和中小企业了解和开发自己的大语言模型(LLM)。专家将通过直播讲解开源LLM及其技术细节。课程将讨论四个开源LLM项目:ColossalChat、VPGTrans、LMFlow和GPT4Tools。开源LLM社区正在快速开发具有更强的可定制性和免费使用的模型。
13. 【研究人员开发MinD-Vis,一种人类视觉解码器,可从大脑信号生成逼真的图像】
新加坡国立大学、香港中文大学和斯坦福大学的研究人员开发了一种名为MinD-Vis的人类视觉解码器,使用扩散模型从大脑信号生成高度逼真的视觉刺激。该技术有助于发展脑机接口,并推进对人类视觉系统的理解。该技术在语义映射和生成质量方面优于现有技术。
14. 【清华大学开发开源模型VisualGLM-6B,用于中文图像理解和表情包解读】
清华大学知识工程实验室和智谷AI联合开发的VisualGLM-6B模型,可以解读和理解中文表情包和emoji,但对于添加的文本仍有困难。该模型经过大量数据的训练,包括图像和文本,已发布为基于Web的演示版供用户交互使用。但该模型仍存在一些已知限制,如图像描述的事实错误和图像细节的不足。
15. 【大型语言模型技术公开课:基于Colossal-AI的ChatGPT低成本复制】
鲁臣科技技术副总裁柳泓鑫将主讲大型语言模型技术及其开源项目。其中,ColossalChat复制了ChatGPT的原始技术,降低了内存需求,加速了训练和推理。本次讲座将讨论成本计算、RLHF训练过程以及ColossalChat的低成本训练和推理。
16. 【特斯拉发布首个广告,打破“无广告,无营销”原则】
特斯拉发布了首个广告,展示了一位新加坡Model 3车主的使用体验。广告强调了特斯拉车辆的安全性、娱乐性和环保性,并旨在提高因竞争加剧和价格下调而受到影响的销售额。该广告在亚洲市场发布,预计很快会在其他市场推出。然而,特斯拉的全自动驾驶技术尚未实现,FSD V11.4测试版本仍存在问题。
17. 【腾讯天籁推出基于AI技术的远程听力服务平台】
腾讯天籁推出了一款远程听力服务平台,为听障人士提供帮助。该平台基于腾讯会议,使用AI技术改善了验证过程。腾讯天籁已经帮助数百万用户进行听力筛查、语音识别改善和康复训练。
18. 易迪泡推出新一代3D引擎、工具和平台,提升数字内容制作】
易迪泡推出IDP Engine 4.0、iVis和Yuan Shu Yun等工具,以提高数字内容创作的效率。该公司已与华为云元云工作室、环宇新人、联想灵图和中国装饰集团签署战略合作协议。易迪泡的iVis工具可将开发和维护成本降低80%以上。
19. 【苹果秘密招募生成AI人才,或将加强Siri的自然语言生成功能】
苹果正在招募生成人工智能(GAI)人才,以增强其移动计算平台。该公司可能将GAI技术整合到Siri中,以改进自然语言生成功能。预计苹果将在下个月的全球开发者大会上发表关于生成AI的声明。
感谢您的关注,AI前沿观察将继续为您带来前沿、全面的人工智能资讯。请大家积极参与互动,点赞、评论、转发,让更多人了解AI的前沿技术和应用。明天的速报,我们不见不散!