随着虚拟人以直播等方式走进与人类交互的场景时,需求正在朝着虚拟人的个性化发展衍生,尤其是当AI大模型出现后,解决虚拟人情绪甚至情感的方案将成为一个独立的赛道。能通过声音、图像适配情绪的DreamTalk类AI…
AI大模型
巴比特资讯 2024-01-11
追踪社会热点,解读 AI 前沿,用开源的算法,促进 AI 知识渗透,以超算/高性能计算为原点,开启人工智能前沿应用视角。北京超级云计算中心联合OpenMMLab开源社区,共同策划直播栏目【AI 奇妙夜】,每月一期周四晚八点,陪大家一同打开 AI 领域的奇妙之门。本期精彩生成式人工智能 (AIGC)成为人工智能技术发展的新趋势,ChatGPT、Stable Diffusion、MidJourney 为代表的文字、图像应用成为技术圈甚至大众讨论的热门话题。AI 孙燕姿、音效生成、音乐生成也在 2023 年获得
斯坦福人工智能AIGCChatGPT
超级云讲堂 2024-01-11
推荐几个 ChatGPT 的开源项目,基于React、Vue、Php、Java等实现,完全开源,开箱即用。
ChatGPT
Java陈序员 2024-01-11
“我们反‘内卷’、反‘开源’,盲目开源会把AI领域弄得很乱,很容易让(AI)行业‘劣币驱逐良币’,这不是一个良性的业态。”过去的2023年,以ChatGPT为代表的AI大模型技术已成为科技界讨论最多的话题之一,数亿人直接与生成式AI工具进行交互。
AI大模型生成式AI
钛媒体APP 2024-01-11
一条神秘磁力链接引爆整个AI圈,现在,正式测评结果终于来了:首个开源MoE大模型Mixtral8x7B,已经达到甚至超越了LLaMA270B和GPT-3.5的水平。官方通告中并没有说支持中文,但我们实测(Hu…
OpenAI
GGV纪源资本 2024-01-11
引言 最近正在进行一项大工程:给Kimberly Akimbo这部音乐剧做全场字幕。由于精力有限,故研究了一下利用AI工具减少工作量的方法。于是找到了OpenAI(开发ChatGPT的那家公司)开源的语音识别模型whisper。该模型可以直接由音频文件识别生成包括srt字幕格式在内的多种文字稿。本教程主要提供基于官方的命令行工具的操作方法,如果嫌麻烦也可以用一些打包好的图形界面软件(B站有人投稿过相关的教程)。 下面是配置要求及步骤(项目仓库链接见文末): 运行环境 硬件 NVIDIA GeForce 3
WhisperChatGPTOpenAI
T_MA 2024-01-10
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/大模型动态荣耀发布魔法大模型荣耀发布全新平台级AI大模型——魔法大模型,首次应用于Magic6系列机型,并推出MagicOS8.0,实现了基于用户意图识别的GenAI平台级系统,包括"任意门"功能,打破应用壁垒,交互速度远超iOS17,与百度智能云合作生成专业内容。【AiBase提要:】 A
人工智能AI大模型数字人百度
今日AI大事件 2024-01-10
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的
WhisperOpenAI
刘悦的技术博客 2024-01-10
在英语任务上,Qwen-72B在MMLU基准测试取得开源模型最高分;中文任务上,Qwen-72B在C-Eval、CMMLU、GaokaoBench等基准得分超越GPT-4;数学推理方面,Qwen-72B在GS…
通义千问GPT-4
财经故事会 2024-01-10
ai绘画在商业领域的应用中,换脸一直都是个绕不开的话题。无论是给生成的模特换上有版权的脸,还是街头巷尾用ai摆摊帮人与明星合影,ai换脸的使用场景一直都很广泛。 之前如果想要实现ai换脸的话,一般都是用ps,即便ai时代之后,用sd操作起来也很麻烦。不过万能的开源社区总会带来惊喜,这款超简单的sd插件——roop,只需要把你想要的脸丢进去,然后点击生成,接下来生成的每个人都会是这样的脸。 安装与前置环境: 安装VS 2022 https://visualstudio.microsoft.com/zh-ha
AI绘画微软
AI炒饭 2024-01-10
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1