如何在 Unity 游戏中集成 AI 语音识别？

作者：HuggingFace发布时间：2023-06-16

语音识别是一项将语音转换为文本的技术，想象一下它如何在游戏中发挥作用？发出命令操纵控制面板或者游戏角色、直接与 NPC 对话、提升交互性等等，都有可能。本文将介绍如何使用 Hugging Face Unity API 在 Unity 游戏中集成 SOTA 语音识别功能。

您可以访问 itch.io 网站下载 Unity 游戏样例，亲自尝试一下语音识别功能。

先决条件

阅读文本可能需要了解一些 Unity 的基本概念。除此之外，您还需安装 Hugging Face Unity API，可以点击之前的博文阅读 API 安装说明。

步骤

1. 设置场景

在本教程中，我们将设置一个非常简单的场景。玩家可以点击按钮来开始或停止录制语音，识别音频并转换为文本。

首先我们新建一个 Unity 项目，然后创建一个包含三个 UI 组件的画布 (Canvas):

开始按钮: 按下以开始录制语音。
停止按钮: 按下以停止录制语音。
文本组件 (TextMeshPro): 显示语音识别结果文本的地方。

2. 创建脚本

创建一个名为 SpeechRecognitionTest 的脚本，并将其附加到一个空的游戏对象 (GameObject) 上。

在脚本中，首先定义对 UI 组件的引用:

在 inspector 窗口中分配对应组件。

然后，使用 Start() 方法为开始和停止按钮设置监听器:

此时，脚本中的代码应该如下所示:

3. 录制麦克风语音输入

现在，我们来录制麦克风语音输入，并将其编码为 WAV 格式。这里需要先定义成员变量:

然后，在 StartRecording() 中，使用 Microphone.Start() 方法实现开始录制语音的功能:

上面代码实现以 44100 Hz 录制最长为 10 秒的音频。

当录音时长达到 10 秒的最大限制，我们希望录音行为自动停止。为此，需要在 Update() 方法中写上以下内容:

接着，在 StopRecording() 中，截取录音片段并将其编码为 WAV 格式:

最后，我们需要实现音频编码的 EncodeAsWAV() 方法，这里直接使用 Hugging Face API，只需要将音频数据准备好即可:

完整的脚本如下所示:

如要测试该脚本代码是否正常运行，您可以在 StopRecording() 方法末尾添加以下代码:

好了，现在您点击 Start 按钮，然后对着麦克风说话，接着点击 Stop 按钮，您录制的音频将会保存为 test.wav 文件，位于工程目录的 Unity 资产文件夹中。

4. 语音识别

接下来，我们将使用 Hugging Face Unity API 对编码音频实现语音识别。为此，我们创建一个 SendRecording() 方法:

该方法实现将编码音频发送到语音识别 API，如果发送成功则以白色显示响应，否则以红色显示错误消息。

别忘了在 StopRecording() 方法的末尾调用 SendRecording():

5. 最后润色

最后来提升一下用户体验，这里我们使用交互性按钮和状态消息。

开始和停止按钮应该仅在适当的时候才产生交互效果，比如: 准备录制、正在录制、停止录制。

在录制语音或等待 API 返回识别结果时，我们可以设置一个简单的响应文本来显示对应的状态信息。

完整的脚本如下所示:

祝贺！现在您可以在 Unity 游戏中集成 SOTA 语音识别功能了！

如果您有任何疑问，或想更多地参与 Hugging Face for Games 系列，可以加入 Hugging Face Discord 频道！

英文原文: https://hf.co/blog/unity-asr
作者: Dylan Ebert
译者: SuSung-boy
审校/排版: zhongdongy (阿东)

相关资讯

如何在 Space 上托管 Unity 游戏

你知道吗？Hugging Face Space 可以托管自己开发的 Unity 游戏！惊不惊喜，意不意外？来了解一下吧！Hugging Face Space 是一个能够以简单的方式来构建、托管和分享项目或应用样例的平台。虽然通常更多地是应用在机器学习样例中，不过实际上 Space 还可以用来托管 Unity 游戏，并且支持点击即玩。这里有一些游戏的 Space 示例:Huggy。Huggy 是一个基于强化学习构建的简易游戏，玩家可以点击鼠标扔出小木棍，来教宠物狗把木棍捡回来农场游戏。农场游戏是我们在

Hugging Face 机器学习

HuggingFace 2023-05-09

站长之家 2023-05-03

游戏中的生成式 AI 革命

【编者按：伴随着大量生成式AI应用的落地，AI生成的图片、文字、音频等创造性内容的应用开始逐渐走入我们的日常。硅谷知名风投机构Andreessen Horowitz （a16z）的合伙人James Gwertzman 等人则针对生成式AI在游戏行业的影响发表了：“The Generative AI Revolution in Games” （游戏中的生成式AI革命）研究报告。我们特编...

生成式AI

MoPaas魔泊云官方账号 2023-02-22

近期资讯

1499元！华为FreeBuds Pro 4蛇年典藏版预售：金蛇绕币设计

快科技12月30日消息，华为官方今天官宣FreeBuds Pro 4蛇年典藏版，10:08正式开启预售，将于1月1日10:08正式开售，定价1499元。从商城页面得知，这次的FreeBuds Pro 4蛇年典藏版有两种配色，分

建嘉 2024-12-30

德国病假侦探生意兴隆：病假持续增加老板被迫请病假侦探

快科技12月30日消息，据报道，持续上升的病假率让越来越多德国企业开始雇用私家侦探，以查清请病假的员工是不是真的病了。私家侦探马库斯向媒体透露，“若一个人一年请了30天、40天，甚至

若风 2024-12-30

韩国空难举世皆惊：近6年波音飞机事故已造成525人死亡

快科技12月30日消息，当地时间12月29日9时7分左右，一架正在着陆的飞机在韩国全罗南道的务安国际机场偏离跑道，撞上了围栏外墙，随后客机起火，机上181人中，仅2人获救。这场突如其来的空难事

落木 2024-12-30

王腾称REDMI Turbo 4全面升级：无一短板直追旗舰

快科技12月30日消息，REDMI Turbo 4今天已经正式官宣，将于1月2日发布。王腾发文表示，Turbo 4是REDMI新一年继续高歌猛进的第一款作品，定位潮流性能小旗舰，颜值高、性能强。他透露了新机的

建嘉 2024-12-30

曝小米SU7单周新增锁单破万辆：坠坡事件推动作用明显

快科技12月30日消息，汽车博主“孙少军”透露，上周小米新增锁单破万辆，订单量持续大增，与小米SU7坠山事件推动作用有关。据悉，12月中旬时，一辆小米SU7载着一家三口外出时，不

若风 2024-12-30

官方放话：公务用车原则上100%采购新能源汽车！

12月30日消息，据国内媒体报道称，财政部给出的最新要求显示，严格实行公务用车编制管理，按规逐步扩大新能源汽车配比。财政部办公厅关于进一步明确新能源汽车政府采购比例要求的通知。主管预

雪花 2024-12-30

官方电脑禁用Intel、AMD！加速国产CPU替代

快科技12月30日消息，据国内媒体报道，从中国电子信息产业集团有限公司获悉，中国电子飞腾系列国产CPU总销量近日突破1000万片。据悉，这些芯片广泛应用于国家重点工程和关键行业，为从端到云的

朝晖 2024-12-30

Intel入门级CPU酷睿Ultra 3 205现身：仅一个型号

快科技12月30日消息，英特尔的入门级桌面处理器即将迎来新成员，酷睿Ultra 3 205近日在泄露的“Arrow Lake-S”规格表中被发现，确认了这款CPU的存在，并将取代“酷睿i3”系

黑白 2024-12-30

济州航空股价重挫16% 五年缴纳罚金37亿3800万韩元

快科技12月30日消息，据媒体综合报道，当地时间12月29日，韩国济州航空一架载有181人的客机在务安机场失事造成179人遇难，成为韩国史上最严重空难。受此消息影响，济州航空股价重挫16%，触及纪

秋白 2024-12-30

REDMI Turbo 4外观公布：“祥云白”配色首次亮相精致利落

快科技12月30日消息，REDMI Turbo 4已经官宣1月2日发布，官方刚刚还公布了新机外观，首次采用的“祥云白”正式亮相。从图片来看，新机采用了直角中框设计，但与背壳过度比较自然，采

建嘉 2024-12-30

如何在 Unity 游戏中集成 AI 语音识别？

先决条件

步骤

1. 设置场景

2. 创建脚本

4. 语音识别

推荐体验

相关资讯

如何在 Space 上托管 Unity 游戏

如何在 ChatGPT 中实现更准确的语音识别？

GDC 2023观察：OpenAI爆红下，AI技术究竟如何在游戏中更好应用？

《银河文明IV：超新星》通过 AlienGPT 技术将 ChatGPT 集成到游戏中

游戏中的生成式 AI 革命

近期资讯

1499元！华为FreeBuds Pro 4蛇年典藏版预售：金蛇绕币设计

德国病假侦探生意兴隆：病假持续增加老板被迫请病假侦探

韩国空难举世皆惊：近6年波音飞机事故已造成525人死亡

王腾称REDMI Turbo 4全面升级：无一短板直追旗舰

曝小米SU7单周新增锁单破万辆：坠坡事件推动作用明显

官方放话：公务用车原则上100%采购新能源汽车！

官方电脑禁用Intel、AMD！加速国产CPU替代

Intel入门级CPU酷睿Ultra 3 205现身：仅一个型号

济州航空股价重挫16% 五年缴纳罚金37亿3800万韩元

REDMI Turbo 4外观公布：“祥云白”配色首次亮相精致利落

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响