Partial voice recognition(部分语音识别)
问题描述
我目前正在使用微软的语音引擎进行语音识别。 它在C#中的设置和使用非常简单,并且允许使用比我最初想象的更少的代码行来实现伟大的目标。 现在的问题是,我真的不知道该如何处理: 我知道,引擎需要开始监听,然后你说一个词或一个句子,它会在词典中进行比较,看看是否能找到匹配。如果是这样,程序将执行您希望它执行的任何操作。
让我摸不着头脑的是,我想让引擎"检测"他的词典中的单词,在包含一个或所有这些单词的完整随机短语中。 例如,我们假设词典包含以下单词: -"阅读" -"新闻"
我想要编写一些代码,每当我说以下内容时都能检测到这些特定的单词: --《给我读新闻》 --"你能看新闻吗?" -"阅读新闻"...如何实现此目标?
推荐答案
此功能称为关键字定位。通常不能使用语音识别引擎进行关键词定位,需要特定的定位包。关键问题是引擎应该不断地比较两个结果-找到单词和找不到单词。语音识别只查找语法中的单词,而不考虑其他声音。发现只需要不同的算法。
有一种解决方法可以将许多可能的音节或其他声音添加到语音识别语法中,并希望引擎将找到它们而不是关键字,但与特定的关键字识别器相比,这不是一个非常好的解决方案。
如果您与微软的引擎没有紧密联系,并且您需要一种通用语言,如美国英语或法语,您可以使用CMUSphinx之类的语音识别开源软件工具包来实现关键字识别。
这篇关于部分语音识别的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:部分语音识别
- 输入按键事件处理程序 2022-01-01
- 带有服务/守护程序应用程序的 Microsoft Graph CSharp SDK 和 OneDrive for Business - 配额方面返回 null 2022-01-01
- C#MongoDB使用Builders查找派生对象 2022-09-04
- 如何用自己压缩一个 IEnumerable 2022-01-01
- WebMatrix WebSecurity PasswordSalt 2022-01-01
- 在哪里可以找到使用中的C#/XML文档注释的好例子? 2022-01-01
- Web Api 中的 Swagger .netcore 3.1,使用 swagger UI 设置日期时间格式 2022-01-01
- 良好实践:如何重用 .csproj 和 .sln 文件来为 CI 创建 2022-01-01
- MoreLinq maxBy vs LINQ max + where 2022-01-01
- C# 中多线程网络服务器的模式 2022-01-01
