Tag: 语音识别

Android:语音识别,不使用谷歌服务器

我想在android中开发一个语音识别器,它应该在离线状态下工作。 由于Android内置的语音识别器使用谷歌服务器,需要互联网,我想在互联网的情况下工作的替代scheme。 请build议我以某种方式实现上述function。

我怎样才能使用语音识别没有恼人的对话在Android手机

这是可能的,而无需修改Android API? 我find了一篇关于这个的文章。 有一个评论,我应该做的android API的修改。 但没有说如何做修改。 有谁能给我一些build议,如何做到这一点? 谢谢! 我find了这篇文章; SpeechRecognizer他的需求和我的几乎一样。 对我来说这是一个很好的参考! 我已经完全解决了这个问题。 我从这个中国网站search了一个可用的示例代码这里是我的源代码 package voice.recognition.test; import android.app.Activity; import android.content.Intent; import android.os.Bundle; import android.view.View; import android.view.View.OnClickListener; import android.speech.RecognitionListener; import android.speech.RecognizerIntent; import android.speech.SpeechRecognizer; import android.widget.Button; import android.widget.TextView; import java.util.ArrayList; import android.util.Log; public class voiceRecognitionTest extends Activity implements OnClickListener { private TextView mText; private SpeechRecognizer sr; private static […]

Android语音识别作为Android 4.1和4.2的服务

我已经成功地将持续的语音识别工作(使用SpeechRecognizer类)作为所有Android版本(最高4.1)的服务。 我的问题涉及到它在版本4.1和4.2上的工作,因为它是已知的有一个问题,因为在语音识别开始后几秒钟,API没有logging,如果没有检测到语音input,那么它是如果语音识别器默默地死亡。 ( http://code.google.com/p/android/issues/detail?id=37883 ) 我发现一个问题提出了解决这个问题的方法( 几秒钟后语音识别停止监听 ),但是我不确定如何实现此解决scheme所需的处理程序。 我知道这种解决方法每隔几秒钟就会发生一次“嘟嘟”,但获得连续的语音识别对我来说更为重要。 如果有人有其他替代解决办法,那么我也想听到这些。

System.Speech.Recognition和Microsoft.Speech.Recognition有什么区别?

在.NET中有两个类似的命名空间和用于语音识别的程序集。 我试图了解这些差异,以及何时适合使用其中一种。 有System.Speech.Recognition从程序集System.Speech(在System.Speech.dll中)。 System.Speech.dll是.NET Framework类库3.0及更高版本中的核心DLL 还有Microsoft.Speech.Recognition从程序集Microsoft.Speech(在microsoft.speech.dll中)。 Microsoft.Speech.dll是UCMA 2.0 SDK的一部分 我发现文档混淆,我有以下问题: System.Speech.Recognition表示这是“Windows桌面语音技术”,这是否意味着它不能用于服务器操作系统或不能用于高规模的应用程序? UCMA 2.0语音SDK( http://msdn.microsoft.com/en-us/library/dd266409%28v=office.13%29.aspx )说,它需要Microsoft Office Communications Server 2007 R2作为先决条件。 不过,我在会议中被告知,如果我不需要在线状态和工作流等OCS功能,我可以使用UCMA 2.0 Speech API,而不需要OCS。 这是真的? 如果我正在为一个服务器应用程序构建一个简单的识别应用程序(比如我想自动转录语音邮件),而且我不需要OCS的功能,那么这两个API之间有什么区别?