语音识别软件开发人员

那么文件最后说了,我需要在我的手腕上轻松几个月。 因为我是一名.NET开发人员,这可能会使我的生活停滞一段时间,而我并不急于做这件事。 这就是说,开发人员有没有什么好的免提select? 任何人都有成功使用任何语音识别软件在那里?

POSTSCRIPT:我已经恢复了我的arm,双手编程不成问题。 龙自然地说,工作得不错,但速度较慢,不像键盘那样编程比我想象的要快。

    它在那里,它工作…

    这里有很多的语音识别程序,其中Dragon NaturallySpeaking是我认为是使用最广泛的语音识别程序之一。 我自己也使用过它,并且对它的质量印象深刻。 那是两三年前的事情,现在事情已经进一步改善了。

    但是这并不容易…

    即使它工作得非常好,我也不会说这是一个简单的解决scheme。 培训课程需要时间,即使如此,也会犯错误。 与打字相比,速度非常慢,所以我不得不一直对自己说:“不要拿起键盘,不要拿起键盘,…”(之后我会拿起键盘)。 我自己往往咕a一下,这也没有使事情变得更好,或者;-)。 尤其是第一周可能会令人沮丧。 如果你的声音太大,你甚至会听到与声音有关的问题 。

    特别是对于程序员!

    总而言之,这对于编写普通文本/散文的人来说无疑是一个可行的解决scheme。 作为一个程序员,你处于一个完全不同的领域,对此,没有真正的解决scheme。 事情现在可能已经改变,但如果他们有,我会感到惊讶。

    有什么问题? 大多数SR软件是为了识别正常语言而build立的。 程序员编写非常神秘的东西,而且很难find在普通语言和代码之间进行转换的软件。 例如,你将如何规定:

    if (somevar == 'a') { print('You pressed a!'); } 

    在平均的SR程序中使用这些命令,这是一个巨大的痛苦:“如果空格左括号等于符号等号撇号拼写撇号…”。 而且我甚至不谈论导航代码。 曾经注意到在编程时你使用了多less键盘,以及与普通用户使用键盘的方式有什么不同?

    如何充分利用它

    到目前为止,我只和Dragon NaturallySpeaking(DNS)合作过,所以我只能说这个产品。 有一些有趣的插件和网站针对像程序员这样的人:

    • Vocola是一个非官方的插件,可以让您轻松地将自己的命令添加到DNS。 基本上我发现它是必不可less的。 您还可以find其他程序员编写的命令集,例如导航代码。 它基于用Python编写的软件包,所以还有一些更高级和更高级的软件包。 还可以查看Vocola的资源页面 。 (警告:当我使用它时,安装Vocola时出现了一些问题;请查看下面的新闻组获取信息!)
    • SpeechComputing.com是一个有许多有趣讨论的论坛/新闻组。 一个好地方开始。

    结束语

    看来这个问题的最佳解决scheme是:

    • find实际编码的方法。
    • 尝试恢复。 我有点不情愿推荐这本书,但对于RSI /腕pipe和其他慢性疼痛问题的人来说,它似乎工作得非常好: JE Sarno,Mindbody处方 。 我现在正在使用它,我认为这绝对值得一读。

    我使用Dragon NaturallySpeaking 10 Professional来指定VB.net和TSQL。 VB.net本质上更接近于“口语”语言,但我没有看到任何理由不能为C#或其他人工作。 我从一个完全空白的词汇开始,从头开始构build,以满足我的需求(这就是为什么我使用专业版)。

    以下是基本步骤(假定您已经创build并培训了一个用户):

    1. 基于“基本一般 – 空听写”创build一个新词汇。
    2. 没有它扫描您的文件或电子邮件。
    3. 添加具有特定发音的关键字列表(Dim,ByVal \ by-val等)。
    4. 创build一个包含所有代码的.txt文档减去评论。
    5. 从这个文件中收集单词并添加发音。
    6. 使用文档来训练词汇的语言模型。

    如果有人有兴趣,我会有机会写更详细的内容。

    编辑:

    以下是如何指定SQL代码 。 如果您是数据库开发人员,此处创build的单词列表可以包含在其他词汇表中。

    查看使用Python进行语音编码 。

    另一个想法是find另一个好的开发者来配对程序。 它对我来说真的很好。 我不必放慢脚步,最终生成质量更好的代码 – 或者至less不必重新审查。

    对于所有的Linux人员,我想分享一些链接。

    让我们从西蒙开始 – 开源语音识别软件:

    • 西蒙倾听 – 非营利组织的研究和学徒
    • simon:开源语音识别相关的博客
    • HTK语音识别工具包 – 内部使用的引擎
    • 开源大词汇量CSR引擎Julius
    • 不是在关于西蒙fetings的shlashdot

    和其他一些:

    • 相关的stackoverflow关于文本到语音识别工具的Linux的问题。

    我知道我有点偏离主题,对语音识别软件一无所知。 不过,您可能会发现调查将键盘更改为Dvorak布局非常有用,而我听说这种布局对于手腕来说更为贴心。

    http://en.wikipedia.org/wiki/Dvorak_Simplified_Keyboard

    几年前,我尝试了龙,这是一个肮脏的词和短语的噩梦 – 不推荐。 我知道这是当时最好的事情,所以我不乐观。

    作为同胞患者,build议是:

    1. find一个尽可能lessOT的工作
    2. 尝试各种键盘。 根据我的经验,在全职笔记本电脑上工作效果最好。
    3. 开始一个低中度压力举重的计划。

    至于手腕问题,我在10年前双手学会了用鼠标。

    令人惊讶的是,容易,并大大缓解了紧张局势。 目前,我正在使用一台笔记本电脑,并按下触摸板button正在紧张我的拇指。

    小心。 这些问题可能比人们想象的要长。


    你可能会添加一个标签“人体工程学”或什么的 – 标题可以被看作是关于语音识别的发展。

    语音编程的黄金标准是VoiceCode 。 如果我没有记错,他们支持C ++和Python。

    如上所述,Dragon Naturally Speaking是目前最好的语音识别软件,然而微软语音识别(Microsoft Speech Recognition)也不甘落后,并与Vista捆绑在一起。

    Vocola最近被移植到MSR,并具有.Net集成function。

    一些提示

    1. 学习听写需要一些时间。 只是因为你可以说话并不意味着你知道如何使用语音识别软件
    2. 熟练使用SR和键盘/鼠标的混合要比完全免提操作容易得多。
    3. 使用CodeRush或类似的键入less。

    我开始用我的左手做鼠标,这不仅帮助了我,还允许我更自由地使用我的右手,如果你在编写代码的时候写了很多东西的话,这对你有很大的帮助。并同时写下…

    当我的问题开始时,我把一个水袋放在我的手腕下,我喜欢它! 我所拥有的包是完美的,它很长,我把它放在键盘之前,所以我可以在那里rest我的手腕….直到有一天我踩着它…

    龙自然地说首选和Vocola。 Autohotkey尽可能自动化。 不容易编程。 我试过了; 几乎不可能。 看看约翰·萨诺的治疗背痛。 这让我更好。 我整天回到编程!

    另外一个关键的问题在这里,我发现,拆分keboard分成两个部分和其他特殊的键盘帮助,只是检查出kinesis。 我在diigo收集了关于这种硬件的信息:

    直接链接如何:

    还有一件事! 记住锻炼的rest时间。 经常锻炼(例如小锻炼 – 每半小时一次)让事情变得更好!

    Scott Hanselman使用语音识别相当多 。

    我在1996年使用了Dragon Dictate,原因和你一样。 这是缓慢的,但比不工作更好。 我发现通过用代码填充4×8白板,然后让别人input代码,可以更容易地编写代码。然后,我使用DD进行debugging。

    而当你在这里,你可能会看Deborah Quilter关于RSI 的书。 他们非常丰富。

    我找不到一个链接(我看过),但有键盘只有5个键,让你用一只手打字,我假设你只有一个坏手腕。

    如果我find一个链接,我会试着给你发消息。