任何类似OpenCV的C / C + +库audio处理?

有没有更多的东西,类似(精神上)OpenCV,但处理audio和从中获取一些情报? 能力范围可以从:

  1. 多平台audio捕捉和audio播放
  2. DSP – audio滤波器
  3. 音调检测
  4. 音调属性分析
  5. 音合成(各种标准波形)
  6. 识别给予一些识别语料库和模型(例如确定乐器,节拍,人类语言等) – 可能使用其他开源项目的实际识别部分(狮身人面像)
  7. 语音/音乐合成 – 可以再次使用一些其他的开源项目(节日)

如果库工作在原始audio格式/编码转换是由其他现有库(ffmpeg的sa)处理的外部问题,那就好了。

我不是这个领域的专家,但是需要使用这样的API,并且想知道这样的库是否存在,所以我select确定function的术语可能不是最好的,所以专家可能想要编辑这个问题。

对于audio采集和回放, portaudio出现在我的脑海里。

对于audio处理, STK看起来很有前景。

也看看这个相关的问题: 任何人都可以推荐一个像样的DSP /语音库在C + +?

我推荐这三个库:

  1. 非常容易使用和友好的一般信号处理Aquila-dsp

  2. 强大的audio信号处理库,尽pipe难以使用,对于初学者来说非常复杂: CLAM Project

  3. 另外一个我没有经验的,值得考虑的。 TSPL

查看Essentia http://essentia.upf.edu/ Essentia是一个开源的C ++库,用于audio分析和基于audio的音乐信息…它包含大量的可重复使用的algorithm,实现audioinput/输出function,标准数字信号处理模块,数据的统计表征,以及大量的频谱,时间,音调和高级音乐描述符。

还有一个openFrameworks分支,虽然你可能想要在几个月内推迟到正式的64位,C ++ 11。 https://github.com/GiantSteps/Essentia-Libraries

我想你可以尝试高迪音响库 – http://www.geek-audio.org

Gaudio库支持audio解码,编码和DPS。