__2017-12-11 如一模式识别研究

如一模式识别研究

语音识别>>特定人语音识别芯片

转自:http://semxi.blog.163.com/blog/static/18213604320116184853370/

特定人语音识别芯片

盛矽电子是专业从事方案与技术服务的提供商。专注于语音识别、智能玩具、儿童电脑、语音芯片等领域。盛矽电子由年轻有为、高学历、有多年工作经验的员工组成,踏实敬业,技术实力雄厚。成功的服务于消费类电子、玩具、礼品、仪器等行业,为客户提供高附加值的产品方案与技术支持。

  盛矽电子以技术为先导,把计算机技术,智能技术,自控技术等移植到玩具产品中,使玩具有智能的芯。

您的产品如果选择了盛矽电子的语音识别(注1)产品线,就立即升级为能听懂人命令智能产品,能与人进行交互式对话,提升了产品附价值,为客户创造更多利润。

盛矽电子的高品质语音级、音乐级的放音·录音(自有算法)产品线,硬件资源丰富,质优价廉,可以应用于各种需要语音产品中。

  盛矽电子推出提升开发效率的软件虚拟机(注2)的录音放音芯片。芯片集成了专业的语音算法和简单实用的接口平台;Flash存储技术,简单、高效、灵活、便捷、低风险。

  盛矽电子在儿童电脑,智能算法方向有着独到的技术优势,俱有先进自主产权算法,已经成功向多家知名厂商提供方案级、机芯级的产品。

盛矽电子重磅推出业界第一款专门为智能玩具设计的可编程玩具操作系统Semroid Toy Option System(盛卓玩具操作系统),独特的开放平台,接口丰富多样,适合玩具种类丰富,用户可以把自己的玩法编程,实现新功能和新玩法,使单纯玩具具备创造力。

盛矽电子甘做您的研发部门,完整的技术研发体系能为客户量身定制个性化产品,为客户创造更大价值。

更多信息请访问:www.semxi.com 或电话、E-mail咨询。盛矽电子科技遵循客户为本的服务理念,务实、高效的工作作风,竭诚为您服务!

注1:语音识别,也叫语音辨识,是机器能听懂人语言的技术,被视为本世纪最有挑战性、最具市场前景的应用技术之一。在玩具领域,该技术最具有交互娱乐性。 注2:软件虚拟机,技术类似于Java虚拟机,采用软件封装了技术;避免了专业的汇编指令难学的C指令及语音算法、电机控制等知识。

一、概述

语音识别技术就是让机器通过识别把语音信号转变为命令的技术,也就是语言命令控制,它和人类语言交流一样,作为一种命令交互方式。在PC领域,Microsoft的Word软件就有语音识别技术,但我们的语音识别芯片SR1501与PC相比,具有自己的特点。首先,它是一个完整的语音识别系统,除了识别外还具备语音提示及语音回放等功能。其次,嵌入式语音识别系统具有体积小,可靠性高,功耗低,价格低,易于商品化。嵌入式语音识别系统的特点使得其应用领域十分广泛,不仅可以做玩具、礼品、学习机、消费类产品控制。由于语音识别的特点,不建议使用要求可靠性极高的领域。

二、特定人语音识别原理

嵌入式语音识别系统都采用了模式匹配的原理。录入的语音信号首先经过预处理,包括语音信号的采样、反混叠滤波、语音增强,接下来是特征提取,用以从语音信号波形中提取一组或几组能够描述语音信号特征的参数。特征提取之后的数据一般分为两个步骤,第一步是系统“学习”或“训练”阶段,这一阶段的任务是构建参考模式库,词表中每个词对应一个参考模式,它由这个词重复发音多遍,再经特征提取和某种训练中得到。第二是“识别”或“测试”阶段,按照一定的准则求取待测语音特征参数和语音信息与模式库中相应模板之间的失真测度,最匹配的就是识别结果。

三、SR1501系统硬件设计

对于嵌入式系统而言,语音识别硬件组成要考虑很多其它因素,首先由于成本的限制,一般使用定点DSP,这意味着算法的复杂度受到限制;其次,对产品化有各种严格的限制,这就需要一个高度集成的硬件DSP,因此最理想的硬件组成是系统级的芯片。

我公司采用的是一个16位结构的微控制器,将MCU、A/D、D/A、RAM、ROM集成在一块芯片上,具有很高的集成度。同时具有较高运算速度的16×16位的乘法语音和内积运算指令,CPU 最高可达时钟49MHz,因此在复杂的数字信号处理方面既非常便利又比专用的DSP芯片便宜得多。并具有12位ADC,和12位DAC保证音频精度,配置带自动增益控制(AGC)的麦克风输入方式,为语音处理带来了极大的方便。既具有体积小、集成度高、可靠性好的特点,又具有较强的中断处理能力、高性能的价格比和功能强、效率高的指令系统及低功耗、低电压的特点,所以非常适合用于嵌入式语音识别系统。

以SR1501为核心的嵌入式语音识别系统硬件的电路系统,主要包括麦克风输入电路、ADC、DAC、功放输出电路、键盘电路和各种通信电路等,语音和特征库保存到SPI Flash存储器中。

四、语音识别软件设计

SR1501特定人识别要经过语音训练后才能识别,将语音训练过程中建立的参考模式库和从待识别语音信号中提取的特征参数都存放在外扩的SPI Flash中,这样就可以保证掉电后重新开机继续识别。语音识别系统软件主程序由语音训练程序、语音识别程序、语音播放程序、中断程序、初始化程序等子程序组成。由于嵌入式平台存储资源少、实时性要求高的特点,因此算法在保证识别效果的前提下要尽可能优化。

软件包括A/D变换、预加重、分帧和加窗、端点检测、特征参数提取、放宽端点限制的DTW算法,最后识别结果输出。

五、SR1501的特点

SR1501识别速度快,识别率高,抗干扰能力强,识别率最好可以达到98%以上。体积小,使用灵活,系统价格低廉,可移植性好。目前已成功应用于多类产品中。

评论留言区

:
  

作者: 游客 ; *
评论内容: *
带*号为必填项目

如一模式识别更新提示

matlab在图像处理方面的应用有更新

如一模式识别 友情链接

关于本站作者     chinaw3c     mozilla