基于STM32的孤立词语音识别项目源码+论文资料（高分毕设项目）

共178个文件

h：53个

c：50个

wav：13个

版权申诉

毕业设计

源码

154 浏览量 2024-10-28 09:36:19 上传评论收藏 3.73MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

基于STM32的孤立词语音识别项目源码+论文资料（高分毕设项目）（178个子文件）

speech_recog.asv 13KB

teat.asv 589B

STM32_Voice.asv 314B

语音识别.axf 529KB

语音识别.uvgui_SongJian.bak 128KB

语音识别.uvgui_宋健.bak 72KB

语音识别_uvopt.bak 26KB

语音识别_uvproj.bak 23KB

Voice_Rec.BAT 6KB

after-compile.bat 260B

stm32f10x_tim.c 105KB

SDcard.c 90KB

stm32f10x_flash.c 62KB

stm32f10x_rcc.c 50KB

stm32f10x_adc.c 46KB

stm32f10x_i2c.c 43KB

v1.c 39KB

stm32f10x_usart.c 37KB

stm32f10x_fsmc.c 34KB

system_stm32f10x.c 31KB

stm32f10x_can.c 31KB

stm32f10x_spi.c 29KB

stm32f10x_it.c 29KB

stm32f10x_sdio.c 28KB

stm32f10x_dma.c 27KB

stm32f10x_gpio.c 19KB

stm32f10x_dac.c 19KB

FATFS.C 18KB

core_cm3.c 17KB

TFTLCD.c 12KB

stm32f10x_cec.c 11KB

stm32f10x_pwr.c 9KB

spiFlash.c 9KB

stm32f10x_rtc.c 8KB

stm32f10x_bkp.c 8KB

main.c 8KB

misc.c 7KB

stm32f10x_exti.c 7KB

VAD.C 6KB

stm32f10x_wwdg.c 6KB

DTW.C 5KB

stm32f10x_dbgmcu.c 5KB

stm32f10x_iwdg.c 5KB

MFCC.C 4KB

USART.C 4KB

touch_panel.c 4KB

ADC.C 4KB

GUI.C 3KB

mfcc_tem.c 3KB

stm32f10x_crc.c 3KB

BSP.c 2KB

tri_even.c 2KB

tri_odd.c 2KB

Flash.C 2KB

dct_arg.c 996B

delay.c 972B

hamm.c 784B

Interface.C 532B

SPI.C 409B

tri_cen.c 87B

语音识别_Voice_Rec.dep 48KB

语音识别_Target 1.dep 75B

语音识别.fed 14KB

00000000-00090000 24 dot font.h 3.11MB

spiFlashTable.h 1.38MB

000C0000 16 dot font.h 1.38MB

unicode to gb2312.h 708KB

stm32f10x.h 607KB

core_cm3.h 84KB

stm32f10x_tim.h 49KB

stm32f10x_rcc.h 30KB

stm32f10x_i2c.h 29KB

stm32f10x_fsmc.h 26KB

stm32f10x_flash.h 25KB

stm32f10x_sdio.h 21KB

stm32f10x_adc.h 21KB

stm32f10x_dma.h 20KB

stm32f10x_can.h 20KB

00090000 24 dot ascii font.h 19KB

stm32f10x_gpio.h 19KB

stm32f10x_spi.h 18KB

stm32f10x_usart.h 16KB

SDcard.h 15KB

stm32f10x_dac.h 15KB

misc.h 9KB

stdint.h 8KB

bsp.h 8KB

stm32f10x_bkp.h 7KB

stm32f10x_exti.h 7KB

stm32f10x_cec.h 6KB

MFCC_Arg.h 6KB

stm32f10x_it.h 4KB

stm32f10x_pwr.h 4KB

stm32f10x_rtc.h 4KB

stm32f10x_iwdg.h 4KB

stm32f10x_dbgmcu.h 4KB

stm32f10x_conf.h 3KB

FS_Structure.h 3KB

stm32f10x_wwdg.h 3KB

stm32f10x_crc.h 2KB

共 178 条

基于STM32的孤立词语音识别
这是我毕业设计的论文，当年花了几个月来做，最终算是做出来个基本的功能样机。本来最开始
时想做一个图像识别进而实现体感操控，后来考虑到当年用的比较顺手的MCU中功能最强的就是
STM32，处理速度和内存容量都难以实现图像识别。于是就换成语音识别，图像识别留作以后再来
吧。
OK，废话不多说，上论文：
摘要：语音识别是机器通过识别和理解过程把人类的语音信号转变为相应文本或命令的技术，其
根本目的是研究出一种具有听觉功能的机器。本设计研究孤立词语音识别系统及其在STM32嵌入式平
台上的实现。识别流程是：预滤波、ADC、分帧、端点检测、预加重、加窗、特征提取、特征匹配。
端点检测(VAD)采用短时幅度和短时过零率相结合。检测出有效语音后，根据人耳听觉感知特性,计算
每帧语音的Mel频率倒谱系数(MFCC)。然后采用动态时间弯折(DTW)算法与特征模板相匹配,最终输出
识别结果。先用Matlab对上述算法进行仿真，经多次试验得出算法中所需各系数的最优值。然后将算
法移植到STM32嵌入式平台，移植过程中根据嵌入式平台存储空间相对较小、计算能力也相对较弱的
实际情况，对算法进行优化。最终设计并制作出基于STM32的孤立词语音识别系统。
关键词：STM32  孤立词语音识别  VAD  MFCC  DTW
目录
引 言
第一章 方案论证及选择
1.1系统设计任务要求
1.2硬件选择
1.2.1 硬件方案总体介绍
1.2.2 MCU选择
1.2.3音频信号采集方案选择
1.2.4显示及操作界面选择
1.3算法选择
1.3.1软件算法总体介绍
1.3.2预处理算法选择
1.3.3端点检测算法选择
1.3.4特征提取算法选择
1.3.5特征匹配算法选择
第二章 系统设计

2.1硬件设计
2.1.1 MCU及其最小系统电路设计
2.1.2  音频信号采集电路设计
2.1.3 LCD接口电路设计
2.2软件设计
2.2.1 语音预处理算法设计
2.2.2 端点检测算法设计
2.2.3 特征提取算法设计及优化
2.2.4模板训练算法设计
2.2.5特征匹配算法设计
2.2.6显示界面设计
第三章 系统制作及调试结果
3.1系统制作与调试
结 论
参考文献
开源
引 言
从技术上讲，语音识别属于多维模式识别和智能接口的范畴。它是一项集声学、语音学、计算
机、信息处理、人工智能等于一身的综合技术，可广泛应用在信息处理、通信和电子系统、自动控制
等领域。
国际上对语音识别的研究始于20世纪50年代。由于语音识别本身所固有的难度，人们提出了各
种条件下的研究任务，并有此产生了不同的研究领域。这些领域包括：针对说话人，可分为特定说话
人语音识别和非特定说话人语音识别；针对词汇量，可划分为小词汇量、中词汇量和大词汇量的识
别，按说话方式，可分为孤立词识别和连续语音等。最简单的研究领域是特定说话人、小词汇量、孤
立词的识别，而最难的研究领域是非特定人、大词汇量、连续语音识别。
在进入新世纪之前，语音识别技术大都只在特定行业或场所中使用或者仅仅停留在实验室，处于
探索和试验中。最近十年由于消费电子行业的兴起和移动互联网技术的爆发。越来越多的自动化和自
能化产品走进人们的日常生活。语音识别技术也随之进入大众的视线，并开始为更多人所了解和使
用。例如语音门禁、智能电视上的语音换台、智能手机上的语音拨号、语音控制等等。语音识别技术
正在由过去的实验探索迈入实用化阶段。我们有理由相信会有越来越多的产品用到语音识别技术，它
与人工智能能技术的结合将会是一个重要的发展方向。语音识别技术最终会改变人与机器之间的交互
方式，使之更加自然、便捷、轻松。

本设计的孤立词语音识别是语音识别技术中较为基本的，算法实现也较简单，适合于在嵌入式平

台中实现一些简单的语音控制功能。以往类似系统大都基于ARM9、ARM11、DSP、SOC等。这些平

台系统规模较大、开发和维护的难度较大、成本也相对较高。STM32是意法半导体(ST)公司推出的基

于ARM Cortex-M3内核的高性能单片机。上市之后，由于其出色的性能、低廉的价格，很快被运用到

众多产品中。经测试，STM32F103VET6单片机拥有能够满足本系统孤立词语音识别所需的运算和存

储能力。所以在本系统中采用STM32F103VET6作为主控制器，采集并识别语音信号。以低廉的成

本，高效的算法完成了孤立词语音识别的设计目标。本系统主要涉及的内容如下述：

语音信号的采集和前端放大、防混叠滤波、模数转换。

语音信号预处理，包括预加重、分帧、加窗。

语音信号端点检测，检测输入信号中有效语音的起始和结束点

语音信号特征提取。提取有效语音中每帧语音信号的Mel频率倒谱系数(MFCC)系数。

模板训练，对每个语音指令采集多个语音样本，根据语音样本获取每个语音指令的特征模板。

特征匹配，使用动态时间规整（DWT）算法计算输入语音信号与各模板的匹配距离。识别输入

的语音信号。

系统硬件电路设计，人机界面设计。

第一章方案论证及选择

1.1系统设计任务要求

本系统利用单片机设计了一个孤立词语音识别系统，能够识别0~9、 “上”、“下”、“左”、“右”14

个汉语语音指令。系统通过触摸式LCD与用户交互。

本设计的主要要求如下：

1．采集外部声音信号，转换为数字信号并存储。

2．在采集到的声音信号中找出有效语音信号的开始和结束点。

3．分析检测到的有效语音，得出语音信号特征。

4．对每个待识别的语音指令，建立特征模版。

5．比较输入语音信号特征与特征模版，识别输入的语音信号

6．显示系统操作界面，并能够接受用户控制。

1.2硬件选择

1.2.1 硬件方案总体介绍

系统硬件由音频放大模块、MCU、触摸屏、电源四部分组成。音频放大模块完成对外部声音信号

的采集和放大。将声音信号转化为电信号，并放大到0~3V。MCU的ADC参考电压为其电源电压

3.3V。音频放大模块的输出信号不超出MCU ADC的电压范围，并且能够获得最大的量化精度。MCU

对音频放大模块输入的声音信号进行AD转换。然后提取并识别信号特征。另外，MCU还控制触摸屏

的显示和读取触摸屏点击位置。触摸屏负责显示操作界面，并接收用户操作。电源为电池供电。

系统硬件结构图如图1.1所示。

图1.1系统硬件总体结构图

1.2.2 MCU选择

传统上孤立词语音识别多采用语音识别专用芯片，例如凌阳SPCE061A、LD3320等。此种方案设

计简单，开发周期较短，但可拓展性较差，一般只能识别特定的语音，或者识别语音指令的个数有限

制。且专用芯片价格一般相对较高，对系统成本控制不利。

STM32F103VET6是意法半导体（ST）推出的高性能32位Cortex-M3内核单片机，带有ADC、

DAC、USB、CAN、SDIO、USART、SPI、IIC、FSMC、RTC、TIM、GPIO、DMA等大量片上外设。

Cortex-M3内核属于ARM公司推出的最新架构ARMv7中的M系列，侧重于低成本、低功耗、高性能。

其最高主频可达72MHz， 1.25 DMIPS/MHz的运算能力，三级流水线另加分支预测，并且还带有单周

期乘法器和硬件除法器。相比较ARM7TDMI内核，Cortex-M3在性能上有较大的提升。

STM32F103VET6内置3个一共21通道的12位ADC，采样频率最高可达1MHz。12通道DMA控制

器，可访问系统Flash、SRAM、片上外设，能够处理内存到外设、外设到内存的DMA请求。11个16位

定时器，其中T1、T2、T3、T4、T5、T8可连接到ADC控制器，在每次定时器捕获/比较事件到来时自

动触发ADC开始一次A/D转换。A/D转换完成后可自动触发DMA控制器将转换后的数据依次传送至

SRAM的数据缓冲区。因此STM32F103VET6能够进行精确且高效的A/D转换。能够满足音频信号采集

的需求。

STM32F103VET6的FSMC(Flexible Static Memory Controller，可变静态存储控制器)能够根据不

同的外部存储器类型，发出相应的数据/地址/控制信号类型以匹配信号的速度。FSMC连接至LCD控制

器，可将LCD控制器配置为外部NOR Flash。在系统需要访问LCD时，自动生成满足LCD控制器要求的

读写时序，能够精确、快速地完成对LCD界面显示的控制。内置3个最高可达18Mbit/s的SPI控制器，

与触摸屏控制器相连能够实现触摸屏点击位置检测。

本系统中采集一个汉语语音指令。录音时间长度2s，以8KHz 16bit采样率对语音进行采集，所需

存储空间为32KB，另外加上语音处理、特征提取及特征匹配等中间步骤所需RAM空间不会超过

64KB。而STM32F103VET6带有512KB Flash和64KB RAM。所以STM32F103VET6在程序空间上能够

满足。语音识别中最耗时的部分是特征提取中的快速傅立叶变换换。一般来说，孤立词语音识别中有

效语音时间长度小于1s。语音信号一般10~30ms为一帧，本系统中按20ms一帧，帧移（相邻两帧的

重叠部分）10ms，这样一个语音指令不超过100帧。在8KHz 16bit的采样率下，20ms为160采样点。

STM32固件库所提供的16位、1024点FFT，在内核以72MHz运行时每次运算仅需2.138ms。完成100

帧数据的FFT所需时间为213.8ms，加上其他处理所需时间，识别一个语音指令耗时不会超过0.5s。

所以在程序运行时间上STM32F103VET6也能够满足需要，能够进行实时的孤立词语音识别。

基于以上论证，本系统选用STM32F103VET6作为主控MCU。

评论收藏

内容反馈

版权申诉

yava_free

粉丝: 5437
资源: 2092

基于STM32的孤立词语音识别项目源码+论文资料（高分毕设项目）

人工智能-深度学习-语音识别-基于STM32的孤立词语音识别项目源码+毕设论文资料

基于STM32的声控台灯毕业设计源码+论文资料（高分毕设）

基于STM32的老人摔倒报警装置源码+论文+全部资料（高分毕设优秀项目）

基于STM32的脉搏电子血压计项目源码+全部资料（高分毕设项目）

基于STM32的智能鱼缸设计项目源码+全部资料（高分毕业设计）

基于C++和Qt+STM32MP157的人脸识别系统源码+文档说明（高分毕设项目）

基于STM32的RFID停车场项目源码+全部数据（高分项目）

基于STM32的智能家居系统+源代码+文档说明+论文资料（高分毕设项目）

基于STM32的四旋翼无人机项目源码+文档说明（高分毕业设计）

基于STM32的共享充电宝项目源码+报告PPT（高分毕业设计项目）

基于STM32的共享充电宝项目源码+报告PPT（高分期末大作业项目）

基于STM32的智能台灯设计项目源码+DOC文档（高分项目）

基于STM32的智能家居系统设计源码+论文+答辩PPT（高分毕业设计）

C语言本科毕业设计-基于stm32的智能家居系统设计源码+论文及详细资料（高分项目）

基于STM32的孤立词语音识别详细文档+全部资料+高分项目.zip

基于STM32的孤立词语音识别代码.zip

基于stm32单片机的老人安全监护系统源码+论文+全部数据资料（高分优秀毕设）

基于STM32的智能鱼缸设计源代码+文档说明（高分毕设）

基于STM32物流自动分拣小车源代码+文档说明（高分毕设）

34个经典javaweb项目实例.zip

毕业设计 springBoot人力资源管理系统+毕业论文+前后端源代码

项目源码：基于Hadoop+Spark招聘推荐可视化系统 大数据项目 计算机毕业设计

基于spring boot的小区物业管理系统源码+论文+答辩ppt

计算机毕业设计：Flask股票数据采集分析可视化系统 python+爬虫+金融数据

优秀毕业设计：基于transformer的序列数据二分类完整代码+数据可直接运行

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计 项目源码 毕业设计

毕业设计-基于JAVA的springboot超市进销存系统(源代码+论文）

沈阳工程学院 毕业论文 模板 2024年

基于深度学习的课堂行为识别和考试作弊检测系统的设计与实现（python源码）

最新资源

项目源码：基于Hadoop+Spark招聘推荐可视化系统大数据项目计算机毕业设计

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计项目源码毕业设计

沈阳工程学院毕业论文模板 2024年