ESP32语音转文字齐护百度在线语音识别

一、导入(10分钟)
学习目的
二、新授(70分钟)
1.预展示结果(5分钟)
2.本节课所用的软硬件(5分钟)
4.图形化块介绍(10分钟)
5.单个模块的简单使用(10分钟)
6.在线语音转换工具逻辑分析(10分钟)
7.在线语音转换工具分步实现(30分钟)
三、巩固练习(5分钟)
四、课堂小结(5分钟)
五、程序下载

应用说明:

我们在日常生活中经常会用键盘进行打字,而打字的速度会比较慢,今天我们就来制作一个在线语音转换工具,通过说话,直接AI云平台将语音转换成文本,从而大大加快我们打字的速度,增加我们设备的科技含量。这样我们就可以调用这个文本来实现程序的智能控制。

应用范围:各类小的创客比赛,创新项目,语音输入转文字应用设备等。

一、导入(10分钟)

学习目的

1.了解在线语音转换工具仪的工作原理

2.学会齐护双按键模块、齐护在线识别模块、齐护TFT显示屏的接线

3.学会齐护双按键模块、齐护在线识别模块、齐护TFT显示屏的程序编写

二、新授(70分钟)

1.预展示结果(5分钟)

在这里插入图片描述

功能介绍:

当绿色按键按下,开始语音识别,当绿色按键松开,在屏幕上显示语音识别的结果

2.本节课所用的软硬件(5分钟)

3.所用器件 数量

齐护教育版Mixly 1
C02mini主板或AIcam\C02 1
齐护双按键模块 1
齐护TFT显示屏 1
齐护在线语音识别模块(拾音器) 1
C02 4pin线 4
积木组件 若干
齐护C02mini

以上内容可参考:项目一

齐护语音双按键模块

以上内容可参考:项目一

齐护TFT显示屏

以上内容可参考:项目八

齐护在线语音识别模块

在这里插入图片描述

通用万向拾音(麦克风)模块,AI人工智能物联网云服语音识别模块,如要使用本公司软件暂只支持ESP32主控,或购买齐护的C02主控或AIcam主控,结合控制使用,支持ArduinoIDE Mixly软件编程 ,I2S接口

设计:色彩丰富,多种控制方式,积木式通用设计,安装方便,随意搭建;

工艺:沉金无铅PCB,SMT贴片元件,稳定耐用;

4.图形化块介绍(10分钟)

齐护语音双按键模块相关块介绍

以上内容可参考:项目一

齐护TFT显示屏相关块介绍

以上内容可参考:项目八

齐护在线语音识别相关块介绍
在这里插入图片描述

齐护在线语音识别的相关块在齐护机器人C02下的语音合成下,主要有四个块

在这里插入图片描述

第一个块是初始化百度语音,里面的密钥通过关注【齐护教育机器人】的微信公众号回复baidukey获取链接获得

首先关注【齐护教育机器人】,回复baidukey
在这里插入图片描述

然后打开得到的链接

在这里插入图片描述

在里面填入百度的API KEY和Secret KEY,再点提交就可以得到密钥了

接下来我们来讲一下如何获取百度的API KEY和Secret KEY

首先打开mixly,找到百度语音初始化这个块,然后右击,点帮助
在这里插入图片描述
在这里插入图片描述

然后点击右上角的控制台

在这里插入图片描述

登录了之后选语音能力引擎

在这里插入图片描述

然后领取免费资源

在这里插入图片描述

领取所有资源,再点应用列表,然后创建一个应用

在这里插入图片描述

在这里插入图片描述

接着就得到了API KEY和Secret KEY,然后把这二个填入之前的那个网址

在这里插入图片描述

点击提交
在这里插入图片描述

就得到了百度AI密钥
在这里插入图片描述

第二个块是初始化语音识别模块的引脚
在这里插入图片描述

第三个块是获取语音识别结果,其中需要填入齐护密钥

在Mixly软件右上角打开【上传工具】
在这里插入图片描述

点击浏览,找到生成密钥的固件

在这里插入图片描述

再点击上传到ESP

然后在【其它】内输入任意字符,比如输入数字1,点【发送】就得到了齐护密钥。

也可以到其它软件或Mixly软件上打开串口监视器,波特率115200,按一下板子上的复位,也可以返回齐护密钥。

或在工具中清除记录,重新连接,然后点一下“显示记录”,按主板的复位键。

在这里插入图片描述在这里插入图片描述

第四个块的功能是语音识别停止录音

5.单个模块的简单使用(10分钟)

齐护语音双按键模块接线

齐护语音双按键模块程序

以上内容可参考:项目一

齐护TFT显示屏相关块接线

齐护TFT显示屏相关块程序

以上内容可参考:项目八

齐护在线语音识别接线

在这里插入图片描述

齐护在线语音识别模块接C02的P3端口

齐护在线语音识别程序
在这里插入图片描述

效果
在这里插入图片描述

按下按键,开始识别,松开按键,停止识别,并通过串口打印识别的结果

6.在线语音转换工具逻辑分析(10分钟)

在这里插入图片描述

逻辑分析:

首先在屏幕上显示提示信息,然后判断按键是否按下,如果按下,开始录音,如果松开停止录音并且在屏幕上显示识别的结果

7.在线语音转换工具分步实现(30分钟)

整体接线(6分钟)

在这里插入图片描述

齐护TFT显示模块CS接C02 的P5端口,DC接C02的P6端口,齐护在线语音识别模块接C02的P3端口,齐护按键模块接C02的P1端口

分步实现(24分钟)

在这里插入图片描述

1.将识别结果通过串口打印出来(12分钟)

在这里插入图片描述

效果

在这里插入图片描述

按下按键,开始识别,松开按键,停止识别,并通过串口打印识别的结果

2.增加提示信息,并将识别结果通过屏幕显示出来(12分钟)

程序
在这里插入图片描述

效果
在这里插入图片描述

增加提示信息,并将识别结果通过屏幕显示出来

三、巩固练习(5分钟)

1,在本节课的基础上尝试修改提示信息,让本作品更符合实际运用

2,把识别结果放到变量中,对比结果然后执行其它的程序

3,采用齐护AIcam直接应用该项目:
在这里插入图片描述

在这里插入图片描述

四、课堂小结(5分钟)

本节课我们主要学习了以下内容

1.了解在线语音转换工具的工作原理

2.学会齐护双按键模块、齐护在线识别模块、齐护TFT显示屏的接线及程序的编写

五、程序下载

课程程序下载:【在线语音转换工具程序】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2814116.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

【QT+QGIS跨平台编译】之五十四:【QGIS_CORE跨平台编译】—【qgssqlstatementlexer.cpp生成】

文章目录 一、Flex二、生成来源三、构建过程一、Flex Flex (fast lexical analyser generator) 是 Lex 的另一个替代品。它经常和自由软件 Bison 语法分析器生成器 一起使用。Flex 最初由 Vern Paxson 于 1987 年用 C 语言写成。 “flex 是一个生成扫描器的工具,能够识别文本中…

H3C OSPF 外部路由引入实验

H3C OSPF 外部路由引入实验 实验拓扑 实验需求 按照图示配置 IP 地址R1,R2,R3 运行 OSPF 使内网互通,所有接口(公网接口除外)全部宣告进 Area 0;要求使用环回口作为 Router-id业务网段不允许出现协议报文…

Groovy(第九节) Groovy 之单元测试

JUnit 利用 Java 对 Song 类进行单元测试 默认情况下 Groovy 编译的类属性是私有的,所以不能直接在 Java 中访问它们,必须像下面这样使用 setter: 编写这个测试用例余下的代码就是小菜一碟了。测试用例很好地演示了这样一点:用 Groovy 所做的一切都可以轻易地在 Java 程序…

科技论文编写思路

科技论文编写思路 1.基本框架2.课题可行性评估1.研究目标和意义2.研究方法和技术3.可行性和可操作性4.风险和不确定性5.经济性和资源投入6.成果预期和评估 3.写作思路4.利用AI读论文5.实验流程 1.基本框架 IntroductionRelated worksMethodExperiment and analysisDiscussionC…

计算机网络:深入探索HTTP

引言: HTTP,全称超文本传输协议(Hypertext Transfer Protocol),是互联网上数据通信的基础。它定义了客户端(如浏览器)和服务器之间如何交互和传输数据。HTTP最初是为了支持Web浏览而设计的&…

【Web安全靶场】sqli-labs-master 1-20 BASIC-Injection

sqli-labs-master 1-20 BASIC-Injection 文章目录 sqli-labs-master 1-20 BASIC-Injection第一关-报错注入第二关-报错注入第三关-报错注入第四关-报错注入第五关-报错注入-双查询注入第六关-报错注入-双查询注入第七关-outfile写入webshell第八关-布尔盲注第九关-时间盲注第十…

小甲鱼Python06 序列字典集合

一、序列 1.id函数 is运算符 我们首先思考下字符串、元组、列表的共同点: 都有很多共同的运算符。都可以通过索引来获取元素,第一个元素索引都是0,都可以通过切片的方法获取某个范围内元素的集合。 以上三种统称为序列。序列分为可变序列…

HTML5 CSS3 提高

一,HTML5的新特性 这些新特性都有兼容性问题,基本是IE9以上版本的浏览器才支持,如果不考虑兼容性问题,可以大量使用这些新特性。 1.1新增语义化标签 注意: 1这种语义化标签主要是针对搜索引擎的 2这些新标签在页面…

BevFusion (2): nuScenes 数据介绍及点云可视化

1. nuScenes 数据集 1.1 概述 nuScenes 数据集 (pronounced /nu:ːsiː:nz/) 是由 Motional (以前称为 nuTonomy) 团队开发的自动驾驶公共大型数据集。nuScenes 数据集的灵感来自于开创性的 KITTI 数据集。 nuScenes 是第一个提供自动驾驶车辆整个传感器套件 (6 个摄像头、1 …

Onenote软件新建笔记本时报错:无法在以下位置新建笔记本

报错现象: 当在OneNote软件上,新建笔记本时: 然后,尝试重新登录微软账户,也不行,提示报错: 解决办法: 打开一个新的记事本,复制粘贴以下内容: C:\Users\Adm…

MQTT协议解析:揭秘固定报头、可变报头与有效载荷的奥秘

MQTT(Message Queuing Telemetry Transport,消息队列遥测传输协议)是一种轻量级的通讯协议,常用于远程传感器和控制设备的通讯。MQTT协议基于发布/订阅模式,为大量计算能力有限且工作在低带宽、不可靠网络环境中的设备…

51单片机 wifi连接

一、基本概念 ESP8266是一款集成了WiFi功能的高性能芯片,广泛应用于物联网设备、智能家居、传感器网络等领域。以下是ESP8266的详细讲解: 1. 功能特点:ESP8266集成了TCP/IP协议栈,支持STA(Station)和AP&am…

13.云原生之常用研发中间件部署

云原生专栏大纲 文章目录 mysql主从集群部署mysql高可用集群高可用互为主从架构互为主从架构如何实现主主复制中若是两台master上同时出现写操作可能会出现的问题该架构是否存在问题? heml部署mysql高可用集群 nacos集群部署官网文档部署nacoshelm部署nacos redis集…

nginx 模块 高级配置

目录 一、高级配置 1.1. 网页的状态页 1.2.Nginx 第三方模块 ehco 模块 打印 1.3.变量 1.3.1 内置变量 1.3.2自定义变量 1.4.Nginx压缩功能 1.5.https 功能 1.6.自定义图标 一、高级配置 1.1. 网页的状态页 基于nginx 模块 ngx_http_stub_status_module 实现&…

如何使用程序通过OCR识别解析PDF中的表格

https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.7/ppstructure/table/README_ch.md#41-%E5%BF%AB%E9%80%9F%E5%BC%80%E5%A7%8B Paddle-structure是目前我们能找到的可以做中英文版面分析较好的一个基础模型,其开源版可以识别十类页面元素。这篇文章介绍…

力扣 300. 最长递增子序列

题目来源:https://leetcode.cn/problems/longest-increasing-subsequence/description/ C题解1:动态规划 用两个循环,每到一个元素,就找它之前的最长递增子序列。 dp[i]表示第i个元素的最长递增子序列,里层遍历寻找之…

Eavesdropping(窃听机制)在机器学习中的用法

1. 简单翻译 考虑一个对任务 T 和 T’ 有用的特征 F,它在学习 T 时很容易学习,但在学习 T’ 时很难学习,因为 T’ 以更复杂的方式使用 F。网络学习 T 将学习 F,但网络学习 T’ 可能不会。如果网络学习 T’ 也学习 T,T…

阿里云中小企业扶持权益,助力企业开启智能时代创业新范式

在数字化浪潮的推动下,中小企业正面临着转型升级的重要关口。阿里云深知中小企业的挑战与机遇,特别推出了一系列中小企业扶持权益,旨在帮助企业以更低的成本、更高的效率拥抱云计算,开启智能时代创业的新范式。 一、企业上云权益…

Kamacoder第八题摆平积木的C语言解法

8. 摆平积木 时间限制:1.000S 空间限制:32MB 题目描述 小明很喜欢玩积木。一天,他把许多积木块组成了好多高度不同的堆,每一堆都是一个摞一个的形式。然而此时,他又想把这些积木堆变成高度相同的。但是他很懒&…

前端架构: 脚手架命令行交互核心实现之inquirer和readline的应用教程

命令行交互核心实现 核心目标:实现命令行行交互,如List命令行的交互呢比命令行的渲难度要更大,因为它涉及的技术点会会更多它涉及以下技术点 键盘输入的一个监听 (这里通过 readline来实现)计算命令行窗口的尺寸清屏光标的移动输出流的静默 …