数字音频的采样和量化

一.PCM(Pulse-Code Modulation 脉冲编码调制)

PCM是一个无损无压缩的(相较于有损压缩,如果相对于模拟信号是有损的)数字化编码方式(PCM不单单应用于音频领域,本文只介绍在音频领域中的应用)。

先从PCM讲起是因为PCM是最常用,并且最为简单理解的模拟信号转换成为数字信号的方法。

PCM编码方式是将模拟信号经过采样→量化→编码来实现A/D(数模转换)

1.采样

采样是从连续时间域上的模拟信号转换到离散时间域上的离散信号的过程

简单来说,声波在时间上本身是连续的,时间可以被分割成无数的时间点,采样就是在这无限的时间点上,以固定周期对时间进行划分。

采样的过程,首先将连续的时间域中以特定时间为单位(通常为1s)分割成数个时间区域(周期性采样)。在对单个时间域中的信号进行特定次数的采样(取决于采样率)。

2.采样率

采样率定义了每秒从连续信号中提取并组成离散信号的采样个数,单位为Hz(赫兹)。

那么,采样率究竟需要多快才不会造成明显的音频失真呢?

结论:

采样率必须大于被采样信号带宽的两倍,否则就会发生混叠现象而发生失真

人耳能够感知的声音频率范围在20Hz~20KHz之间,按照上述采样定理,如果需要存储人耳能够感知的声音,就必须以20KHz*2=40KHz以上的频率进行采样。

(所以音乐CD的采样标准为44.1KHz)

3.量化(位深)

采样是以时间为单位,标识出以每秒多少次划分时间点进行抽样,采样过后依然属于模拟信号范畴,其每个采样点的样本所对应的值仍然为无数个值。 那么如果要以数字化存储这些值,我们就必须对这些值进行量化处理。

因为量化规则遵循四舍五入原则,不正好处于在分级中的样值,均四舍五入后进行存储。那么也就不可避免的会造成数据损失,从而失真。

那么我们如果将量化位深提升到4bit,如上图所示,可以发现,当位深越大,越能反映出数据幅度的变化。

这种以四舍五入方式进行分级取整,将取值范围内的样值由离散信号描述的无限多的值变为有限个值,并用数字码进行存储的过程称为量化。

4.编码

编码本质上就是使用某种特定规范,使得采样量化后的数据按照规定方式进行存储、传输。

PCM编码本身是无损无压缩的,那么就说明其数据体积会很大。

PCM数据体积计算方式为:采样率(Hz) x 位深(bit) x 声道数 x 时长(s)

一段常见的4分钟立体声(双声道)的音乐,我们以CD标准(44.1KHz采样率 16bit位深)在进行PCM编码后,其体积为

44100Hz x 16bit x 2 x 240 = 338,688,000 bit(比特)= 40.37MB

在计算机存储中最小存储单位为位,而一位能存储的数据即为1bit(存储0或1),其中8bit为一个Byte(字节),1024Byte=1KB,1024KB=1MB

总结:采样是在声波的时间上周期抽取数个时间点,量化将对应时间点的声波幅度进行规范存储。采样率越高,位深越高,存储的声波越接近于原始声波。

5.PCM的音频领域的应用

PCM在音频领域中的应用极其广泛,无论是语音通话、音乐播放、视频多媒体,其中都离不开PCM的应用。

电脑、手机、随身听等设备播放音乐时,其实就是将PCM数据,转换为模拟信号,在通过扬声器、耳机等设备还原出声波。

应用PCM进行声波存储的流程如下:

6.采样数据与DA转换输出声音

一般的数据采样用的是AD会有一个最大采样值,最小值当然就是0了。

如果声音芯片内的DA是16位,那么最小值为0,最大值为65535即0xffff。

但是由于振内振是上下振的,故中点为32767,故区间范围为-32768到32767之间。因此为了标识我们的数值,需要对采集的数字信号进行归一化处理(转换为在-32768到32767之间).

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3030031.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

GAMMA Lab——知识图谱和LLM大模型

图机器学习的发展与分类 图基础模型 LLM基础模型 GNN LLM 前沿工作

【智能算法】正切搜索算法(TSA)原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献5.代码获取 1.背景 2022年,A Layeb受到正切函数启发,提出了正切搜索算法(Tangent Search Algorithm, TSA)。 2.算法原理 2.1算法思想 TSAT基于正切函数的数学…

(Mac)RocketMQ的本地安装测试(详细图示)

目录 部署服务 namesrv / broker下载解压缩运行 namesrvnohup ./bin/mqnamesrv & 启动命令详解运行 broker 测试收发消息运行自带的生产者测试类运行自带的消费者测试类 部署 Dashboard 可视化下载打包运行访问 部署服务 namesrv / broker 下载解压缩 官网下载 https://r…

uniapp、web网页跨站数据交互及通讯

来来来,说说你的创作灵感!这就跟吃饭睡觉一样,饿了就找吃的,渴了就倒水张口灌。 最近一个多月实在是忙的没再更新日志,好多粉丝私信说之前的创作于他们而言非常有用!受益菲浅,这里非常感谢粉丝…

无人直播新模式——视频挂机自动播,一小时收益上千元,思路分享!

无人直播新模式——视频挂机自动播,一小时收益上千元,思路分享! 无人直播新模式——视频挂机自动直播是一种创新的直播方式,能够实现自动化的收益。下面将分享一些思路、玩法和流程,帮助您了解这个模式并进行实施。 1、…

内容安全(DPI和DFI解析)

内容安全前言: 防火墙的本质其实就是包过滤,我们通常所说的安全设备(如:IPS、IDS、AV、WAF)的检测重心是应用层。下一代防火墙基于传统防火墙的拓展能力,就是可以将以上的安全设备模块集成在一起&#xff0…

uniapp的app端软件更新弹框

1:使用html PLUS实现:地址HTML5 API Reference (html5plus.org),效果图 2:在app.vue的onLaunch生命周期中,代码如下: onLaunch: function() {let a 0let view new plus.nativeObj.View(maskView, {backg…

IO流-其他流:数据流,序列化流

import java.io.DataOutputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream;public class DataOutputStream1 {public static void main(String[] args) {//创建一个数据输出流包装一个低级的字节输出流try (DataOutputStream dosnew DataOutp…

Elasticsearch:RBAC 和 RAG - 最好的朋友

作者:来自 Elastic Jeff Vestal 检索增强生成 (RAG) 通过提供额外的上下文或信息来增强大型语言模型 (LLM) 的知识,从而提高响应质量。 尽管 LLMs 拥有令人印象深刻的能力,但也有其局限性,例如无法在培训后保留新信息以及对不熟悉…

软考网络工程师 第六章 第三部分 第三节 流量控制和拥塞控制

TCP流量控制 流量控制:为了防止发送方防止发送速度过快,导致接受方处理不过来,造成丢包重传,浪费网络资源 TCP流量控制机制:可变大小的滑动窗口 TCP滑动窗口机制 TCP拥塞控制 例题: TCP采用拥塞窗口&am…

Ubuntu意外断电vmdk损坏--打不开磁盘“***.vmdk”或它所依赖的某个快照磁盘。

背景:电脑资源管理器崩溃卡死,强行断电重启,结果虚拟机打不开了,提示打不开磁盘“***.vmdk”或它所依赖的某个快照磁盘。 删除lck文件:失败vmware-vdiskmanager修复 :提示无法修复最终用 VMFS Recovery挂载…

ipv4手动设置网络的相关知识

基本知识 1.IP地址 IP地址 网络地址 主机地址(又称:主机号和网络号组成) 192.168.100.168(IP地址) 192.168.1.0 (网络地址) 0.0.0.168(主机地址) 2.家庭网络基础组成 3.子网掩码 作用:告诉计算机哪…

开源相机管理库Aravis例程学习(七)——chunk-parser

开源相机管理库Aravis例程学习(七)——chunk-parser 简介例程代码函数说明arv_camera_create_chunk_parserarv_camera_set_chunksarv_chunk_parser_get_integer_value 简介 本文针对官方例程中的:05-chunk-parser做简单的讲解。并介绍其中调…

【JavaScript】内置对象 - 数组对象 ① ( 数组简介 | 数组创建 | 数组类型检测 )

文章目录 一、数组对象1、数组简介2、数组创建3、数组检测 - Array.isArray() 方法4、数组检测 - instanceof 运算符 Array 数组对象参考文档 : https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/Array 一、数组对象 1、数组简介 在 JavaScr…

3d gaussian-splatting源码运行及结果展示

笔者是在windows下配置的环境 源码地址及官方教程 github gaussian-splatting 官网给出了详细的配置教程和视频解说 记录一下个人的部署过程 环境需求 硬件需求 具有计算能力 7.0 的带有CUDA的GPU 24G显存 软件需求 python版本我没注意到明确说明,3.7以上应…

c++高级篇(一) —— 初识Linux下的进程控制

linux的信号 信号的概念 在Linux中,信号是一种用于进程间通信和处理异步事件的机制,用于进程之间相互传递消息和通知进程发生了事件,但是,它不能给进程传递任何数据。 信号产生的原因有很多种,在shell中&#xff0c…

三、配置带HybridCLR的ARCore开发环境

预告 本专栏将介绍如何使用这个支持热更的AR开发插件,快速地开发AR应用。 专栏: Unity开发AR系列 插件简介 通过热更技术实现动态地加载AR场景,简化了AR开发流程,让用户可更多地关注Unity场景内容的制作。 “EnvInstaller…”支…

代码覆盖率:度量软件质量的关键指标

一、引言 代码覆盖率是衡量软件测试质量的一个重要指标,它描述了测试用例覆盖了多少代码。高的代码覆盖率可以帮助我们增加对软件质量的信心,并发现潜在的问题。在本文中,我们将深入探讨代码覆盖率,并通过实例来演示如何计算和提…

多目标跟踪入门介绍

多目标跟踪算法 我们也可以称之为 Multi-Target-Tracking (MTT)。 那么多目标跟踪是什么? 不难看出,跟踪算法同时会为每个目标分配一个特定的 id 。 由此得出了目标跟踪与目标检测的区别(似乎都是用方框来框出目标捏…

番外篇 | 利用PyQt5+YOLOv5来搭建目标检测系统(附可视化界面+功能介绍+源代码)

前言:Hello大家好,我是小哥谈。PyQt5是一个Python绑定的Qt库,是用于创建图形用户界面(GUI)和其他应用程序组件的工具包。PyQt5提供了许多GUI元素,如按钮、文本框、标签等,也提供了许多Qt的功能,如网络、数据库、XML等。通过PyQt5可以在Python中使用Qt的丰富功能和强大的工…