关于信号处理方法的两个小问题

xiangyuecn / Recorder

html5 js 录音 mp3 wav ogg webm amr g711a g711u 格式，支持pc和Android、iOS部分浏览器、Hybrid App（提供Android iOS App源码）、微信，提供ASR语音识别转文字 H5版语音通话聊天示例 DTMF编码解码

MIT License

4.8k stars 1.03k forks source link

1. Recorder.SampleData() (1) 命名建议：这个方法的功能相当于是重采样，而且本质上只会降低采样率，建议改名为ResampleData/DownsampleData更合适。 (2) 现在的的降低采样率实现方式只是按比例舍弃采样（decimation），但是从信号处理的角度，单纯这样做的话会有aliasing effect（混叠），引起严重失真（注意，此现象并非由于采样点减少本身导致的音质变差）。标准的降低采样率方式应当在处理之前加入低通滤波过程。如采样比非整数，则应先提高采样率再降低采样率。参见https://zh.wikipedia.org/zh-my/%E9%99%8D%E9%87%87%E6%A0%B7

2. pcmAbsSum 目前音量显示用信号绝对值之和的平均值，此方法据我所知并非标准做法，而且不反映能量/功率（power）。常规处理方式是用信号平方和的平均值（或者最后开个平方得到方均根RMS，与最大值的比值就是平均振幅百分比）来表示能量（与感知的音量直接相关，与标准值作比再取对数就可以得到分贝值）。如果此操作不是特别占用计算能力，建议考虑适当修改。

1.1 命名是一件掉头发的事，保护我方为数不多的头发😂 不单单这个名字很奇怪，还有几个我自己都看的别扭的名字，在相关性不是偏的离谱的前提下，不会增加新命名

1.2 当前的降低采样率的算法已经是采用的比较优秀的一个了，相对于录音音质，此算法并不会对音质产生多少影响（其实低采样率导致的音质变差在专业软件里面也是一样的变的很差）；算法中的采样比例是浮点数；如果要在重采样过程中先一步过滤掉低频率下不包含的高频部分（为避免高频信号降频到低频从而混合到了低频率中就是维基上说的混叠），得引入fft时域转成频域，去掉多余的高频信号，再逆fft变回时域，这个计算量将变得很大也太难了，对于录音来讲，有点得不偿失

目前PowerLevel里面的算法（计算的是一个百分比，近似相当于音量），是先取的平均值，将这个平均值当做当前的采样信号数据，然后再进行和音量类似的计算。算法特意优化过了，对小的音量也能比较灵敏的检测到，大的音量适当进行了削弱

xiangyuecn / Recorder

关于信号处理方法的两个小问题 #161