抖音正在毁掉我们的流行音乐
当你看到标题是不是觉得这是一篇引战的文章?只需要0秒就可以鉴定博主的成分?别急,恭喜你点击了进来,接下来我会从科学的角度分析为什么抖音正在毁掉我们当下的流行音乐。
先问自己一个问题:你是否觉得现在的音乐和抖音视频的声音越来越大?在回答问题之前,我们先要了解数字音频的几个概念。
首先我们来看一个数字音频文件的基本参数:编码格式、采样率、位深度。
我们先要知道的是所谓的无损音乐,是指的文件格式的编码和压缩方式是无损的,数字音频本身是一种将模拟信号数字化的方法,也就是PCM编码,基本上所有的数字音频文件都是基于PCM编码。而所谓的FLAC、ALAC、APE等格式的无损音乐,本身就是一种无损压缩算法,通过其对应的编码器,可以将PCM原始数字音频无损压缩成体积更小的格式,并且根据不同格式的标准,还可以在文件内嵌入标题、专辑、封面、艺术家、歌词等信息,最后通过解码器将编码压缩后的文件还原成原始PCM并读取文件信息,然后在屏幕上显示歌曲的标题和封面等信息。通俗易懂的来说,所谓的FLAC、ALAC、APE等格式更像是一个压缩包,将PCM和一些文字图片一同打包进一个容器内并进行无损压缩,通过解码器进行解压出来的PCM和原始的PCM文件的MD5值是一样的。

其次是有损压缩,众所周知,无损音乐的文件体积很庞大,使用移动网络播放无损流媒体音乐时会浪费很多流量,那么就有了有损压缩算法和格式。我们要知道的是,在现实世界中是有很多频段的声波通过空气进行传播,其中能被人耳听到的频段在20-20kHz,然后低于20Hz的声波称之为次声波,而高于20kHz的声波称之为超声波,所以音乐文件的频响只局限于20-20kHz频段之间。然后人耳对高频敏感,对低频不敏感,且人类随着年龄增长会逐渐有听力损失,从而丧失部分高频的听觉。所以像MP3、WMA、AAC等有损压缩编码格式的文件,会通过一系列复杂的算法阉割掉不容易被人耳察觉的频率,其中就不乏包括一刀切砍掉高频。综上所述,也就是说MP3、WMA、AAC等有损压缩编码格式的文件在解码器进行解码后的PCM和原始PCM的MD5值是不一样的,且损失掉的部分无法恢复,所以在HiFi级别的回放设备上没有人会使用有损压缩格式的数字音乐文件进行播放。
初步对编码格式有所了解后接下来要了解采样率,我们平时在流媒体平台是不是经常可以在音质选择的时候看到16bit/44.1kHz、24bit/48kHz、24bit/192kHz等音质选项?并且数字越大,所消耗的流量就越多。其中,所谓的44.1kHz、48kHz、192kHz就代表着采样率。采样率代表的是每秒的次数,比如44.1kHz就代表这个音频文件每秒在系统内采样44100次,然而这又代表着什么?我们在现实世界中看到的光线强弱、声音高低等信号其实都是线性的模拟信号,通过图表绘制出来之后将会是一条平滑的曲线。但是在计算机的世界中全部都是数字信号,只有0和1,通过图表绘制出来只有高低不平的直线。

在刚刚我们了解到PCM是一种将模拟信号数字化的方法,也就是将模拟信号转换成数字信号,通过高低不平的直线尽量模拟出曲线,采样率就是数字音频上一秒到下一秒之间的每秒采样次数,可以理解为标记了多少点位在平面坐标上,坐标上面的点位越多,连接成的线段就越平滑。也就是说在数字信号转换成模拟信号的过程中可以使曲线尽可能的平滑,采样率越高的数字音频文件解析度就越高,最终文件容量也会变大。
最后再来了解一下最容易被忽视的位深度,因为位深度代表着动态范围,而数字音频的动态范围不太容易被注视到。经常玩摄影的朋友可能会对数字文件的位深度比较了解,比如相机拍摄16bit位深度的RAW图片可以拥有更高的动态范围,也就是在计算机中可以更随意的升高或降低图片亮度,可以增加暗部亮度让图片暗部的细节呈现出来。当然,在数字音频文件中,也有位深度和动态范围这个概念,数字音频的动态范围一般是指的音量大小范围。在现实世界中音量大小被称之为声压级,通常用dB也就是分贝来表示。再次回到数字信号,如果只用数字信号0和1来代表某种声压级,那么就是1bit的位深度,此时动态范围只能同时拥有两种音量大小的变化,比如70dB-71dB,这样对于一首正常的音乐来说显然是不够用的,所以就有了16bit/24bit的位深度出现。如何计算位深度的动态范围,很简单,就是2的16次方和2的24次方,也就是65536和16777216种不同的声压级变化,同时套用数学公式可以量化为96dB和144dB的声压级的动态范围。
了解完位深度之后,我们就可以得知,96dB范围的音量变化足以适用一般的流行音乐,如果要聆听音量变化较大的严肃音乐,例如音乐厅的交响乐录音,因为交响乐有独奏时的低音量部分,也有各种乐器合奏时激昂的高音量部分,声音起伏非常大,所以应该选择拥有144dB范围的高位深度音乐文件来保证低音量和高音量下的声音细节。
了解完位深度和动态范围的关系之后,我们再来深入研究一下音乐的音量。根据世界卫生组织的报告显示:如果以80分贝的平均音量收听,每周可以安全收听40小时。但如果选择以90分贝音量收听,那么每周仅能安全收听四个小时。

既然人耳无法在高声压级下不受听力损伤的影响,那么一首正常的音乐在混音制作阶段就需要尽可能使用到数字音频的动态范围,在需要高音量的时候提高电平,在不需要高音量的时候降低电平,在以前很长一段时间内,我们所聆听到的音乐都是这样。直到移动互联网浪潮袭来,抖音携带着快餐化时代改变了一切。
响度大战这个词其实在几年前随着Spotify等流媒体改变音乐市场时就已经有了,最早的音乐市场一般都是买断制,把喜欢的CD买回家聆听,但是流媒体的到来彻底改变了音乐市场的商业模式,从买断制变成了分成制。通过流媒体平台订阅用户的播放量产生收益,然后给艺术家进行分成。这个时候开始,点击率为王的时代开始逐渐替代销量为王的黄金时段。那么如何在互联网时代博取浏览呢?这个时候有人便耍起了小聪明,在混音的时候尽量缩小动态范围,从而提高音乐的响度,使自己的音乐比其他音乐听起来更响亮,更抓耳,以此来获取更高的点击率和播放量。
此时就有了LUFS响度标准,和声压级不同的是,LUFS并不是单纯测试在某个时间某个频段的音量的声压等级,而是会衡量人耳对不同频段的敏感度,综合整个音频文件来进行一个水平的量化感知,可以确保不同的音频文件都能有同一个标准的响度水平。随后各个流媒体平台都推出了自己的LUFS限制标准来应对响度大战,比如Apple Music限制在-16 LUFS,而Spotify更宽松一些,限制在-14 LUFS。一般来说,流行音乐适合-14 LUFS,而广播领域更是适合-23 LUFS。抖音虽然没有明确自己的平台标准,但是根据互联网上的民间测试,抖音的响度是没有限制的,从-16 LUFS一直到-7 LUFS的都有,简直是群魔乱舞鱼龙混杂,再加上抖音的普及性和传播速度,导致很多火到大红大紫的流行音乐开始针对性的对抖音用户进行制作。
常见的回放设备一般由设备内置扬声器、外置扬声器和耳机组成,众所周知声音通过空气的震动传播,但是随着距离的增加,声音的能量会随之减少。一般耳机直接贴近耳朵,所以不需要消耗的能量就可以让耳朵听见很高的声压级,即便是一块小小的电池去驱动,也可以让耳机的频响做到20-20kHz的全频段频响。上面讲到过,人耳对低频最不敏感,所以如果想让外置的扬声器发出和中高频同样声压级的低频和超低频是一件非常困难的事情,往往使用外置扬声器的用户的听音距离一般都会在2-3米左右,如果想要在这个距离达到耳机的声压级标准,光是中高频段的扬声器单元就要消耗掉数百瓦的功耗,而低频和重低频需要额外的低音炮来驱动,更是要消耗好几百瓦的功耗,但是这样做的好处就是外置扬声器的声音素质很高,如果频响曲线较为平直的HiFi级扬声器,可以轻松获得很高的最大不失真音量和动态范围。以前的流行音乐几乎都是围绕这些用户制作的,高动态范围以及全频段声音特性都能利用上,不会出现整首歌从头震到尾的情况出现。问题在于现在针对抖音用户最常使用的手机内置扬声器制作的音乐,取向完全变了。因为设备内置的扬声器也会距离用户0.5-1米的距离,但是又不会有太大尺寸的扬声器单元,也不会有太高的频响范围,一般120-20kHz就已经算非常不错的手机扬声器了,并且这种扬声器的最大不失真声压级非常低,如果播放以前的高动态音乐,声音开小了听不到低声压级的细节,声音开大了在激烈的时候声音又会震天响,甚至会出现失真的状态,所以现在的很多流行音乐会出现疯狂压缩动态,提高响度来吸引抖音用户,先不说音乐性到底如何,毕竟每个人的审美不一样,单从听音体验来说,简直是灾难。
众所周知,抖音这种流媒体平台不会使用无损的音轨,往往都是128kbps的有损压缩音轨,再加上极致压缩的动态范围和疯狂的响度,即便是手机音量开不到一半,还是可以在地铁和公交车上发出刺耳的声音,为什么不是震耳欲聋,因为手机扬声器没有低频,只会让人觉得刺耳。更有甚者在公共场合音量调到最大,使用手机打开抖音,迫使抖音上流行的有损且高响度的音乐以高度失真的情况在手机扬声器上播放出来,从而达到强奸周围其他人耳朵的目的。
可悲的是因为中国的音乐市场绝大部分都是这样的消费者,这就不得不导致劣币驱逐良币的情况出现,想象一下,你正在使用你的HiFi级扬声器通过国内流媒体平台欣赏一首制作精良的高动态音乐,突然接下来给你推荐送了一整个歌单全是全损音质、响度爆炸、所有声音糊作一团毫无细节可言且从头到尾只有一段抄袭来的beat所谓的“抖音神曲”,这时你的HiFi级扬声器发出了超过95dB的刺耳尖叫,迫使你和你的邻居不得不就这样被这样的噪音灌入耳朵,你在手忙脚乱的情况下不得不找到遥控器并关掉这该死的流行音乐。
还好外置扬声器的听音距离比较远,那如果是直接入耳的耳机用户呢?先不说歌曲好不好听,音乐性如何,长期暴露在这样的流行音乐下很快就会造成听力损伤。不过AirPods用户不要太纠结这个问题,苹果会实时检测AirPods所发出的声压级,长期超过85dB会自动降低音量。
综上所述,我认为抖音正在毁掉当下的流行音乐市场,如果你是一名老艺术家,你拿过金曲奖,进过格莱美,当年的CD销量称霸某个地区,然而你看到了自己精心制作的新专辑播放量还不如什么”野狼Disco“、”黑桃A”等众多”抖音神曲“的一个零头,你会作何感想?如果你的孩子在幼儿园课间被老师播放着这类歌曲并跳着抽象的舞蹈你认为这个市场的审美还会有救吗?当市场上都充斥着这种审美和认知的消费者和观众时,那么产品自然也会做出回应,如果市场上充斥着这样的作品,那么HiFi器材存在的意义又是什么?所以当下年轻人几乎很少有去了解和购买这样类型的产品去欣赏音乐,即使购买HiFi器材的用户,9成的人也只听老歌或严肃音乐,因为这种粗制滥造的流行音乐作品使HiFi器材变得毫无意义,所以我认为抖音正在毁掉我们的流行音乐。
- 感谢你赐予我前进的力量

