你好,我是建元。

这是专栏的最后一讲,恭喜你成功搞定了音频技术基础。也十分感谢各位同学的一路陪伴,希望这场学习之旅能让你不虚此行。最后一节课我们轻松些,我呢也再唠叨几句,和你分享一些我的学习和工作经验。今天没有那么多的公式和理论,泡杯茶边喝边听可能滋味更佳。

音频可能是为数不多的既可以当做工作,也可以当做兴趣爱好的一个学习方向。在如今这个可能越来越“卷”,越来越需要努力的社会,学点好玩的,做点自己感兴趣的事就显得弥足珍贵。

下面我放了一个时频图,你猜猜这是什么声音?看时域的波形似乎很有节奏,大概基频会是60Hz左右,好像人类发不出这样的音来。再看频域的能量分布十分均匀,又有点像清音。这其实是猫在开心的时候会发出的一种特有的“咕噜”声。这是我之前在录课程音频的时候,我们家的猫主子一直会过来“骚扰”我,这就是它留下的音频。然后根据频谱图,很容易看出这不是正常的人声,于是在后期剪辑时,就可以很快地挑出来并剪掉了。

图片

你看,工作和生活其实可以有很多交集。其实现在很多领域的知识也都是互通的。要想把一件事做到极致可能需要很多领域知识的灵活运用。而这就需要我们能够掌握快速学习的能力。所谓“天下武功,无坚不破,唯快不破”,掌握了正确的学习方法就能事半功倍。

我记得,我刚接触音频的时候,开组会时我都不知道大家在讲的NetEQ、AEC是什么意思。后来我找了一些前辈先疏通了整个音频链路,然后又请教了各个领域的专家,了解每个模块内部的组成和算法原理。这种先面后点的方法是快速学习的关键。这是因为整体了解一个事物之后,你就可以有针对性地去学习你需要知道的知识。吾生也有涯,而知也无涯。人无论天资多高也不可能穷尽所有的知识,所以有选择的深入就显得尤为重要

再有“工欲善其事必先利其器”,不同的学习途经可能会让你的学习效率千差万别。如何制定学习计划,选择学习工具,其实是可以通过你想要达到的结果去反推的。比如你想做世界上最好的降噪系统,你就需要了解目前最好的降噪算法有哪些,它们各有什么优缺点。那么最好就有比赛或者回顾性的论文可以帮助我们快速获取结果,一般来说比赛的结果有比较好的时效性,而回顾性质的论文可以让你了解整个算法以及系统发展的脉络,从而更好地判断算法、系统的优缺点。

知道了什么是最好以及优缺点之后,就需要我们快速实现一遍其中你认为比较好的方法。这里也要感谢一下 GitHub、Paper with Code 这些伟大的工具以及很多无私奉献的社区开源者,基本上大多数的算法实现目前都能找到开源的快速实现方法。

最后,你需要对这些知识、方法形成自己的理解。这点很重要,每个人的学习路径不同、经验不同,给出的结论也不尽相同。只有自己从原理推敲后的理解才最为可靠。就拿我来说吧,有很多做音频的工程师觉得16kHz的采样率对于人声的处理就已经足够了,比如WebRTC中默认就是16kHz的采样率做编解码的。但后来我自己录制了一下人声,绘制一下频谱,却发现正常人说话在8kHz以上的高频还是有很多能量的,要想有一个音色饱满的人声,采样率16kHz其实是不够的。所以有的时候,需要自己做出判断,别人的建议终究只是参考。

可能有很多人会告诉你:要努力、要坚持、要奋斗。我相信你能抽空完成整个音频课程的学习,本身就已经说明你是一个努力且坚持的人了。可努力的人千千万,成功的人除了努力外还需要多思考当前的行业需要什么,未来发展的趋势可能会遇到什么样的问题和挑战。所谓人无远虑必有近忧,敏锐的感知和思考是你选择职业、研究方向的必由之径,而选择比努力更重要。

祝贺你,坚持完成了本专栏的学习。这是终点,也可能只是你学习、工作生涯的一个起点。愿你踏出坚实的每一步,在音频的道路上走得更远。

最后文末有一份结课问卷,希望你可以花两分钟的时间填写一下。我会认真倾听你对这个专栏的意见或建议,期待你的反馈!