搞定音频技术 - 深入浅出音频核心原理及应用
你将获得
- 系统掌握音频学习路径及原理
- 噪声回声等 4 类常见问题的解决方案
- 弱网络下的传输和编解码策略
- 洞悉音频技术发展新方向
作者简介:
冯建元,声网 Agora 音频算法专家、Illinois Institute of Technology 博士,曾为伊利诺伊大学芝加哥分校特聘研究员。硕博阶段研发了一系列包括毛细流体力学建模、智能电网系统、人工智能胰岛系统等多个专业的应用,并在 IEEE、AIChE、Journal of Process Control 等一线期刊上发表了 20 多篇论文。
2018 年回国,在工业智能化改造方向创业一年之后,加入声网(实时音视频 PaaS 服务的开创者和引领者,实时音视频分钟数月均用量超 500 亿分钟)。之后研发了一系列实时声音美化、实时空间音频渲染、实时变声、实时修音、实时语音变歌唱等算法,并先后带领团队完成并商用了 50 多种可实时使用的美声音效效果。
随后他又对实时音频链路进行了 AI 化改造,包括基于深度学习的降噪、音频编解码、音频丢包补偿、回声消除、音源分离、啸叫检测、音乐检测等算法的实现与落地商用,以及把这些算法和不同的业务场景相结合来提高实时音频质量。同时,他也是国内第一个基于深度学习的语音编解码器 Silver 的发明人。
课程简介:
在新冠疫情的催化下,线上互动已经成为人们工作和生活中的必要交流方式,这催生了很多音频技术的进一步完善。比如说,在这些场景中,延迟必须控制在毫秒级别内,实时互动技术成为决定整体体验的关键。
其中,音频承载的信息密度是巨大的,语言、音乐都需要音频作为载体进行传播。但往往一个音频采样点的错误,人耳就能明显地感知到。那么像噪声、回声、网络抖动等问题,就更需要专业的处理了。
而在未来,可预测的是,人工智能领域在音频技术上会有进一步的突破。Facebook 改名 Meta 进军元宇宙,音频播客 Clubhouse 等纯音频社交方式的流行,以及 TWS 耳机支持了空间音频渲染和主动降噪等等都是线索。
当大型线上互动、娱乐、会议、教育等行业万象都在朝着音视频实时互联互通的方向转变,市场对于专业音频技术专家、音频工程师的需求缺口必定随之增大。
同时,音频也是一个跨专业领域的有趣学科,它与计算机、信号处理、声学、音乐、语言学等都有交集,你过往的经历都可能派上用处。所以,无论你是否是专业的音频工程师,有没有强大的技术背景和积累,都不要紧。只要你有想法转行音频领域,甚至只要你有兴趣学习,这门课程都能给你创造新的机会。
基于此,我们邀请到了声网 Agora 音频算法专家冯建元老师联合开发课程。通过学习,你能知晓音频处理的全套链路和音频发展的脉络、方向,而关于音频技术学习中的重要原理及常见问题的解决方案,你也能一探究竟。这些知识不但可以让你用于职业工作,也可以加强你对生活中声音的感知,从而知道应该听什么、怎么听。甚至怎么去让声音发生变化,从而为你打开“百万调音师”的潘多拉宝盒。--[转载请注明:iquizhi.com(知识付费百度网盘下载)]--
课程大纲:
- 声音是如何保存成数字信号的?
- 如何量化分析语音信号?
- 如何分析与处理音乐信号?
- 如何评价音频质量的好与坏?
- 音频降噪如何对症下药?
- 如何将AI技术运用到降噪中?
- 如何通过算法自动快速地消除回声?
- 回声消除算法实践指南
- 音频编解码器是如何工作的?
- 如何选择一个适合你的编解码器?