微软“用于合成音频的人工智能模型”新专栏曝光

　　原标题：微软新专利曝光：通过人工智能合成游戏配乐

　　11 月 20 日消息，微软近日在 WIPO 知识产权门户网站上提交了一项专利，专利题为“用于合成音频的人工智能模型”。

　　专利说明微软正在发明一种智能音频合成技术，用于为各种媒体如电影、电视节目、游戏，甚至现场录音创造声音、音乐和其它音频元素。该专利提到了游戏中的动态时刻，表明它可以创造出配合玩家行动的乐谱。该专利的摘要指出，可以使用视觉、音频和文本特征及提示（统称为“数据集”）来设置参数，以指导众多的人工智能模型构建音频乐谱。

　　IT之家了解到，人工智能在视频游戏中发挥着不可或缺的作用。从敌人的行为和战斗遭遇到程序性关卡的生成以及与 NPC 和环境的互动，人工智能在游戏开发的各个层面都是不可或缺的。在声音设计方面，自适应 / 动态配乐在许多视频游戏中都有体现，如现代《毁灭战士》游戏、《合金装备崛起》、《鬼泣 5》等。

　　微软的新专利描述详细介绍了众多的人工智能引擎，这些引擎的任务是根据提供的数据集进行音频播放。他们可以分析人类的表情和情绪，收集位置数据，分析形势的基调等等。人工智能可以学习图片、视频、电影、现场活动，并产生一组音频文件，可以用适当的声音效果和音乐为视觉效果分层。这种高科技的人工智能可以为媒体创作开辟许多令人兴奋的道路，人们可以用一个巨大的、不断增长的音频乐谱库来制作电影、游戏等，例如为英雄的出场设计一首史诗般的管弦乐曲，为宠物的离去谱写一首忧郁的曲子，为枪声和爆炸开发音效，所有这些都可以委托给人工智能的算法。

　　IT之家了解到，该技术将由云计算驱动。该系统何时能真正投入使用还有待观察，但音频设计的未来看起来很有希望，微软可能会在这方面掌舵一场革命。