首页 原创 深1度 24小时 洞见 突发 娱乐 传媒 IT 电脑 软件 手机 通信 科教 游戏 科技 网络 物联网 智汽车 云计算 大数据 医疗 电商 数码 金融 教育 交通 物流 消费 AI 区块链
当前位置: 首页 > AI > 正文

微软“用于合成音频的人工智能模型”新专栏曝光

2022-11-20 13:07:50 来源:it之家   

  原标题:微软新专利曝光:通过人工智能合成游戏配乐

  11 月 20 日消息,微软近日在 WIPO 知识产权门户网站上提交了一项专利,专利题为“用于合成音频的人工智能模型”。

  专利说明微软正在发明一种智能音频合成技术,用于为各种媒体如电影、电视节目、游戏,甚至现场录音创造声音、音乐和其它音频元素。该专利提到了游戏中的动态时刻,表明它可以创造出配合玩家行动的乐谱。该专利的摘要指出,可以使用视觉、音频和文本特征及提示(统称为“数据集”)来设置参数,以指导众多的人工智能模型构建音频乐谱。

  IT之家了解到,人工智能在视频游戏中发挥着不可或缺的作用。从敌人的行为和战斗遭遇到程序性关卡的生成以及与 NPC 和环境的互动,人工智能在游戏开发的各个层面都是不可或缺的。在声音设计方面,自适应 / 动态配乐在许多视频游戏中都有体现,如现代《毁灭战士》游戏、《合金装备崛起》、《鬼泣 5》等。

  微软的新专利描述详细介绍了众多的人工智能引擎,这些引擎的任务是根据提供的数据集进行音频播放。他们可以分析人类的表情和情绪,收集位置数据,分析形势的基调等等。人工智能可以学习图片、视频、电影、现场活动,并产生一组音频文件,可以用适当的声音效果和音乐为视觉效果分层。这种高科技的人工智能可以为媒体创作开辟许多令人兴奋的道路,人们可以用一个巨大的、不断增长的音频乐谱库来制作电影、游戏等,例如为英雄的出场设计一首史诗般的管弦乐曲,为宠物的离去谱写一首忧郁的曲子,为枪声和爆炸开发音效,所有这些都可以委托给人工智能的算法。

  IT之家了解到,该技术将由云计算驱动。该系统何时能真正投入使用还有待观察,但音频设计的未来看起来很有希望,微软可能会在这方面掌舵一场革命。

标签:
广告、内容合作请点这里:寻求合作