新闻
您现在的位置:首页 > 新闻 > 亚马逊发布Alexa数据集以帮助解决“鸡尾酒会问题”
  • 从0到1,这些新锐品牌在抖音做对了什么?

    从0到1,这些新锐品牌在抖音做对了什么?

    发布时间:2021/06/22

    如今的食品饮料行业,新机会往往由新的玩家率先挖掘,他们中的佼佼者将成为行业中极具竞争力的年轻选手,我们称之为新锐品牌。 在漫天的战报中,我们很容易就能找到一个数据猛增的新锐品牌,但挖掘新锐品牌背后的...

  • Gislaved熊牌轮胎正式进入中国市场

    Gislaved熊牌轮胎正式进入中国市场

    发布时间:2021/04/24

    德国马牌轮胎亚太区产品总监Tolga MUTLU介绍Gislaved熊牌新品轮胎 大陆马牌轮胎(中国)有限公司宣布,拥有百年辉煌历史的轮胎品牌 — Gislaved熊牌轮胎正式进入中国市场,进一步夯实德国马牌在华“多品牌”战...

  • 麦当劳中国推出金菠萝雪芭

    麦当劳中国推出金菠萝雪芭

    发布时间:2021/04/23

    麦当劳中国推出首个雪芭类产品 麦当劳中国与国际知名水果品牌都乐首次合作,推出全新夏日新品 — 金菠萝雪芭,为夏日冰品市场增添了一个创新的美味轻食选择。 金菠萝雪芭是麦当劳中国的首个雪芭类产品,使用...

亚马逊发布Alexa数据集以帮助解决“鸡尾酒会问题”

发布时间:2019/10/07 新闻 浏览次数:1280

 
鸡尾酒会问题(也称为晚餐会问题)是自动化系统在嘈杂的多源环境中执行隔离音频任务时遇到的困难。它已经得到了广泛的研究,许多学术团队,初创公司和企业巨头声称已经通过复杂的机器学习算法解决了该问题。但是亚马逊认为仍有改进的空间,为此,它发布了一个数据集—晚餐聚会语料库或DiPCo,旨在刺激有关该主题的研究。
根据Alexa语音小组的高级技术项目经理Zaid Ahmed的说法,该语料库是在亚马逊志愿者的帮助下创建的,该志愿者在实验室中模拟了宴会的情况。经过多次会议(每个会议有四名参与者),志愿者们从自助餐桌上为自己提供食物,并通过管道传送音乐进入房间。每个设备都配备了可捕获扬声器特定信号的头戴式麦克风,并且策略性地在房间周围放置了五个带有七个麦克风的设备,以将信号直接馈送到笔记本电脑。
DiPCo包含由每个设备中的七个设备麦克风中的每个麦克风记录的原始音频和头戴式耳机信号,后者提供了可用于衡量语音分离信号成功与否的参考。此外,该数据集还包括每个志愿者话语的详细转录本。
“有和没有背景音乐的情况下,将数据分为多个部分,使研究人员能够以任何必要的方式组合干净而嘈杂的训练数据,以从其机器学习系统中获得最佳性能,”艾哈迈德解释说。
DiPCo的发布紧随FEVER之后,FEVER是由亚马逊和谢菲尔德大学的研究人员共同编写的一个开源语料库,旨在促进事实验证系统的发展。另外,亚马逊于9月发布了主题聊天数据集,该主题集基于文本,包含235,000多种语音,旨在帮助支持对话系统领域的高质量,可重复的研究。
有点相关的是,DiPCo的发布也是在亚马逊提高了Alexa解释多种语言并从语音片段中释放情感的能力之后一周。现在,智能助手可以自动检测美国的西班牙语和英语,加拿大的法语和英语以及印度的印地语和英语。从明年年初开始进入音乐领域,当Alexa检测到由于错误而导致客户的声音感到沮丧时,他将表示歉意。

姓 名:
邮箱
留 言: