两个新的研究论文已经在过去的学期期间cnmat产生。

 

  • 学习,概率和逻辑:对基于内容的音乐信息检索的统一方法由小时。 C。 crayencour和c。即地窖,数字人文科学的前沿(杂志),2019年4月
    • 摘要:在过去的15年之内,(MIR)音乐信息检索领域已经算法组织和分析不断增加的大变化量的音乐和提供数字音乐相关数据的发展取得了巨大的进步。然而,基于内容的方法来启用或改善多媒体检索的发展仍然面临的主要挑战。从这个角度本文中,我们仔细审视从音频录音的基于内容的算法为例自动和弦估计的问题,在当前的方法指出几个瓶颈:表现力和灵活性得到了鲁棒性,反之亦然为代价;可用的信息多源少剥削;建模多面并强烈相关的音乐信息被限制与当前的体系结构;模型通常限制为不考虑音乐信号的分级时间结构短期分析。处理音乐数据需要在代表多层次来解决这两个不确定性和复杂的关系结构的能力。传统的方法一般都分开处理这两个方面,概率和学习是通常的方式来表示知识的不确定性,而逻辑表示为代表的知识和复杂的关系信息的常用方法。我们主张,当前方法的识别障碍可以通过在统计关系人工智能(starai)的,它统一了概率,逻辑和(深)学习领域的最新发展来克服。我们表明,在MIR用现有的方法找到强大的扩展功能和unifications在starai,和我们解释为什么我们认为现在是时候考虑这个有前途的研究领域提供了新的视角。

 

  • 估计未观测到的音频特征为targed基于配器中,J。吉利克,C。即地窖和d。 bamman,ISMIR 2019
    • 抽象:目标为基础的辅助业务流程可以被认为是作为搜索的声音,以匹配目标声音的最佳组合的过程中,给定样本的一个数据库,一个相似性度量,并且一组约束。这个问题的典型解决方案是所提议的管弦乐得分,其中候选人由相似性在是 - 吐温一些特征空间排目标声音和对应于分数的音符数据库音频样本的混合物;在管弦乐的设置,合法分数可能包含几十个乐器同时发出。

      通常,基于目标的辅助编排系统由一个组合优化算法和共同优化,以找到有效的解决办法约束求解的。在优化中的关键步骤包括生成大量从数据库的声音的组合,然后将与所述目标声音的声音的各混合物的特征。因为合成一个新的音频文件,然后计算功能,对于声音的每个组合,在实践中,现有的系统,而不是使用估计组成组合的因迪维杜阿尔源文件的预先计算的特点每个新混合物的功能所需的高计算成本。目前,国家的最先进的系统使用一个简单的线性组合,使这些预测,即使在使用功能本身并不是线性的。

    • 在这项工作中,我们探讨的神经模型估计从部件的声音的声音特征的混合特征,发现标准功能可以精确比的方法目前在协助编排系统中使用显著更好的估计。我们提出定量比较和讨论了基于目标的协调问题,我们的研究结果的意义。