导语
随着复杂系统领域研究方法的成熟,包括信息熵、混沌边缘等概念被应用于对音乐的分析和生成中。本文先介绍从复杂系统的视角分析音乐,之后是基于复杂网络的音乐类型分类,最后展示基于复杂适应系统的音乐生成工具。从这一系列研究,可以看到艺术之美的背后,有着坚实的科学理论做支撑。而跨学科的认知,可以促成对音乐进行更有深度的赏析。
研究领域:音乐复杂性,信息熵,混沌边缘,复杂网络,复杂适应系统
郭瑞东 | 作者
梁金 | 审校
邓一雪 | 编辑
从三和弦中所构造出来的,不是第四个音符,而是整个星辰。
—— 布朗宁
何为音乐?从还原论的定义来看,音乐不过是一段时间上连续的声音或寂静组成的序列。然而杰出的音乐作品,却有着1 1>2的效果,将交响乐拆分成不同乐器的独奏,就失去其壮丽;将其拆分成一个个乐章,听众就无法从中感受到完整的故事。而这背后的科学道理,就是涌现现象,即整体呈现了部分之和所不具有的性质。
传统音乐分析中,关注音乐的节奏,只考察节奏的快慢,然而一首乐曲中的节奏并非一成不变的。下文提到的研究通过对节奏异质性(Heterogeneity)、切分节奏(Syncopation)、模块结构(structure)的分析,介绍了一种复杂系统视角下对音乐作品的定量研究模式,并使用该方法分析了不同年代的西方古典音乐。
论文:(英文)音乐中的节奏和形式:一种复杂的系统方法 (researchgate.net)
节奏异质性
小朋友参加乐器演奏考级时,最初弹的曲子没那么复杂,等到了九级,曲子中节奏的变化就会增加。如何定量地描述上述区别,可以使用香农提出的信息熵概念。最初的信息熵,是描述一段文本中蕴含了多少不确定性,一段只是由字母A组成的文本,其中蕴含的信息远比同长度的莎翁诗句要少。将乐谱看成一串符号构成的序列,也可以计算一段乐曲的信息熵,这一数值描述了曲子节奏的多样性程度。
切分节奏
乐曲中并非所有的音符都符合节拍,作曲家通过“由弱到强”的切分音来连接不同的旋律。该研究通过测量非节拍音符的分布与所有音符可能落在节拍中的分布之间的距离,来评价一首曲子的切分节奏(Syncopation)。将节奏的多样性和切分节奏的多少汇总,可计算乐曲的复杂性。具体的计算方法如下图所示,感兴趣的读者可参考原文。
图1:定量衡量音乐异质性和切分节奏的示意图
模块结构
乐曲复杂度的全局指标与每段音乐对应指标的平均值并不相同。这进一步为节奏是一种涌现属性的观点提供了支持证据。想象一个带有复杂音乐主题的乐谱,这些主题在乐曲中重复了很多次,没有任何显著的改变。因此,对乐曲每个主题的分析将揭示出高度的节奏复杂性。相比之下,乐曲整体的复杂性会很低,因为尽管这些主题本身就很复杂,但从整体来看却会变得重复和可预测。
钢琴演奏时,音符持续的时间有长有短,在感知层面上,声音事件的长度在理解声音结构方面起着决定性的作用,一个持续时间更长的音符,可以被看成是英语中的重音,标志着一段节奏的开始或结束。而一段时间内的沉默,也会被听者视为是一个独立的音符。由此,将曲谱中音符的持续时间按长短绘制柱状图,再将长的音符和之后比它短的音符连接组成图。上述的音符连接图拓扑包含了该段的聚类信息,我们可以使用图的度数分布来提取这些信息。具体来说,可通过聚类算法,将乐曲分为多个模块,如图2所示:
图2:对莫扎特的A大调第11号钢琴奏鸣曲的音符进行模块分析后,绘制的音符连接图聚类后,聚类算法给出的四个聚类簇与乐曲初始主题的结构准确对应
根据音符网络中度数的分布,可以计算该网络的同配性(assortativity)与传递性(transitivity),具体的定义限于篇幅略去。值得注意的是,某些乐曲中持续时间短的段落和长时间段落,在度数分布上符合幂律法则,即乐曲中持续时间较长的模块,和较短的模块在其内部音符的持续时间上,有着相似的规律。
图3:莫扎特A大调第11号钢琴奏鸣曲的音符可见性图的度相关性呈现 b=0.12 的幂律分布
而通过对不同年代作曲家典型乐曲的定量分析(图4),可以发现,从巴赫到德彪西,乐曲的复杂性在上升,而乐曲不同模块之间的同配性和连接性在下降。尽管该方法只是基于少量乐曲,但上述结论是符合直觉的,我们会觉得巴赫的曲子有规律可循,之后的作曲家不断打破规则,在丰富音乐表现力的同时,使得乐曲变得更加不可预测。
图4 :巴洛克、古典、浪漫主义和印象派时期代表作曲家的(a)乐曲复杂度折线图以及(b)音符可见图的同配性和连接性折线图
小结该研究,通过提出对古典音乐作品的节奏复杂性的三个量化指标(分别捕捉节奏的异质性,切分音和对整个作品的模块间相似性),指出基于复杂系统的视角得到的结论,与传统的音乐形式分析所得结论呈现出显著的对应关系。由于新方法找到的模式基于简单的定量规则,而不包含先入为主的概念,这支持在音乐中,节奏应被视为涌现属性。乐曲复杂性不等于分段乐章复杂性之和,以及音符持续时间构成的可见图的度数分布满足幂律法则,这两个发现都为研究音乐节奏提供了全新的洞见。
基于该研究指出的方法,可以对乐曲进行量化评估,这意味着以后作曲家可以知道不同年龄、不同性别,或者不同教育背景的听众,在人群层面上更偏好何种复杂度的乐曲。音乐研究者还可以找出对应不同情绪的乐曲在复杂度上是否存在统计差异。
谈论完基于复杂网络特征对音乐进行定量分析,再来看看利用这些特征区分不同流派的音乐的例子。对于管理音乐推荐系统的媒体行业和音乐流媒体服务来说,这是一项基础需求,也是研究热点。一项基于复杂网络进行特征提取的分类方法,在GTZAN和FMA数据集上,分类准确性都显著高于之前的(包括基于深度学习)模型,如图4所示。
能够提取出可用于构建准确分类器的特征,说明算法把握了不同类别音乐之间的本质区别。通过在更大数据集、更多类型音乐上的模型构建,该研究从反方向进一步论证了,可将音乐(不仅是古典音乐)视为复杂系统呈现出的涌现特征。
论文:(英文)基于网络的复杂音乐流派特征提取与分类方法 (researchgate.net)
图4. 使用复杂网络提取的乐曲特征,结合随机森林模型,8种音乐类型上的分类准确性热图
接下来介绍自动作曲工具 NetWorks (NW),其构建基础来自复杂科学提出的关于创造力的解释性理论。该工具能够产生音乐作品,在一定程度上预示了不仅人类对音乐的赏析可以用复杂科学的工具(诸如涌现)加以审视,音乐创作行为也符合复杂系统的规律。
论文:(英文)受复杂自适应系统科学启发的音乐生成系统 (researchgate.net)
音乐作为一种艺术,就一定要推陈出新才能永葆生机。故而,可以将音乐的演化看成是复杂适应系统的一种特例。人类的心智活动,尤其是创造力,在这一视角下,被视为对变化环境的适应过程,以最小化环境与自身预期之间的信息熵。人的创造力取决于 (1) 使用类似于“心理熵”(psychological entropy)的东西进行自组织,并动态保持在“混乱边缘”(edge of chaos)的能力,以及(2)在分析和联想处理模式之间转换的能力,即创造力的磨削理论(honing theory)。
论文标题:(英文)磨练理论:创造力的复杂系统框架 (researchgate.net)
创造力的磨削理论指出:就像身体受伤时自我修复一样,大脑始终从不同的角度探索现实与预期之间的差距,例如不完整、不一致或压抑的情感,直到获得新的理解。而面对外界的输入信息,发挥创意的过程可被视为递归地考虑这些信息,使得它们被充分地重组,直到新信息带来的刺激消散。重构过程涉及到神经同步和动态结合,并且可以通过暂时转换到一个更加联想的思维模式对其加以促进。一部具有创造性的作品同样可以引起其他作品的重组,从而促进个人的心智向更微妙的世界观演变。
为达成这一目标,需要让心智中的各个模块可通过简单的局部相互作用,在秩序和混沌之间的过渡中找到一个临界状态,这在复杂系统的研究中被称为“混沌边缘”,这一现象被称为自组织临界(self-organized criticality)。满足自组织临界特征的系统,具有包括稀疏连通性、平均路径长度短、强局部聚类、空间和时间的长程相关性,以及对响应外部输入进行快速重置等结构特征。有研究表明,大脑以及活细胞都处在混沌边缘。
描述自组织临界的最经典模型是沙堆模型。向沙堆上增加沙子时,大多数扰动没有什么影响,但偶尔的扰动(超过临界值后)有戏剧性的影响。人类的创造性活动亦是如此,大多数想法对一个人的世界观影响不大,但偶尔一个想法会触发另一个想法,再触发另一个想法,造成概念变化的连锁反应。
回到 NetWorks 这个自动作曲工具,该工具可经由与艺术家的互动,基于特定规则产出由系统生成的 MIDI 音乐。该工具包括核心域映射层。核心允许艺术家用户定义节点连接,以及由规则决定节点何时以及如何响应他们的输入,其中节点包含音高、持续时间、强度及负责保持模块对应节点的同步 entry delay 模块。映射层允许艺术家用户节点输出值映射到 MIDI 数据路由到软件仪器在数字音频工作站(DAW)。
图5:NetWorks 架构具有浅层、分形、自相似的结构。该图为不同类型的节点及其相互关系的示意图。无向边(黑色)表示值可以在两个方向上交换,即两个节点都向它们所连接的节点发送值,并从这些节点接收值。有向边(紫色)表示 entry delay 模块的单个节点与其他模块的相应节点之间的关系。entry delay 模块节点决定它何时会激活自身,以及在持续时间、速度和音高模块中相应的节点。
在音乐生成过程中,NetWorks 产生音乐的动力学特征处于完全的有序(因此没有变化的重复)与完全的混乱(因此没有可预测性的因素)之间。当系统被调到这两个极端之间的位置,也就是前文所述的“混沌边缘”时,输出乐曲的音乐性最大。在这一位置,在熟悉、重复的模式和新奇感之间会产生一种令人愉快的平衡。
通过对比信息熵,可以评价生成乐曲的音乐性。下图6中,1代表巴赫的合唱曲,2代表爵士乐,3是 NetWorks 产生的乐曲,4是完全随机的乐符产生的乐曲,5是由近乎均匀的规则产生的乐曲。可以看到 NetWorks 产生的乐曲根据信息熵这一指标衡量,和爵士及古典音乐都处在随机混乱度的中间地带,即音乐性较高的“混沌边缘”。
图6:不同类型音乐的信息熵箱线图
在复杂系统的动力学中,常常会出现多个吸引子共同存在的状态,可以将其想象成登山时看到的一个个凹陷盆地。音乐生成的语境下,每个吸引子对应一个曲调的主题旋律。而发挥创造力的过程,可以看成一个“旧的想法”把系统的动力学推到不同的盆地,使得系统的稳态改变,从而表现出“自我修复”的行为。对应到音乐的语境,曲调中主题的改变,会导致乐曲呈现全新的模式。
NetWorks 节点通过集成和简化来自多个来源的输入,并返回一个特定的值来对其他集群做出反应。这样的机制可以使系统兼具自下而上和自上而下的反馈以及在互动之间存在时间延迟,这对于创造开放式进化的系统至关重要。通过模拟人类发挥创造力的机制,NetWorks 使音乐创造者能够简单地调整网络中的节点参数,就创造出具有音乐性的乐曲。
具体来看,从一个听起来很混乱的任意初始配置“种子事件“,NetWorks 开始演化。乐曲的主题和/或旋律从开始时的重复展开,然后系统走向包含一个或多个吸引子(或盆地)的状态,从而产生一个更稳定、更有组织的乐曲模式。具有不同交互规则的节点容易干扰(干扰可能是由具有不同交互规则的节点,或由进入流的延迟值引起)系统的动力学,将其推入另一个盆地(具有新的主题)。这种准周期动力学通过循环的音乐模式,或一个松散的主题和变化结构,为乐曲提供了一种组织感。而这为当前主题和处于混沌边缘的旧主题之间产生了一种平衡。
总结来看,上述三项研究结合音乐与复杂系统,展示了科学与艺术的交叉可以创造出有趣且有用的全新洞见。使用复杂系统的工具,不仅能够对音乐的类别进行区分,还可以量化地评价乐曲,甚至产生符合人类创造力运作方式的乐曲。
转载内容仅代表作者观点
不代表中科院物理所立场
如需转载请联系原公众号
来源:集智俱乐部
编辑:草莓熊
,