热力学第一定律关于熵(热力学第二定律与熵)(1)

在描述世间万物规律的物理定律中,只有热力学第二定律让我确信它永远不会被推翻。

—— 阿尔伯特·爱因斯坦

热力学第二定律,既简明又深奥。物理学家用它解释自然现象,企业家用它诠释管理的艺术,社会学家用它解读人的行为。

那么,热力学第二定律及与之紧密相关的“熵”,本质上是什么呢?本文以易懂而严谨的方式,为你解读热力学第二定律。

热力学第二定律的具体表述在历史上出现过多种,且长相各异。其中,现代学者普遍接受的一种表述如下:

孤立系统的熵只会随时间流逝增加,而不会减少。

其中,“孤立系统”指不与外界交换能量和质量的系统。

热力学第一定律关于熵(热力学第二定律与熵)(2)

就知道你要问。“熵”是一个不容易搞懂的概念。像“温度”、“压强”之类的概念,我们能触摸或感知到它们,所以容易理解。而熵看不见摸不着,高度抽象,很难准确理解。

直观地说,熵衡量物体或系统的混乱度。

热力学第一定律关于熵(热力学第二定律与熵)(3)

举个例子。上图中左右两个房间,里面的陈设几乎一样,好比两个包涵相同物质的系统。左边的房间明显较混乱,而右边的房间更整洁。所以我们可以认为,左边混乱房间的熵较高,而右边整洁房间的熵较低。

热力学第一定律关于熵(热力学第二定律与熵)(4)

当然。直观理解“熵”不足以让求知欲强的同学满意,而“混乱度”这个诠释确实也没有解决全部问题。那我们就从“熵”这个奇怪的汉字说起吧。

“熵”字来源于我国物理学家胡刚复的灵机一动。

1924年,德国物理学家普朗克来中国讲学,作“热力学第二定律之观念”的报告。为普朗克翻译时,胡刚复苦于听众难以理解“entropie”这一德语词,就即兴创造了“熵”字翻译。

热力学第一定律关于熵(热力学第二定律与熵)(5)

“熵”在“商”字左边加“火”字旁,取“热量与温度之商”的意思,来源于德国物理学家鲁道夫·克劳修斯(Rudolf Clasius)的定义。

以卡诺热机为基础,克劳修斯在1856年推导出下述公式:

热力学第一定律关于熵(热力学第二定律与熵)(6)

其中,Q表示热量,T表示温度,S表示熵。△表示增量,所以S代表熵的增量,Q代表热量的增量。克劳修斯推导出的上述公式的含义是,熵的变化量等于热量变化量与温度的比值(商)。

克劳修斯是历史上首位定义熵的科学家。这项定义在热力学范围内适用,但也带来了两个问题。

其一,克劳修斯只定义了熵的增量,却没有给出一个锚点。比如,什么情况下,一个系统的熵值是1。克劳修斯的定义没有给出明确的答案。

其二,这个定义难以直观诠释其意义。“热量变化量”与“温度”的比值到底是啥,让观者如坠五里云雾。

热力学第一定律关于熵(热力学第二定律与熵)(7)

问得正是时候,当然需要再给力一点。

1877年,奥地利物理学家路德维希·玻尔兹曼(Ludwig Boltzmann)从统计力学角度给熵以下述新定义:

热力学第一定律关于熵(热力学第二定律与熵)(8)

等式左边的S表示熵。等式的右边,Kв是玻尔兹曼常数。ln函数即自然对数。重点来了,这里的W表示微观状态数。具体地说,对于某系统所处的某个特定的宏观状态,W是所有符合该宏观状态的微观状态总数。

关于宏观状态与对应的微观状态数,老师打一个简单的比方。比如我们抛掷两枚硬币,一共可能会出现三种宏观状态:两正面、一正一反、两反面。

热力学第一定律关于熵(热力学第二定律与熵)(9)

两正面对应的微观状态只有一种(正正),两反面对应的微观状态也只有一种(反反),而一正一反对应的微观状态有两种(正反、反正)。

宏观状态与其对应的微观状态之间有如下的关系:如果系统处于某固定的宏观状态,且不受其他因素干扰,则系统将在所有符合要求的微观状态之间切换,并在有限时间内遍历所有合理的微观状态。

以掷硬币为例,当系统处于“一正一反”这个宏观状态时,两枚硬币会自发地在“正反”、“反正”两种微观状态之间反复横跳;但若没有外来因素干扰,则不会跳跃到“正正”或“反反”等状态。

热力学第一定律关于熵(热力学第二定律与熵)(10)

可以的。这位同学大概是对硬币这个粗糙的例子不满意,那么老师就举一个更精细的例子——围棋盘与围棋子。

(本例来源于YouTube频道 PBS Space Time)

围棋盘纵横19道,上有361个交叉点。假设我们有180枚黑子(白子已经被扔到一边了)。同学们不妨想象,这张棋盘是一方孤立的空间,而180枚棋子好比180个气体分子。接下来,我们考虑两种截然不同的宏观状态:

宏观状态I180枚棋子比较均匀地分布在棋盘的交叉点上,如下图所示。

热力学第一定律关于熵(热力学第二定律与熵)(11)

宏观状态II180枚棋子集中分布在棋盘的右半边,如下图所示。

热力学第一定律关于熵(热力学第二定律与熵)(12)

在这块棋盘上,宏观状态指棋子的总体分布形态,而微观状态指棋子具体的分布方式、每一格交叉点上有或没有黑子。

我们可以从玻尔兹曼的定义出发,量化地分析与比较这两种宏观状态的差别。方便起见,我们暂且省略公式中的玻尔兹曼常数Kв(省略玻尔兹曼常数并不影响量化分析)。现在,玻尔兹曼熵暂时以此公式定义:

热力学第一定律关于熵(热力学第二定律与熵)(13)

宏观状态I,“180枚棋子较均匀地分布在棋盘上”比较常见。用组合数学的公式,我们可以比较准确地估算出,符合宏观状态I的微观状态共有约10^108种。用公式表示,W(I)=10^108。因此,宏观状态I的熵值大约是 :

热力学第一定律关于熵(热力学第二定律与熵)(14)

宏观状态II,“180枚棋子集中分布在棋盘右半边”比较少见。实际上,只有棋盘正中间一列的9枚棋子排列状态不确定。因此,符合宏观状态II的微观状态只有92378种。用公式表示,W(II)=92378。因此,宏观状态II的熵值大约是 :

热力学第一定律关于熵(热力学第二定律与熵)(15)

综上,W(I)>W(II),宏观状态Ⅰ对应的微观状态总数更多;因此,宏观状态I的熵较高,宏观状态II的熵较低。

我们用下面这张表格总结围棋这个案例中,两种宏观状态的差异。

热力学第一定律关于熵(热力学第二定律与熵)(16)

老师知道某位同学又有问题了,那就请提问吧。

热力学第一定律关于熵(热力学第二定律与熵)(17)

好问题。直观来看,符合某个宏观状态的微观状态数量越多,该状态一般也越混乱。

比如上例中宏观状态I旗下的微观状态

热力学第一定律关于熵(热力学第二定律与熵)(18)

就比宏观状态II旗下的微观状态

热力学第一定律关于熵(热力学第二定律与熵)(19)

明显更混乱。

但是,上述直观理解存在一些例外。比如下图的“整齐”排列。

热力学第一定律关于熵(热力学第二定律与熵)(20)

这个状态的熵是较高还是较低呢?

第一感觉来说,此种排列无比整齐,毫不混乱,似乎应该是低熵的状态。但是,这个微观状态其实相对符合宏观状态I“180枚棋子较均匀地分布在棋盘上”的描述。

如果把这些棋子想象成气体分子,那么从

热力学第一定律关于熵(热力学第二定律与熵)(21)

状态变化到

热力学第一定律关于熵(热力学第二定律与熵)(22)

状态所需的能量较小。

而从

热力学第一定律关于熵(热力学第二定律与熵)(23)

状态变化到

热力学第一定律关于熵(热力学第二定律与熵)(24)

状态所需的能量较大。

因此,下图应被视作宏观状态I所属的微观状态,其熵较大,接近S(I)=243.1。

热力学第一定律关于熵(热力学第二定律与熵)(25)

从上例可以看出,把“熵”解释为“混乱度”足够直观,但不足够严谨。玻尔兹曼的“微观状态数”定义才是对“混乱度”的准确诠释。

热力学第一定律关于熵(热力学第二定律与熵)(26)

嗯,当然可以。前文我们提到“熵”的两种量化定义:克劳修斯的“热量与温度之商”,与玻尔兹曼的“微观状态数”。

这两种定义理应是相容的,而在热力学范畴内,确实可以通过数学推导,证实两种定义等价。不过,如果从信息的角度看待“熵”,不仅可以将上述两种定义联系在一起,还可以进一步推广“熵”这个概念的适用范围。请同学们考虑下述定义:

熵衡量我们对宏观状态的无知程度。

要理解什么是“无知”程度,我们还是回头看围棋盘的例子吧。

请同学们先考虑宏观状态I,棋子较均匀分布的宏观状态。

热力学第一定律关于熵(热力学第二定律与熵)(27)

我们对宏观状态I其实所知甚少——基本上不知道乌云下棋子的具体分布。棋盘上哪个点有子,哪个点没有子,几乎无法判断。

想要准确了解宏观状态I背后具体的微观状态是什么,我们还需要知道棋盘上每一个点的状态。这几乎需要361位二进制码(每一个点,如果是黑子记作1,空点记作0),也就是361比特(bit)¹的信息。

(注解1:bit的翻译在不同地区有差异。此处笔者译作比特,请读者注意勿与byte(字节)混淆。1byte=8bit)

若是宏观状态II,棋子集中分布在右半边的宏观状态。

热力学第一定律关于熵(热力学第二定律与熵)(28)

那么我们对其知之甚多,能几乎确定对应的微观状态——除了棋盘中间的一列不确定。

热力学第一定律关于熵(热力学第二定律与熵)(29)

因此,我们只需确定棋盘中间19个点的状态,就可以准确得知宏观状态II背后的微观状态是什么。换句话说,我们只缺不多于19比特(bit)的信息。

根据上例,我们可以总结,所谓对宏观状态的“无知”程度,就是确定对应微观状态尚欠缺的信息量。欠缺的信息量越多,则这个宏观状态的熵也就越高。

嗯…… 可以。

美国数学家克劳德·香农(Claude Shannon)在1948年10月发表论文《通信的数学理论》。这篇大名鼎鼎的论文后来被视为信息论的开山之作。该论文提出了“信息熵”的概念,其定义如下:

热力学第一定律关于熵(热力学第二定律与熵)(30)

这里的H就是香农定义的信息熵,而W还是微观状态数。不难看出,香农的信息熵定义与玻尔兹曼的定义几乎一样,只相差一个常数。

信息熵定义中的对数函数通常以“2”为底数,因为二进制在信息论的实践中更常见。

以香农的定义计算,棋盘上的宏观状态I与宏观状态II对应的信息熵如下:

热力学第一定律关于熵(热力学第二定律与熵)(31)

宏观状态I的信息熵是358,而宏观状态II的信息熵是16.5. 这与我们之前粗略的估计非常接近,也更精确地衡量我们对宏观状态的“无知程度”。

老师把信息熵补充到表格的最后一列,同学们可以据此做总结。

热力学第一定律关于熵(热力学第二定律与熵)(32)

热力学第一定律关于熵(热力学第二定律与熵)(33)

呃…… 能……的吧。

玻尔兹曼对熵的定义,其实采用了一个简化问题的假设:“各微观状态出现的概率相等”。

这条假设在某些情况下合理,在某些情况下不合理。美国物理学家约西亚·威拉德·吉布斯(Josiah Willard Gibbs)在玻尔兹曼定义的基础上定义了一般情况下的熵,公式如下:

热力学第一定律关于熵(热力学第二定律与熵)(34)

其中,表示各微观状态出现的概率。这个熵的定义也被称为吉布斯熵。

与吉布斯熵相对应,一般情况下的信息熵以下述公式定义:

如果各微观状态出现的概率相等,即

热力学第一定律关于熵(热力学第二定律与熵)(35)

那么

热力学第一定律关于熵(热力学第二定律与熵)(36)

与前述的简化定义一致。

热力学第一定律关于熵(热力学第二定律与熵)(37)

本文介绍了五种熵的定义。“熵”起源于热力学,却在统计力学那里找到了自己的归宿,并启发了一门全新的学科——信息论。

“混乱度”是对“熵”的良好直观理解,而微观状态数则是对熵更准确的理解。

当同学们正确理解熵,才能真正理解热力学第二定律,以及热力学第二定律背后那些更深刻、普遍的道理。

,