作为近代物理最受瞩目的理论成果之一,狭义相对论已被写入大多数本科力学和电动力学教材中,本文所涉及的绝大多数结论均可从其中查到。

本文主要面向已系统学习过经典质点动力学以及平面向量的高中生及以(hao)上(pian)的高年级学生。如果在数学上因基础不足而有困难的同学(初中或高一),欢迎开楼询问;如果有熟谙相对论的大神,欢迎开楼批评指正。本文名为科普,实为知(dao)识(mai)交(si)流(huo),笔者学识有限,只当抛砖引玉,希望在以自己的经验帮助有志于学习相对论的同学起步的同时,补充自己的浅薄认识。

第一讲 相对性原理

相对论的出现,是为了解决经典物理学内部的矛盾。在相对论时空观出现之前,已经有基于伽利略相对性原理和伽利略惯性系变换之上的力学。力学三定律:惯性定律,加速度定律,反作用定律。第一定律和第三定律显然在不同的惯性系都成立,而第二定律,依高中物理教材的描述,在不同参考系内的形式也是一样的。这就说明,在惯性系中,不可能通过力学方法测量某一惯性系相对于其他惯性系的速度,所以力学规律是符合伽利略相对性原理的。

如何做位置测量?

把质点的位置投影于【固定的,刻度均匀的尺】上读数,该数值称作坐标

如何读数?

过质点位置做尺所在直线的垂线,记录垂足点对应的数字

这一数字的意义?

尺单位长度的倍数

(这一读数方法,和笛卡尔坐标系的坐标是类似的。所以,我学习相对论的过程中,认为【参考系】不止是一个【参照物】,而是【参照物】拖着一组【坐标尺】和【时钟】)

以上的做法,可以等价于【空间直角坐标系方法】,在以后的描述中,将以【坐标系】代替【静止的尺】;以【坐标】代替【读数】。(笔者认为读者对坐标方法是熟悉的,不再赘述)。

【坐标】是位矢分量相对基矢的倍数,如果基矢变了,坐标就会改变。在相对论中,为了同时满足相对性原理和光速不变原理,必须改变基矢

然后是时间测量

时间测量有更多的讲究。

时钟在参考系B中得静止(要不然就属于别的参考系了)。

测量方法:在事件发生(比如质点A运动到(x,y,z))的【同时】看钟读数(钟周期的倍数)。

在相对论时空观里,【同时】也要重新考虑。如果事件发生的位置和钟表位置不一致,传递时间读数的信号传播速度必然影响【同时】的精度。这一问题至少在惯性系里是可以解决的。

以上,就是在新的时空观下对新出现的测量问题的分析。非常啰嗦,但很重要,笔者认为有必要看完并理解。如果有不清楚(理解不清楚或者写的不清楚)的地方,请尽管提问。

上一段,说的简单一些,中心思想是:在相对论时空观中,不管在哪一个参考系中,尺钟怎么变,测量的方法一如上一段所言。在之后的讨论中(尤其是洛伦兹变换中),一旦对其中坐标的意义感到迷惑时,可以回头看看,这些坐标是如何测量得到的。

下面将把测量的方法具体到惯性系问题中。

在新的时空观下,什么样的参考系才是【惯性系】?这一点我没有查过严格的定义。如果仿照经典定义,我觉得可以这样说:

【惯性系】是【牛顿第一定律】成立的参考系。并且,相对某一惯性系A做【匀速运动】的惯性系B也是惯性系(这里的【匀速】是相对参考系A的测量结果)。

有定义和这个性质对【惯性系】来说已经足够了,惯性系全体可以构成一个集合,而狭义相对论的两个基本原理【相对性原理】和【光速不变原理】,只在这个集合中成立。

在惯性系的限制下,【事件发生】和【对钟读数】二者【同时】进行的问题,是可以解决的。由于【光速不变】,若以光信号传递读数信息,只要知道【事件发生点】和【钟】二者的距离,就知道钟读数信息的精确延迟时间,【事件发生】的时刻就可以计算。同理,各个位置的钟可以利用光信号精确对时,做到“同一惯性系内整个空间各个位置的钟同时指示同一时刻”。在这一意义下,时间测量的精度取决于位置测量的精度。

附上钟表校准的图解

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(1)

对时方法:将时钟按照其坐标,预设初始示数t=x/c,从原点在t=0时刻发射光,时钟接到光信号时启动,如此可以校准空间任意位置的时钟。

对【惯性系】的讨论暂时告一段落,回到【相对性原理】的问题中。“一切惯性系都平权”,【平权】是什么意思?

首先,在这里需要做全文最重要的一个声明:在学习狭义相对论时,一定要摒弃“静止参考系”的概念。相对论一般研究两个惯性系之间的物理量(直接或间接的测量量)变换,这两个惯性系是完全平级的,没有谁静谁动的关系,唯一连接二者变换关系的参数,是惯性系A相对于惯性系B的速度v;或惯性系B相对于惯性系A的速度-v。两个相对速度一定是相反数,否则两个参考系就不平等。

回想【伽利略相对性原理】:力学规律在不同参考系形式不变。具体点说,在参考系A中,有牛顿第二定律f=ma;在参考系B中,力的测量值f’,质量测量值m’,加速度测量值a’,同样可以写成f’=m’a’(当然,在非相对论精度下的试验中,f和m在不同惯性系下是相等的不变的,这样的量在后面有个名词:协变标量和协变矢量);也就是说,在参考系A里和参考系B里,虽然时空测量结果可能有所差别(x’=x vt),但牛顿第二定律没变,力学规律没变,那么,不观测参考系B,而以力学方法来区别参考系A,B的企图就注定得失败。同时,只用力学方法,也无法确定参考系A和参考系B的相对速度。

引入相对论的“目的”,是要把【伽利略相对性原理】中的“力学”的前缀去掉,并把其中“测量”的意义覆盖成相对论时空观意义下的“测量”,这样,以“物理方法”无法区分惯性系A,B,那么两个惯性系A和B在“物理”上就是平权的了。一个必然的结果就是:物理规律方程(包括电磁学方程和量子力学方程)的形式不能因惯性系的不同而变化。同时,不观测惯性B,就无法用物理方法得到A相对于B的速度。

狭义相对论时空观引入的【相对性原理】是【伽利略相对性原理】的推广,前者将适用范围推广到了全物理规律的范围。结合光速不变原理,我们发现,在经典时空观推得的物理规律方程,在狭义相对论时空观下,要么在不同参考系下形式改变,要么违背光速不变原理。因此不仅惯性系间的时空变换关系需要修改,而且各种物理规律也必须做相应的修正。本文的目标,就是得出时空变换关系(洛伦兹变换)的同时,把质点动力学的一些简单情形推广到狭义相对论中,其中就有万众期待的质能方程E=mcc。

第二讲洛伦兹变换

这一讲涉及一些定量的内容:两参考系之间的坐标关系。那么,涉及两个参考系中的坐标测量,有必要做一点有助于理解的说明

*******再次声明:在学习狭义相对论时,一定要摒弃“静止参考系”的概念。相对论一般研究两个惯性系之间的物理量(直接或间接的测量量)变换,这两个惯性系是完全平级的,没有谁静谁动的关系,唯一连接二者变换关系的参数,是惯性系A相对于惯性系B的速度v;或惯性系B相对于惯性系A的速度-v。两个相对速度一定是相反数,否则两个参考系就不平等。

对于某一个质点D,在两个参考系下对应有两个坐标值(以及时刻)。分别为:A系(x,y,z,t);

B系(x’,y’,z’,t’)。

D在A系中的坐标,是【按第一讲中的测量方法,用相对于A系静止的【尺(坐标系)和钟】得到的数值】;

D在B系中的坐标,是【按第一讲中的测量方法,用相对于B系静止的【尺(坐标系)和钟】得到的数值】。

言归正传

狭义相对论主要研究【两个】不同惯性系间的物理量变换关系,统一这两个惯性系的物理规律方程形式。如此我们构造两个惯性系A和B,其中B相对于A以速度v运动。每个惯性系都应该拖着一套坐标轴和校准钟,我们把两套坐标轴的x方向均设为相对速度的方向,y,z方向垂直于x方向且y与y’,z与z’方向一致,原点在t=0时重合。质点相对于A系的速度为u,相对B系的速度u’

为什么在狭义相对论时空观下不能坚持伽利略变换呢?

伽利略变换:(左边是B系坐标,右边是A系坐标,坐标(时刻)的具体意义见上一讲)

X’=x vt;

Y’=y;

Z’=z;

T’=t

如果这个变换成立,那么,分别在A系取两个点(x1,y1,z1,t1),(x2,y2,z2,t2);在B系的坐标分别为(x’1,y’1,z’1,t’1)(x’2,y’2,z’2,t’2);带入变换式,左右做差,有:

Δx’=Δx vΔt;

Δy’=Δy;

Δz’=Δz;

Δt’=Δt;线性(一次)方程就是有这个好处

第一式除以第四式有

Δx’/Δt’=(Δx vΔt)/Δt;

令时间趋于0,商的物理意义是速度:

u’=u v,这是熟悉的经典相对速度公式。

如果质点相对A系的速度是c,那么依这个相对速度算法,质点相对B系的速度u’=c v,不等于c,这和光速不变原理相矛盾。因此在狭义相对论下,伽利略变换必须被新的变换式所取代。

这个新的变换式,代表了一个新的时空观,也引入了许多不可思议的现象。这个变换就是著名的洛伦兹变换式。本文将直接导出洛伦兹变换式,而对“尺缩钟慢”等著名的时空效应将在洛伦兹变换式的基础之上给予说明。

首先,洛伦兹变换式一定是线性(一次函数,均匀)的。否则就会出现这样的现象:坐标尺(钟)的刻度将不均匀。而惯性系B不仅和惯性系A平权,其内部的各点也应当平权,故坐标尺(钟)刻度应当一致。根据这一精神,可以列出惯性系A,B时空坐标变换关系的一般形式:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(2)

式1

利用坐标系的特征和相对性原理,可以大幅化简该式。

由于两个惯性系内的xyz(x’y’z’)轴相互垂直且对应方向相同,因此坐标x只和x’相关(y,z同理),但并未和时间t撇清关系,第一式可以化简:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(3)

式2

这里我们不假(hui)证明地给出一个重要的引理:

【参考系B垂直于相对速度方向的尺长不变,等于参考系A中垂直于相对速度方向的尺长】

(各位大大放过我吧,这条楼主真不会证明,是看别人的书看到的证明,楼主给忘了)

这样一来,对于空间中的同一点(位矢,位置矢量),在不同参考系下的y坐标和z坐标就相等了,并且和时间无关,即:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(4)

式3

式1的最后一式也是可以简化的。由于y,z方向的尺长不变,那么在一个线性(一次函数,均匀的)方程里,y,z坐标就不应该影响【对时】的精度,影响t’的因素就只有x和t。故式1的最终简化形式是

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(5)

式4

(多说一句,数学上,如果式(1.4)中a42和a43不为0,那么这一变换与其逆变换的形式一定不一致,这样A,B惯性系就不平权。因此式(4.4)也是相对性原理的要求)

如此,求洛伦兹变换的任务,就简化为求这四个待定系数的值的问题。这种简化得益于好的坐标系选择,以及对相对性原理的合理运用。

那么如何求解这四个系数?

作为狭义相对论时空观下的内容,洛伦兹变换式必须满足两大原理:相对性原理和光速不变原理:相对性原理需要两个参考系平权,那么【从惯性系A到B的时空坐标变换】和 【从B到A的时空变换】必须是互逆的变换(具体的变换互逆的判定需要线性代数知识,这里只利用相对速度互为相反数这一条件);光速不变原理要求:不论对于参考系A和B,光速都是c,换句话说,如果速度u在A中大小为c,那么u’在B中大小也是c。

注意到上述条件均为两个参考系的(特殊)速度之间的关系(相对速度和光速),那么,通过式4给出形式上的【同一质点相对两个惯性系的速度u,u’的关系】,成为一个可行的捷径。

把式4,即形式上的洛伦兹变换表式做差(正如第二讲开篇讨论的伽变换那样)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(6)

式5

用式(5.1)除以(5.4),有:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(7)

式6

只考虑x方向,利用速度定义

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(8)

式7

代入式6,有

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(9)

式8

这是(形式上的)速度“叠加”公式,实际上是(形式上的)同一运动质点相对于惯性系A,B的速度u与u’关系。

有了【式8】,代入相对速度的定义,或代入光速不变原理,立刻可以得到四个方程:

若质点D相对B静止,那么D相对于A的速度一定是相对速度v:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(10)

式9

同理,若质点D相对A静止,那么D相对于A的素的一定是相对速度-v:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(11)

式10

向x轴正向发射一束光,这束光相对A系和B系的速度都是c:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(12)

式11

同理,像x轴负向发射一束光,这束光相对A系和B系的速度都是-c:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(13)

式12

四个方程,四个待定系数,待定系数能确定了吗?

不能。

上述四个关于四个待定系数的方程是不能定解的,原因是它们并非相互独立关系,用其中任意三个方程可以推出剩下的一个。这也就是说,要想定解这一问题,还需引入其它方程。

为此我们参考高中物理教材中关于相对论的那部分内容(选修3-x),构造这一光路:选取起点P和终点Q,在B系下观测,空间坐标分别为P(x’,0,z1’),Q(x’,0,z2’),也就是一条【在B系中垂直于x轴的一条直线段】的两端点;光线在时刻t1’从P点射向Q点,那么这一时间,由光速不变原理,可以表示为:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(14)

式13

(注意是带’ 的)

如果在A系中观测这一现象,那么,同样是光线从P射向Q,但是光行过程中Q已开始以v平移,所以光线在A系中的径迹是倾斜的。这条径迹在z轴上的投影Δz等于Δz’(因为yz方向尺长不变),x轴上的投影Δx=vΔt,由光速不变原理,径迹长度为cΔt,由勾股定理有:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(15)

式14

结合形式方程

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(16)

【5.1】【5.4】,加之所选的特殊光路Δx’=0

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(17)

式15

用Δt’表示Δt是可以做到的,解式15得

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(18)

式16

带入式14,消去Δt,可以得到关于待定系数的第四个必要方程。

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(19)

式16‘

联立式9,式10,式11,式16‘,解得

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(20)

式17

其中

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(21)

式18

在符号选择上,至少在低速下,两个参考系的时间还是向前流动的,所以系数a44取正号,其他的符号也顺势而取即可。

以上就是求解洛伦兹变换的全部过程

补上为求第四个待定系数方程所构造的光路

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(22)

第三讲 被扭曲的时空观

前言:第二讲是笔者的得意之作,语言晦涩公式繁多,好多读者恐怕读不懂导致反响很差。所以对自己的提纲做了修改

第二讲,笔者的目的是希望给读者呈现狭义相对论中的严密性,对此笔者不吝繁琐的说明和数学表达式,力图做到从两大原理无缝直通洛伦兹变换,更多地顾及推导的严谨性(自己做不到的地方,标注了别人能做到),却在行文中忽略了表达上的细节,以致难以理解。为了补救这一缺憾,楼主在此讲以及今后的内容中,会把内容设计的相对独立于第二讲。对于第二讲的处理,楼主计划只保留洛伦兹变换的表式,而本来占更大篇幅的推导过程可以作为带星号的内容无视之,不影响后来的阅读。(反正对这部分感兴趣的同学不多)

第三讲依然要以数学方法切入,展现狭义相对论时空观中,速度叠加方法的不同,钟不仅变慢而且和空间坐标纠缠,尺不仅收缩而且读数规则受时间的影响。这些现象明显和我们印象中的世界相悖,但日常世界观也不过是狭义相对论的低速近似而已。高速运动的参考系到底是扭曲了时空,还是为我们展现了一个不同的观测角度,这个问题也值得思考。

以上

开坑

之前,还是做一个前情提要:

符号约定:

v是【惯性系间】的相对速度

带撇的是B参考系下测量的坐标和时间,不带撇是A参考系

u代表的是【质点】在惯性系下测量得到的速度

此外,注意两个常用的常数

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(23)

0.再三声明:在学习狭义相对论时,一定要摒弃“静止参考系”的概念。相对论一般研究物理量(直接或间接的测量量)在两个惯性系之间的变换关系,这两个惯性系是完全平级的,没有绝对静和绝对动的关系,唯一连接二者变换关系的参数,是惯性系A相对于惯性系B的速度v(或惯性系B相对于惯性系A的速度-v)。两个相对速度一定是相反数,否则两个参考系就不平权。

1.测量:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(24)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(25)

洛伦兹变换中的坐标和时间,都按照这一测量方法生成

2.洛伦兹变换式和伽利略变换式

参考系设置

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(26)

在这种参考系设置下,两参考系间空间坐标和时间的关系——洛伦兹变换和伽利略变换如下:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(27)

洛伦兹变换

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(28)

伽利略变换

下面将借洛伦兹变换,讨论几个反常识的时空现象。由于已经有了特别的建立坐标系的技巧,我们只需考虑x方向的问题就能得到不失一般性的结论:

1.速度叠加式

上一讲我们给出伽利略变换下的速度叠加公式,以及洛伦兹变换下的形式上的速度叠加公式。这一讲我们通过洛伦兹变换,看一下在狭义相对论框架下,速度是如何叠加的。

高中物理第一课,我们给出速度的定义:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(29)

考虑洛伦兹变换式中这两个式子:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(30)

式3.1

任意取【匀速运动的质点】轨迹上两个点做差,得到

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(31)

式3.1‘

【3.1’】两式相除,易得

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(32)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(33)

式3.2

【3.2】左右两边各显含同一运动质点相对于参考系A和B的速度,这就是x方向的速度在两个参考系之间的变换式

验证一下光速不变吧

令u=c,带入【3.2】,可以解得u’必然等于c。

这个结果的物理意义是:如果一个质点相对于A参考系以光速向x轴正向运动;那么在B参考系观测,质点的速度也是光速。其实,不论什么方向,光速不变的结论总是成立的。

值得一提的是,虽然形式上差异很大,但是伽利略变换下的速度叠加式u’=u-v,是相对论速度叠加式在v远小于光速时的近似,有兴趣的同学可以带入数值验证一下

2.同时的相对性

依然需要式【3.1】

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(34)

令t=0,此时

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(35)

3.3

在推导洛伦兹变换表式时,我们已经预设,相对于A系静止的钟已经“相对于A系校准”,这句话对B同理。但是,我们在A系同时(令t=0)观察【相对于B静止的钟】(求t’)时,却发现,“已在B系校准的”【相对于B静止的钟】的读数随着坐标x而变化。也就是说,在A系中“同时”发生的事件,在B系中不一定or很难“同时”发生。“同时“是相对的,不在绝对。

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(36)

这又是一个和日常不符的现象。因为与经验相符的伽利略变换式中,时间并没有和坐标纠缠不休,这是伽利略变换和洛伦兹变换形式上的最显著差异。

3.线段s的长度

【注意】,线段s是平行于x轴的,这种安排不失一般性

什么是“线段的长度”?这个概念略不同于“位置”。如果这条线段相对于A系静止,我们只需在A系中读出其两端点的位置坐标,相减即可,不需考虑时间。如果线段是(相对A系)匀速运动的,那么在测量线段长度是就必须考虑运动,相应的可以采用两种方法:1.令坐标尺跟着线段运动读数(建立一个相对线段静止的惯性系B,在B系中按静止线段的方法测量);2.观测者的眼睛足够快,在极短的时间内(最好是【同时】)读出线段相对A系的两端点坐标,两坐标相减即长度。

在日常生活中(笔者脑内“日常”就是伽利略变换),这两种方法是等价的,两种方法测得的结果一定相等。但是在相对论时空观下,第二种方法中的【同时】变成了相对的概念。两种方法不一定得到同一结果。

再次引入式【3.1】

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(37)

在A系“同时测量”线段s的端点位置意味着两次测量的时间间隔Δt=0,带入第一式中,易得:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(38)

3.4

我们说过,在相对线段s静止的惯性系测量两端点位置时,不在乎测量时间差,而B系就是这样一个参考系,所以我们不必在乎Δt’的值。【3.4】式直接体现了两种测量方式引起的差异。(至少结果不相等对吧)

线段的长度测量值,取决于线段相对于参考系移动的速度,这样的现象在经典图景下是不可想象的。对相同的一条线段,在【相对其静止的参考系】下测量的结果(Δx’),要小于在【相对其运动的参考系】测量的结果(Δx)。这样的结果,可以解释为【相对线段运动的尺】,比【相对线段静止的尺】要短。这就是著名的尺缩效应。

(但是笔者不喜欢这种解释,如果用已经收缩的尺去量尺,那么尺还会是收缩的吗?如果用已经慢掉的钟去衡量钟的周期,那钟还是不是慢的?笔者在高中时局限于这种思路,结果在相对论这方面毫无建树,这一局面直到认识到待定系数法的重要性后才有所改观。在笔者看来,先去构造测量结果的关系,再去讨论测量的意义,这样的理解过程更深刻)

利用类似的方法,从洛伦兹变换出发,可以轻易看出钟慢效应,此处不作讨论。

小结:本讲的内容相对简单,举了一些由洛伦兹变换与伽利略变换的差异引起的反常规的现象,并以洛伦兹变换处理。得到的结果多数与日常不符,虽然在低速下,常数β趋于0,γ趋于1,此时洛变换和伽变换形式近似。本讲在展现这些不同的同时,笔者也展开了一点哲思:我们在观察同一事物(质点位置和速度),依据不同的时空观,依托不同的惯性系,得到了一些不同的物理量,有一些物理量在伽变换下是不变的(比如时间,长度),到了洛变换下却发生了改变。笔者不禁发问:洛变换究竟是通过不同的参考系,割裂了A,B系彼此的空间,而成为两个线性空间之间的变换;还是在同一个线性空间中不同基底下的坐标的变换,为我们呈现了同一事物的两个不同的表象?对于同一事物的观测,洛变换却呈现出那么多截然不同的物理量,那么有什么量是这个事物固有的,自我的,不受变换影响而独立的量?这些问题留到下一讲解决。

后记:这讲的内容…笔者觉得写得不大过瘾,问题分析的比较浅薄,更多的是验证性的内容。而且还有一个因果律的问题也没有加进去,因为自己在学相对论的时候对因果律不大重视,对这方面没什么思路。期待下一讲——四维空间的引入吧。

说说第四讲

单看狭义相对论的内容,闵可夫斯基空间并不算一个必要的环节。引入这一空间的目的,更多是出于数学上的考虑:这种对时空的描述可以改造洛伦兹变换的形式,简化”协变“的表式,等等......但是相对于时间 空间的描述方法而言,闵可夫斯基空间显得更加接近人们的经验,原因是闵氏空间的性质和欧几里得空间是相似的。从种种方面考虑,楼主决定重点介绍这一方面的内容。如果觉得比较抽象,可以结合欧几里得空间的性质来理解。

第四讲 四维空间——闵可夫斯基空间

前文已述,采用不同的参考系测量同一事件的时间和位置,会得到不同的结果。并且,经典时空观下的不变量(比如长度,时间间隔,速度等),在洛伦兹变换下会发生改变,不再是不变量。

由此笔者不止一次发问:参考系的不同,是否扭曲了时空,并使时空发生分岔和割裂?

从哲学上来看,这一看法并不合适。之前我们一直以运动质点在某一时刻的位置作为一个“事件”。虽然我们选取不同的惯性系,测量事件的时间和位置,得到了一些反常识的结果。但是,不论选取什么样的参考系,终究是对“同一事件”的观测;不同的两个事件在任何参考系一定能区分开;时空坐标和物理事件紧密相连乃至一一对应,而不同参考系的时空坐标又能以可逆的洛伦兹变换一一对应。因此,笔者认为,被参考系“分割”的“各个时空”,通过【真实】的物理事件互相联系,并最终统一于物理世界。

笔者相信,当年物理学界的先哲们之中,一定存在和笔者的观点一致的人。那么,在这一思想的指导之下,如何在理论上把这一思想体现出来,把这一思想用相对具体的数学概念(还是很抽象的)表达出来,这就是本讲的主要内容——如何引入闵可夫斯基空间。

在闵可夫斯基空间中,“事件”在不同的参考系下以一个统一的“四维矢量”表示(不再将时刻和位置区别对待)。在这一表述下,很多物理量的意义将逐步明晰,这有助于相对性原理的诠释,更有利于把经典物理学规律向狭义相对论时空观推广。

(据维基百科说,爱因斯坦一开始对他的老师——闵可夫斯基——把洛伦兹变换改造成闵可夫斯基空间下的形式的做法不以为然,认为这不过是数学游戏,然而他在发展广义相对论的过程中发现闵可夫斯基形式是必要的,因此对这一相对整齐的表述形式重新重视起来)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(39)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(40)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(41)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(42)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(43)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(44)

上述讨论有什么意义呢

之前我们说过,以不同的参考系测量相同的事件,会得到不同的测量结果。笔者既然坚持时空并没有割裂,那么就应该给出一个坐标系统,使同一事件的不同的测量结果在数学上统一于同一客体。从这一角度考虑,线性空间——尤其是内积空间,无疑应该重点考察。原因是:1.内积空间中,选择不同的正交规一基矢组,会得到不同的坐标,但是内积空间中的矢量本身并不随坐标系的旋转而改变(正如平面中的线段的位置不随视角的选择而变化),这样,物理事件本身就可以对应于内积空间中的矢量,它可以在坐标表换下保持不变,而对物理事件的不同观测结果将对应于不同坐标系下该矢量的坐标;2.内积空间是线性空间,这一性质很好的照顾了洛伦兹变换的线性性质。通过合理的构造这一内积空间,还可能将洛伦兹变换改造成一个“正交变换”,那么【选择参考系】这一物理操作,在数学上就相当于【旋转操作】,这样把洛伦兹变换类比于欧几里得空间,有助于我们建立相对论时空观的物理直觉。

基于上述考虑,我们改造洛伦兹变换的形式,并引入一个新的四维空间——闵可夫斯基空间

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(45)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(46)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(47)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(48)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(49)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(50)

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(51)

第五讲——协变

协变不是一个局限于物理学的名词。它代表方程在坐标变换之后的形式不变的特点(反正笔者是这么理解的,但仅仅是直觉上)。

看不明白?那就对了,笔者也看不明白。那么换一个讲法(摘自维基百科)

物理学中,洛伦兹协变性或洛伦兹共变性(Lorentz covariance)是时空的一个关键性质,出自于狭义相对论,适用于全域性的场合。

1. 一个物理量要称为洛伦兹协变性的(Lorentz covariant),则其是在洛伦兹群的表象下做变换。根据洛伦兹群的表象理论,这些量是以下述的量来建立的:标量、四维矢量、4-张量与旋量。其中特别是,一个标量(例如:时空间距)在洛伦兹变换下保持不变,而被称为一洛伦兹不变量(Lorentzinvariant)(亦即它们的变换是在平凡表象(trivialrepresentation))。

2. 一方程被称为洛伦兹协变性的,是以其可以洛伦兹协变量的形式来写出(有些混淆的地方是有些人在此处用“不变量”这个词)。这样的方程的关键性质为:若其可在一个惯性参考系下成立,则他们可在任何惯性参考系成立(这是“若一张量的所有分量在一参考系中为零,则它们在所有参考系皆会是零”这项事实的结果)。这个条件是相对性原理的一项要求,即在两个不同的惯性参考系中,所有非引力定律对于在同一时空事件的等同实验必须做出一样结果的预测。

洛伦兹群?表象?4-张量?这名词对楼主而言完全是高大上够不着,虽不明但觉厉,怎么可能有能力解释的清楚?(而且楼主还有一点怀疑,维基介绍的协变量都是张量——也就是多元多线性函数,那么非线性的量就不是协变量了么,也许笔者理解产生了歧义吧,望解答)

其实——协变什么的,最简单了。笔者写起来那真是天马行空,写意得很。

这个在狭义相对论中听上去最吓人的名词,实际上是个非常容易理解的概念。理解协变不需要高深的数学基础,只需要读者比较靠谱的物理直觉。本文一改二三四讲中从数学推导中窥探物理意义的行文风格,将从物理概念的角度切入,介绍协变的定义和物理含义,这一含义和数学中协变的意义是一致的。

话不多说,开坑

5.1——以测量定义协变

5.1.1 力学量都是【位置,时间】的间接测量量

我们在第一讲——相对性原理中,诠释了两种最基本测量——位置测量和时间测量的意义和测量原则。为什么要如此强调这两条呢?

回忆高中物理中我们接触过的国际单位制的七个基本单位,其中,只要三个基本单位——【米,秒,千克】就可以涵盖所有的力学量,其他非基本力学量的单位都可以有这三个单位导出。着三个单位分别对应着三个基本力学量——【位置,时间,质量】。由基本单位和导出单位之间的关系,不难想象,其他各种力学量都可以用这三个物理量的测量值来表示。

为了便于体会,我们举几个例子增强印象。

(1)x方向上的速度u

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(52)

【1.1 速度表式】

这一表式代表平均速度,当然总可以通过适当的时间点选择和多次测量来逼近瞬时速度。可以看出,速度测量将完全依赖【位置,时间】的测量

同理,加速度也可以通过这种方法测得,同样需要以多次【位置,时间】的测量值表示

(多普勒效应也可以测量速度,此时直接测量量只有时间)

(本讲为照顾中学生,不会出现微分)

(2)质量m

在国际单位制中,质量单位kg是独立于时间的单位s和位置的单位m的基本单位。但是质量的测量真的如单位制一样,独立于位置和时间的测量吗?不见得,想一下,1kg的定义吧——某温度某压强下的【1立方分米】水的质量,这一个明显的长度参数是无法被无视的,尤其是笔者给它加了一个括号。

也许读者会尝试找到一个不需要通过测量【位置,时间】来表示【质量】的测量方法。那么,来看一下吧,我们接触过的几个测质量的方法。

1)利用密度测质量,尤其是测液体质量

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(53)

【1.2 质量=密度*体积】

体积,毋庸置疑,必须通过长度——也就是位置差的测量来表示(长乘宽乘高),密度……这个方法适宜测液体质量,那么,液体密度可以用密度计来测。

密度计的具体工作原理笔者已经记不得了,但是,读数方法实际上也是长度测量——有标尺嘛。上面的读数的含义是待测液体密度和水密度的比值,这个比值是通过阿基米德浮力定律推得的。

测得了体积和密度,质量就可以测(解)得。回顾一下上面的例子,测量质量需要的重要信息有三点:

1.基准质量(水的单位体积的质量)

2.位置测量(有的方法也需要时间测量,但两者至少有其一)

3.力学方程(经验的或理论的)

笔者所能罗列的,用来测质量的方法,无不具备上述三个条件,再如:

2)天平

1.基准质量——1g砝码,

2.位置测量——游码位置,平衡针

3.力学方程——杠杆原理,重力表式

3)弹簧秤

1.基准质量——某标准砝码(由分度值代表)

2.位置测量——弹簧伸长量

3.力学方程——胡克定律,重力表式

4)动量守恒法测被撞小球质量

1.基准质量——入射小球

2.位置测量——两小球速度(位置和时间共同测量)

3.力学方程——动量守恒定律

……

据此,笔者略带武断地断言——一切测量质量的方法,都必须依赖【位置,时间】的测量;换言之,一切质量的测量表达式,都必须是【位置,时间】的“函数”。

(3)其他力学量

力,动量,机械能等力学量,无不依赖对质量和【位置,时间】的测量,因此本质上都归结于【位置,时间的测量】

用一种点题的说法总结此节:在力学测量中,只有【位置,时间】两个直接测量量,其他力学量全都是这两个量的间接测量量。

5.1.2 参考系的选择对间接测量量的影响

不论是在经典时空观和狭义相对论时空观下,参考系的不同都意味着时空测量值的变化,因此,在两个时空观下,都存在着物理量,物理方程是否协变的问题。

那么,什么是协变?

看下面几个式子

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(54)

【1.1 速度表式】

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(55)

【1.3 加速度表式】

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(56)

【1.4 动量表式】

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(57)

【1.5 质量测量方法】

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(58)

【1.6 牛顿第二定律】

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(59)

【1.7 动量守恒,const意思为常数】

第一组,代表了一部分间接测量量的定义或测量方法的集合;第二组则是一些实验规律或者其衍生定理的集合,也就是力学规律。第一组式子中的运动学量不必依赖力学方法,而力学量的测量如上一节所说,必须依赖力学方程,也就是第二组式子;第二组中的力学方程中的全部量,都要依赖第一组的测量结果。两组之间错综复杂的逻辑关系笔者尚无能力和精力讨论,只是确信这些式子在经典时空观的静止参考系下是自洽的(要不为什么这么多年都学这个)。

下面我们把第一组量带入第二组,也就是把间接测量量中蕴含的直接测量量全都暴露出来,写到力学规律方程里,那么力学方程将以其直接测量意义展现出来:

比如,牛顿第二定律

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(60)

【1.8 牛顿第二定律的直接测量式】(多元函数的符号高中也见过吧)

这样,就可以通过实验来验证牛顿第二定律了,按需要测若干组质点在某时刻的位置,带入这一式子,看等号是否成立。从历史来看,力学体系的建立不是一气呵成,它需要各代物理学家不断地创造和总结,需要无数实验以佐证,还得理清这其中的因果关系。所以虽然是“站在巨人肩膀之上”,牛老爷子还是相当了不得的。

这跟协变有什么关系?

既然力学规律中的力学量全都可以用【位置,时间】表示,那么,力学方程的“直接测量形式”中将只含常数和【位置,时间】,这句话写成数学符号是这样的:

狭义相对论的时空观的意义(狭义相对论时空观和一些个人理解)(61)

【1.9 一般力学方程直接测量式】

H是一个复合函数,包含了很多物理量(G1,G2,…),每个物理量G都可以用若干坐标和时间表示:G(x1,x2,…,t1,t2,…)。这样H就被写成关于位置和时间测量量的多元函数,或者说,一个“大个的”间接测量量。(比如牛顿第二定律中,把ma移到式子左边,写成H=F-ma=0,就是这个意思)。

问题来了,我们知道,不论是经典时空观(伽利略变换),还是狭义相对论时空观(洛伦兹变换),如果选择的参考系不同(参考系A,参考系B),那么我们直接测量的时间和位置的数值可能会改变,而力学方程如前文分析正是基于这些直接测量量才能得以验证。对这一现象的思考所必然要遇上的一个问题是:

如果换参考系,那么力学方程H(G(x,t))=0中的等号,是否依然成立?用物理概念提问相同的问题:换参考系测量后,力学规律是否不变?

(好激动,终于碰到问题的核心了)

这是个尖锐的问题,我们知道,位置(和时间,加括号是因为这个直测量在经典和狭相理论下有别)的测量必须依托参考系,力学规律的描述要借助这些直接测量量,按理说自然要和参考系相关。但是经验告诉我们,虽然车站和火车是相对运动的,但是车站里的牛顿定律和匀速火车里的牛顿定律,乃至人造卫星满足的牛顿定律,是同一套牛顿定律,也就是说牛顿力学规律和参考系(惯性系)的选择没啥大联系(测量精度之内)。况且笔者在高中二时代学物理总会有一个不自觉的观念——相对宇宙运动,加之当时比较懒,不爱验证参考系相关的问题,会觉得“力学定律如果在不同参考系不一样的话,那就拿大宇宙作参考系,宇宙是唯一的总参考系”,其实这种想法正是学习狭义相对论的最大阻碍。

扯远了,回到中心问题来。我们已经用直接测量量表示了力学方程,并且知道参考系之间的坐标变换正是针对【位置和时间】这组直接测量量的。如此,协变的含义已是呼之欲出:

(私货)定义:在参考系A中,方程H(x,t)=0是成立的。如果换参考系B观测,方程左边的表式就变成H(x’,t’)。如果等号依然成立,那么就称“方程H(x,t)=0在【变换A到B】下协变”。如果某个间接测量量G的定义式在【变换A到B】下协变,那么称该测量量为“协变量”

物理阐释:如果在参考系A中的力学规律同样可以不变形地用于参考系B,那么称这个力学规律协变。如果某个间接测量量(不一定是实数,可能是矢量,张量等数学对象)在参考系A和B(A不同于B)中都相等,那么该间接测量量为协变量。这个协变的定义未涉及何种时空观下的何种变换,是个不局限于物理学的普遍意义上的概念。

以上内容私货较多,有些是笔者心血来潮即兴而作,未考虑其严谨性和正确性。楼主无比期待读者的批评指正,当然是有来有往的那种。

,