矩阵力学的诞生 —— 从旧量子论到量子力学

本文同时作为北京大学《量子力学讨论班》课程论文提交。转载请注明出处。

矩阵力学是量子力学的一种表述形式,由海森堡、玻恩和约尔当于 1925 年完成。矩阵力学的思想出发点是玻尔原子模型中许多观点,例如电子的轨道,并不是可观测量。海森堡计划创造一个理论,只用实验中经常接触到的光谱线的频率、强度等物理量,完成对于系统动力学的描述。本文跟随海森堡的思路,对矩阵力学的发展过程进行了深入研究。

引言

19 世纪末,对于原子光谱学的研究取得了很大的进展,并产生了一些经验公式。其中有一条里兹组合规则(Ritz combination principle),其内容为:对光谱中的一条频率为的谱线,总是可以找到两个正整数与之对应;倘若存在对应的谱线,那么可以给出的值为

并且,这个原子的光谱中,也一定包含频率为的谱线。特别地,若,那么有

从物理意义上来说,此过程的初末状态相同,即,那么里兹组合规则将蕴含的对称性。

对于氢原子这一最基础的情况,莱曼(Lyman)线系、巴耳末(Balmer)线系、里兹 - 帕申(Ritz-Paschen)线系等光谱线系被相继发现,它们的频率都满足里兹组合规则。1889 年,瑞典物理学家里德伯(Rydberg)提出了表示氢原子谱线的经验公式:

其中被称为里德伯常数。这一公式现在被称为里德伯 - 里兹公式(Rydberg formula),它为玻尔提出氢原子模型提供了灵感。

旧量子论

所谓「旧量子论」,指的是诞生于 20 世纪初期的一系列量子理论,包括普朗克黑体辐射理论和玻尔氢原子模型。开尔文勋爵(Lord Kelvin)所提出的著名的「两朵乌云」说 \footnote {1900 年 4 月 27 日,开尔文勋爵给英国皇家研究院做了一个广为人知的演讲,题为《覆盖热量和光线的动力学理论的十九世纪的乌云》(Nineteenth-Century Clouds over the Dynamical Theory of Heat and Light)。},就包含将经典统计物理中的能均分定理应用于黑体辐射时出现的「紫外灾难」问题。普朗克最终通过数学技巧给出了能够拟合维恩公式(Wien's displacement law)和瑞利 - 金斯公式(Rayleigh–Jeans law)的黑体辐射定律,解决了这一问题,并通过研究其物理意义,提出了普朗克量子化条件,那就是

普朗克的能量量子化假说,揭开了量子理论的序幕。1913 年,玻尔(Bohr)在他的导师卢瑟福(Rutherford)的研究基础上,提出了著名的玻尔氢原子模型。这一模型引入了一些重要的假说:

  • 一个是「轨道」的概念,也就是说核外电子是在特定的轨道中运动,并且这样的运动是稳定的;\footnote {这一假说是为了解决经典电动力学理论中,电子会因为作加速运动时的电磁辐射失去能量,最终落到原子核中的问题。需要注意的是,玻尔的「轨道」思想与后来量子力学中「定态」的概念还有一定差距。}
  • 另一个是「跃迁」,电子从一个轨道到另一个轨道,将会吸收或发射光子,频率满足

这一套理论的推导还利用了所谓的对应原理,即在普朗克常数趋于 0,或者量子数趋于无穷时,量子体系的行为将会趋于经典体系。换言之,当量子数足够大时,氢原子可以看成电子围绕质子作圆周运动的朴素的经典模型。玻尔由此给出了轨道能量的表达式

并且,给出了一个推论,那就是角动量量子化条件

1916 年,索末菲(Sommerfeld)推广了这一条件,为 \footnote {可见玻尔的角动量量子化条件正是索末菲量子化条件的特殊情况,对角度环路积分得到的体现为。}

以上就是旧量子论的主要内容,它解决了氢原子光谱的波长问题,从理论上给出了里德伯常数的表达式。通过不同的实验方法给出的普朗克常数的值在误差范围内是相同的,这给了物理学者们强大的信心。但是,仍有许多问题无法通过旧量子论解决。例如,不同的谱线有强有弱,谱线强度表现的是发生某种跃迁的概率,但旧量子论无法给出理论研究。再如,玻尔的氢原子模型对类氢离子取得了成功,对于离子光谱的计算与毕克林(Pickering)线系吻合;但是对于多电子体系,或者存在外磁场的情况,就束手无策。

旧量子论所面临的这些巨大的局限性,必须依靠新的理论才能解决。

矩阵力学

1923 年,海森堡(Heissenberg)师从玻恩(Born),他的研究课题是从可观测量出发,建立一套普适的理论。在这样一个年代,原子光谱是探究微观世界的主要方式。海森堡认为,玻尔氢原子理论中的「轨道」本身无法被实验所证实,实验观察到的光谱全都是「跃迁」过程产生的。也就是说,可观测量与两个状态相关,而「轨道」概念则应当被抛弃。

而海森堡如何获得了矩阵力学的灵感?这一故事传得神乎其神。有说法是,1925 年夏天,他因患上花粉热在黑尔戈兰岛(Helgoland)上修养,一天凌晨他突然意识到了在对量子体系的描述中,物理量应当用一个方阵来表示;这一新奇的思想使他夜不能寐。在海边等待日出后,海森堡记录下了有关的想法。\cite {historical1982} 最终有关的工作一共诞生了三篇文章:

  • 《Über quantentheoretische Umdeutung kinematischer und mechaniseher Beziehungen》,作者为海森堡,提出了矩阵力学所具有的形式;\cite {heisenberg1985quantentheoretische}
  • 《Zur Quantenmechanik》,作者为玻恩和约尔当(Jordan),给出了对易关系;\cite {born1925quantenmechanik}
  • 《Zur Quantenmechanik. II》,为以上三人合作,是一篇矩阵力学的综述。\cite {born1926quantenmechanik}

在一些教科书或量子力学历史书中,这三篇文章根据作者数量,也被分别称为一人论文、二人论文和三人论文。

狄拉克在这年年底发表的文章《The Fundamental Equations of Quantum Mechanics》则被视为对海森堡矩阵力学的补充,给出了对于对易关系更普适的证明。\cite {dirac1925fundamental}

接下来我们以海森堡的一人论文出发,探寻矩阵力学建立的思路。玻尔氢原子模型中,通过「轨道」的概念消除了电磁辐射的影响。而跃迁发出的光子同样是一种电磁辐射。海森堡从这一点出发,在经典电动力学中,辐射功率为

对于一个动力学系统,将坐标作傅里叶展开,得到

求二阶导数,得到

其中量子数为的项对应的系数为

代入得到

另一方面,辐射功率的物理意义是:一次跃迁产生的能量与单位时间内发生跃迁的概率的乘积,即

海森堡原文中的符号,表现的物理意义是两个态之间的跃迁,即

由此我们得到了跃迁概率

联想到此前给出的里兹组合规则,将其作为求和规则,与矩阵乘法是等价的。因此,将物理量 A 写为一个矩阵的形式,将得到一套自洽的理论。

根据海森堡的设想,每一个动力学变量都应由一个矩阵表示,而可观测量则是这些矩阵元,每一个矩阵元都和两个态有关。这便是矩阵力学的雏形。\cite {doi:10.1119/1.1775243}

对易关系

一个自然的问题是,在许多情况下,我们需要计算物理量之间的乘积。例如,动能可以写为。然而,矩阵乘法往往存在不对易性,运算规则势必与经典力学不同。最简单地,在氢原子中,电子的坐标可以写作

而相应的动量则为

将对易子定义为

显然没有理由认为其值为零。

海森堡最初并没有解决这一问题。玻恩继续了他的推导,这里需要先证明一个引理。利用有:

根据索末菲量子化条件和对应原理,这等价于

另一方面,通过考虑的矩阵元,玻恩敏锐地发现由于对称性,这是一个对角矩阵,非对角元全部为 0。而对角元可以写为:

前面我们说到,根据里兹组合规则,有,这对应着

可见的第一项可以写为

第二项同理,最终我们得到

比较,得到了这个特殊情况下的结果

换言之

今天这一对易关系被称为量子力学的基本方程式。

狄拉克对对易关系的证明则是从分析力学出发的,借助于柏松括号

和对应原理

同样可以证明系数

总结

矩阵力学无疑是成功的,许多旧量子论所无法研究的问题都通过这一新理论得到解决。要说有什么遗憾,那就是在一年后的 1926 年,薛定谔(Schrödinger)提出的波动力学获得了物理学者们的青睐,而矩阵力学则受到了冷落。毕竟,在那个年代之前,线性代数并不普遍地被物理学研究使用,只在解线性方程组,例如简正模式时需要。就连海森堡自己,一开始也不知道这样的形式被称为「矩阵」,是一个已经被数学家们熟知的工具。

随着薛定谔和冯・诺伊曼(John von Neumann)证明了波动力学和矩阵力学的数学等价性,现代量子力学的体系也从此建立起来。