原子中的电子

86 分钟阅读

封面图:SARS-CoV-2病毒(黄色)在实验室培养的细胞(粉红色)表面的扫描电子显微镜图像。由NIAID落基山实验室拍摄并后期上色。电子显微镜利用了电子的波动性质,能得到远超光学显微镜分辨率的图像。/©NIAID CC BY 2.0

十九世纪末,以经典力学、经典热力学、经典电动力学(电磁场、麦克斯韦方程组)为主要的物理学形成了完整的科学体系,可以解释自然界中几乎所有的物理现象。有些科学家认为物理已经发展到尽头,剩下的事情就是将物理定律应用到化学、生物等领域。

但仍有少数问题还未解决,威廉·汤姆孙在1900年的一次会议上提到,运动论仍有两片乌云存在。随着这两片乌云的消散,物理的研究并未结束,反而预示着近代物理的开始。在本章我们将了解到,原子和分子层次的现象无法用经典物理学解释。本章将通过电磁辐射与物质的相互作用来引入原子的结构,并使用量子理论来描述电子,即电子的量子数、波函数等。这些内容会在之后的章节再次提到,并用于解释元素的物理、化学性质,以及分子的结构。

8.1 电磁辐射

电磁辐射(electromagnetic radiation)是一种能量传递形式,电场和磁场同步振荡形成电磁波(electromagnetic wave)。波是一种动态的扰动,我们说话的时候,声波以空气为介质传播。而电磁波的传播不需要介质,可以在真空中传播。海浪一波波地冲刷着海岸线,坐过船的人都经历过波浪运动。波浪在海面上移动,交替地抬起或放下船只。

boat-wave 船航行在海上,随着海浪上下浮动。/©Peng Luyao

尽管我们更熟悉水波,但另一个例子更为简单——绳中的行波。想象一下,将一根长绳子的一端系在一根柱子上,然后将另一端握在手中。当你上下移动手中的绳子时,会甩出一个波并向前移动。如果在绳子上某处做个标记,该标记会在波通过时上下移动。

相对于原始位置,该标记会向上、向下移动一定距离。波的最高处称为波峰,最低处称为波谷。波峰和波谷的高度差称为振幅(amplitude)。两个连续的波峰或波谷之间的距离称为波长(wave length),用希腊字母λ (lambda)表示。

rope-wave 我们以绳中的行波为例来了解波的性质,尽管看起来波在向右移动,但红点标记的位置在这个过程中只是上下移动。波峰和波谷之间的高度差称为振幅,手摆动幅度越大,振幅也就越大。两个连续的波峰或波谷之间的距离为波长,请读者自行在图中标记出波长的距离。 rope-wave 我们以绳中的行波为例来了解波的性质,尽管看起来波在向右移动,但红点标记的位置在这个过程中只是上下移动。波峰和波谷之间的高度差称为振幅,手摆动幅度越大,振幅也就越大。两个连续的波峰或波谷之间的距离为波长,请读者自行在图中标记出波长的距离。

波的另一个重要特征是频率(frequency),用希腊字母ν (nu)表示。频率是每单位时间通过某给定点的波峰或波谷的数量。频率的单位是每时间,通常是s−1(每秒),表示每秒重复事件的发生次数。波长和频率的乘积表示波在单位时间内传递的距离,即波的速度。如果上图中的波长为1 m,手每秒上下运动3次,那么波速就是3 m s−1

我们无法像绳中的行波那样看到电磁波,但可以将电磁波表示为下图所示的图形。电场是带电粒子附近的物理场,进入电场的带电粒子会受到作用力。磁场存在于磁铁附近,磁场中的运动电荷受到垂直于其自身速度和磁场的力。詹姆斯·克拉克·麦克斯韦(James Clerk Maxwell, 1831-1879)在1865年发表的论文《电磁场的动力学理论》中预测了电磁波的存在,他认为带电粒子发生速度变化会产生电磁波,且电磁波和可见光是同一种现象。电磁波被海因里希·赫兹(Heinrich Hertz, 1857-1894)所证实。无线电波是我们很熟悉的一种电磁波,可通过专门设计的电路中的电流振荡而产生。可见光是另一种形式的电磁辐射,是由于原子或分子中的电子的速度变化而发出的。

electromagnetic-wave 电磁波由相互垂直的同步震荡电场和磁场组成,$E$表示电场,$B$表示磁场。 electromagnetic-wave 电磁波由相互垂直的同步震荡电场和磁场组成,$E$表示电场,$B$表示磁场。

电磁辐射的频率、波长和速度

频率的单位可以是s−1,在SI单位制中称为赫兹(Hz)。波长的基本单位是米(m)。由于很多电磁辐射拥有很高的频率或很短的波长,因此也用一些其他的单位。常用来表示无线电波的频率单位包括MHz、GHz、THz,而长度单位包括cm、μm、nm。

麦克斯韦推断可见光也是电磁辐射,因为电磁波的传播速度和光速相同。这是电磁波的一个重要特征,真空中的电磁波速度恒为2.997 924 58×108 m s−1,也被称为光速(speed of light),符号为$c$。光速和电磁波的频率、波长之间的关系为:

$$c=\nu\times\lambda$$

下图展示了一些常见的电磁辐射的名称,以及它们的波长和频率范围。显然,如果一个波的波长越长,那么其频率越低。

electromagnetic-spectrum 电磁波谱图,可见光在整个电磁波谱中只占一小部分。最下面的部分单独展示了可见光区域的颜色,从左至右分别是紫、蓝、绿、黄、橙、红。 electromagnetic-spectrum 电磁波谱图,可见光在整个电磁波谱中只占一小部分。最下面的部分单独展示了可见光区域的颜色,从左至右分别是紫、蓝、绿、黄、橙、红。

例题

以前路灯常使用钠蒸气灯,发出特征的黄色光线,波长为589 nm,该光的频率是多少?

解答

根据公式,$\nu=\frac{c}{\lambda}$ = 2.998×108 ÷ (5.89×10−7) = 5.09×1014 Hz。

练习

无线WiFi常常工作在5.2 GHz下,计算该频率的电磁波的波长是多少。

干涉和衍射

电磁波有四个最重要的参数:频率、波长、速度以及幅度,现在我们来了解电磁波的一些重要的性质。首先以水波作为例子,如果将两颗鹅卵石同时投入池塘,每块石头的落点都会激起涟漪(水波),涟漪向四周传播。水波有凸起的地方(波峰),也有下凹的地方(波谷),两组水波相交会形成交错的图案。

ripples-wave 俗话说一石激起千层浪,水波是二维平面上传播的波。/©Gerd Altmann

两组水波相遇,有些地方波峰重合,有些地方波谷重合,并产生更高的波峰和更深的波谷。此时我们称这些波是同相的,波的相加称为相长干涉(constructive interference)。若一个波的波峰与另一个波的波谷重合,波相互抵消使得水面不变。此时称这些波是异相的,波的抵消称为相消干涉(destructive interference)。

光盘表面反射出发出彩色的光,是日常生活中常见的干涉现象。如果我们改变光盘和光源的角度,可以看到不同的颜色。光盘的彩色光与衍射有关,衍射(diffraction)是指波遇到障碍后偏离直线传播的现象,波通过与宽度接近于波长的狭缝,会在开口的另一侧形成半圆形的新的波。如果狭缝有多个,每个狭缝产生的半圆波之间会发生干涉,就像同时往水中投入两粒石子一样。白光发生干涉现象时,不同颜色的波长明暗相间的间隔不同,从而产生彩色的干涉图案。

cd-diffraction 数据信息通过微小的凹槽刻在光盘的背面,这些凹槽相当于光栅。不同波长的光被光栅反射的时候产生相位差,导致一些颜色抵消一些颜色加深,从而呈现彩色。/©Hebi B.

折射和色散

任何介质中的光速都低于真空中的光速,不同介质中的光速也不同,不同波长的光在相同介质中的速度也不同。当光从一种介质进入另一种介质中时,光线会发生折射(refraction)从而改变路径。折射的角度与光在两个介质中的速度有关,因此不同波长的光折射的角度也不一样。当一束阳光透过三棱镜时,会被分散成连续的色带,对应可见光区域的红色到紫色区域。类似的,彩虹是阳光被水滴色散所产生的自然现象。

sun-dogs 幻日是一种大气光学现象,是空气中规整的六角形冰晶将阳光折射所产生的光晕。不同波长的光被折射的角度不一样,因此光晕呈现彩虹一样的颜色。/©Peng Luyao

8.2 量子理论的前奏

量子理论的发展是由几个实验驱动的,每个实验都涉及光和物质的相互作用。为了解释这些实验中获得的结果,科学家不得不重新考虑原子尺度上控制粒子行为的物理定律。在本节中,我们将重点介绍其中的一些实验,了解它们是如何引出近代物理的。近代物理的发展无疑是过去100年来最大的科学革命。

黑体辐射

灼热的物体会发出不同颜色的光,电炉中加热丝发出暗红色的光,而灯泡或铁水则产生亮白色光。物体发出的热辐射可被棱镜色散,产生连续的光谱图。研究发现热辐射的强度随波长平滑变化,在某个波长处达到峰值。

metallurgy 融化的铁发出亮白色的光,如果铁水的温度稍低,则发出橙红色的光。/©kepinator

经典物理学无法完全解释热辐射,这种过程被称为黑体辐射(blackbody radiation)。黑体是(理想中)完全不透光不反光的物体,因此黑体发出的辐射完全源于热辐射。瑞利男爵(John William Strutt, 1842-1919)根据经典理论计算得出,发射的辐射强度会随着$\lambda$的减小(或随着$\nu$的增加)而无限增加,如下图的虚线所示。经典物理预测出的黑体辐射公式与实验结果(下图中的实线)在红外区域比较符合,但在短波长区域严重不符,甚至经典理论预计辐射强度随着波长变短变为无穷大。

马克斯·普朗克(Max Planck, 1858-1947)在1900年提出了一个革命性的提议:能量和物质一样,是不连续的。这就是经典物理学与普朗克量子理论之间的本质区别:经典物理学中系统含有的能量是连续的,而量子理论中能量只能是一系列特定的值。任意两个允许的能量之间的差是特定值,被称为能量量子(quantum)。这意味着当能量从一个允许值增加(或减少)到另一个允许值时,它会增加(或减少)一个微小的能量量子。你可以把系统具有的能量看成一堆的原子,系统只能够一份份地获得能量。

blackbody 黑体辐射强度与波长的关系,实线为实验结果。太阳表面的温度约为5750 K,对应的黑体辐射主要在可见光区域(读者可以自行思考这是否是巧合)。虚线为经典物理学预测结果的示意图,经典物理学预测的黑体辐射在长波长区域与实验值吻合,但在短波长区域完全不符——辐射强度随着波长变短变为无穷大。 blackbody 黑体辐射强度与波长的关系,实线为实验结果。太阳表面的温度约为5750 K,对应的黑体辐射主要在可见光区域(读者可以自行思考这是否是巧合)。虚线为经典物理学预测结果的示意图,经典物理学预测的黑体辐射在长波长区域与实验值吻合,但在短波长区域完全不符——辐射强度随着波长变短变为无穷大。

在普朗克模型中,黑体内部假想的共振体一定的幅度振荡,不同共振体振荡的频率可以不同。普朗克认为振子的能量不可以取任意值,也就是振幅只能取一些特定值。他假设振子的能量$\epsilon$与频率$\nu$成比例,比例系数是$h$,用公式表示就是$\epsilon=h\nu$。$h$是普朗克常量(Planck′s constant),值为6.62607×10−34 J s。

在经典物理里面,不同频率振荡的原子对系统所含能量的贡献相同,均为$k_\text{B}T$。有关均分定理的结论你在第六章已经遇到过,气体分子的平动能为$\frac{3}{2}k_\text{B}T$,因为每一个自由度的贡献是$\frac{1}{2}k_\text{B}T$。为何两者会相差一倍?因为谐振子含有动能和势能,谐振子含的动能和势能相等,均为$\frac{1}{2}k_\text{B}T$。我们可以这样粗浅地理解普朗克模型:不同频率振荡的共振体对系统所含能量的贡献假定为$E$。振子的频率不能无限大,至少不能使$h\nu>E$。因此不会出现频率非常高的振子,所以黑体辐射强度不会随着波长变短变为无限大。

普朗克模型使用了假想的共振体对黑体辐射进行解释,自然$\epsilon=h\nu$不能推广到其他应用上。当时的科学家对量子假说普遍持怀疑的态度,普朗克在当时也只认为这是推导出黑体辐射公式的数学技巧。直到人们发现量子理论可以应用在其他物理现象之后,其在物理学中的地位才开始建立。第二个使用量子假说的理论是阿尔伯特·爱因斯坦(Albert Einstein, 1879-1955)在研究光电效应的时间提出的。

光电效应

1887年德国科学家海因里希·赫兹(Heinrich Hertz, 1857-1894)发现当光照射某些金属表面时,电子会从金属表面发射。这种现象称为光电效应(photoelectric effect),这个过程发射的电子称为光电子。光电效应的重要特点是:只有当入射光的频率超过特定阈值$\nu_0$时才有电子发射。而满足条件发射出来的光电子:

  • 光电子数取决于入射光的强度
  • 光电子动能取决于光的频率

上述实验现象,特别是只有超过特定频率的光才能产生光电效应,无法用经典的波动理论来解释。阿尔伯特·爱因斯坦在1905年的一篇论文中提出光量子假设:光由一群离散的能量粒子组成,称为光量子,后来被吉尔伯特·路易斯称为光子(photon)。光子的能量由下式给出:

$$E=h\nu$$

在光的粒子模型中,能量为$h\nu$的光子撞击金属内束缚的电子,电子吸收光子能量。如果光子能量$h\nu$大于将电子从表面移走所需的能量(称为功函数),就会产生一个光电子。因此存在产生光电效应的截止频率,而频率更高的光子所携带的超过功函数的能量,会转化为发射的光电子的动能。功函数由符号$\Phi$表示,根据定义,它是从金属表面移走电子所需的最小能量。

photoelectric-effect 光电效应的实验装置,蓝色的真空室中左右两侧放有金属板,中间是金属网,均用导线连接至外侧。电流计用于检测光电子,电压计和可变电源用于给左侧金属板和金属网之间施加电场。 photoelectric-effect 光电效应的实验装置,蓝色的真空室中左右两侧放有金属板,中间是金属网,均用导线连接至外侧。电流计用于检测光电子,电压计和可变电源用于给左侧金属板和金属网之间施加电场。

考虑上图所示的实验设置,首先关闭可变电源,使用不同波长的光照射左侧的金属板。如果光的频率大于截止频率,光电子将向右离开金属板,穿过金属网到达右侧的金属板,从而被电流计检测到。电流的强度和光强成正比:

photoelectric-intensity 光的频率大于$\nu_0$才能产生光电流。光电流的强度和频率基本无关,而与光照强度成正比。 photoelectric-intensity 光的频率大于$\nu_0$才能产生光电流。光电流的强度和频率基本无关,而与光照强度成正比。

现在打开可变电源,电压表用来测量可变电源的电压。此时左侧金属板和中间的金属网之间会产生电场,电场会阻止电子向右朝金属板运行。固定光的频率不变,当电场足够强时,将没有电子能够到达右侧金属板,此时的电压为停止电压$V_s$。测量不同频率下的停止电压,发现两者呈一次函数关系:

frequency-stopping-voltage 光的频率大于$\nu_0$才能产生光电流。光电流的强度和频率基本无关,而与光照强度成正比。 frequency-stopping-voltage 光的频率大于$\nu_0$才能产生光电流。光电流的强度和频率基本无关,而与光照强度成正比。

越高频率的光照射金属板,需要越强的电压才能阻止光电子跑到右侧。停止电压形成的电场用于减少光电子动能,那么有:

$$\frac{1}{2}mu^2=eV_s$$

实验数据外推的结果表明,若光的频率低于截止频率$\nu_0$,即使不加停止电压,也不会产生电流。而停止电压的经验公式为:$V_s=k(\nu-\nu_0)$,其中$k$是系数,与所使用的金属无关。而$\nu_0$与金属有关。

功函数$\Phi$是从金属表面移走电子所需的最小功,也就是最小的能量。根据爱因斯坦的模型,频率为$\nu_0$的光子的能量刚好足以释放出电子,因此$\Phi=h\nu_0$。功函数也可看成是将电子束缚住的电场,电场电位为$V_0$,因此$\Phi=h\nu_0=eV_0$。若光子频率更高,多余的能量将转换为动能,所以:

$$\frac{1}{2}mu^2+eV_0=h\nu$$

即电子动能+功函数(电子克服的势能)=光的能量。此外$eV_s=\frac{1}{2}mu^2=h\nu-eV_0$,因此$V_s=\frac{h}{e}\nu-V_0$。停止电压经验公式中的$k=\frac{h}{e}$,通过实验可以测定$h$的值。精确的测量表明,爱因斯坦光量子假设中的$h$和普朗克模型中的$h$相同。

例题

波长小于242.4 nm的紫外线才能让氧分子解离,计算单个波长为242.4 nm的光子的能量(以J计),以及1 mol该种光子的能量(以kJ mol−1计)。

解答

根据公式:$E=h\nu=\frac{hc}{\lambda}$ = 6.626×10−34 × 2.998×108 ÷ (242.4×10−9) = 8.192×10−19 J。

每mol光子的能量为8.192×10−19 × 6.022×1023 ÷ 1000 = 493.6 kJ mol−1

练习

叶绿素吸收的光的能量介于3.0×10−19 J到4.4×10−19 J之间,对应的波长、频率和颜色是什么?

原子发射光谱

阳光色散后产生的可见光谱被称为连续光谱(continuous spectrum),太阳光谱可以近似看成5750 K的黑体辐射,黑体辐射中光的波长是连续的。如果光源产生的光具有相对少的波长分量,则观察到不连续光谱。气体放电可以产生不连续光谱,一些金属离子在火焰中也会产生不连续光谱。这些光通常具有特征的颜色,如下图所示:

discontinuous-spectrum 左:氢气(蓝紫)和氖(橘红)填充在玻璃管中,外面缠绕有金属线并通有5000 V的电压。气体放电产生具有特征颜色的辉光。中:钠灯管,发出特征的黄色光芒。右:锂盐的特征焰色反应。/左中:©images-of-elements CC BY 3.0;右:©Peng Luyao

在这些情况下,发射的光谱由有限数量的离散波长分量组成,通过透镜观察会得到一些分立的彩色谱线。这些不连续的光谱被称为原子光谱(atomic spectra)或线谱(line spectra)。氦的线谱如下图所示,光源为放电的低压氦气灯。高压电使氦原子吸收能量,然后以光的形式放出能量。光通过狭缝后被棱镜色散,并在观察屏上被记录。每一个波长分量都会在观察屏上产生一条线,氦在可见光区域产生数条谱线。

atomic-spectrum-helium 氦高压放电发出紫红色的光,通过狭缝后被棱镜色散,在可见光区域产生五条谱线。 atomic-spectrum-helium 氦高压放电发出紫红色的光,通过狭缝后被棱镜色散,在可见光区域产生五条谱线。

每个元素都有自己独特的线谱,可用来区分不同的元素。罗伯特·本生(Robert Bunsen, 1811–1899)和古斯塔夫·基尔霍夫(Gustav Kirchhoff, 1824–1887)发明了第一台分光光谱仪并用它来鉴定元素。1860年他们发现了一种新元素并将其命名为铯(cesium),该词源于拉丁语caesius,意为天蓝色,因为它的光谱中有独特的蓝线。他们在1861年用类似的方式发现了铷(rubidium),源于拉丁语rubidius,意为深红色。另一个通过光谱发现的元素是氦(helium),源于希腊语ἥλιος,意为太阳。它的光谱在1868年的日食期间观察到,但在接下来的27年里,氦从未在地球上分离出来,以至于当时科学家以为氦是只在太阳中才存在的元素。

研究得最深入的原子光谱是氢原子光谱,稀薄的氢气通电发出红紫色的光。光的主要波长分量是656.3 nm的红光,此外还包含486.1 nm的蓝绿色谱线、434.0 nm处的紫色谱线和410.1 nm处的另一条紫色谱线。氢的原子光谱在可见区如下图所示。

spectrum-hydrogen 低压氢气放电产生红紫色的光,被棱镜色散后在可见光区产生四条谱线。 spectrum-hydrogen 低压氢气放电产生红紫色的光,被棱镜色散后在可见光区产生四条谱线。

1885年,约翰·巴耳末(Johann Balmer, 1825-1898)通过反复试验,推导出氢原子线谱波长的公式:

$$\lambda=\frac{Bm^2}{m^2-n^2}$$

方程中$B$是值为364.6 nm的常量,而$m$和$n$是正整数。$n=2$,$m=3$对应红色谱线的波长,$n=2$,$m=4$对应蓝绿色谱线的波长。$n=2$,$m=5$及$m=6$对应紫色的两条谱线。巴耳末公式的重要用途是确认非可见光区域的谱线,例如$n=2$,$m>6$时的紫外谱线,这些谱线在多年前科学家研究白矮星的紫外光谱时就已发现。为纪念巴耳末的贡献,$n=2$的氢原子谱系被称为巴耳末系。巴耳末还推测其他的$n$值也可以产生紫外或红外区域的光谱,实际情况也是如此。

巴耳末方程后来被发现是约翰内斯·里德伯(Johannes Rydberg, 1854-1919)于1888年提出的里德伯公式的一个特例:

$$\frac{1}{\lambda}=\frac{4}{B}\left(\frac{1}{n^2}-\frac{1}{m^2}\right)=R_\text{H}\left(\frac{1}{n^2}-\frac{1}{m^2}\right)$$

$R_\text{H}$是氢原子的里德伯常量,下标H表示是针对氢原子的,其值为1.09678×107 m−1。巴耳末系中谱线的波长是使上述公式中的$n=2$和$m>0$获得的。

原子发射光谱仅由有限数量的明确的谱线组成,这一事实表明气态原子的激发态只有有限数量的能量值。为什么原子的能量被限制在有限数量的能量值上?寻找这个问题的过程不仅为科学家们提供了一个了解原子结构的绝佳机会,还使他们取得了现代科学最伟大的突破之一,即量子理论。

原子光谱的早期尝试:玻尔模型

根据原子核的卢瑟福模型,原子中的电子在原子核外排列。但电子是如何排列的,以及它们的如何运动并不为人所知。如果带负电的电子是静止的,那它就会坠入带正电的原子核。所以原子中的电子一定在运动。如果电子像围绕太阳运行的行星一样围绕原子核运动,会出现问题:根据经典物理学,绕轨道运行的电子不断改变运动方向,速度的改变会对外辐射出电磁波。电子失去能量,导致越来越靠近原子核,最终坠入原子核。1913年尼尔斯·玻尔(Niels Bohr, 1885-1962)提出了如下的几个假设:

  1. 电子在一系列固定的圆形轨道(orbits)中以速度$u$绕原子核运动。只要电子保持在特定的轨道上,原子就是稳定的,不会对外发射能量。每个轨道都具有特定的半径$r$和能量$E$。
  2. 电子的角动量$l=mur$是$h/2\pi$的整数倍,即$l=n(h/2\pi),n=1,2,3\cdots$依此类推。
  3. 当电子从较高能量和较大半径的轨道下降到较低能量和较小半径的轨道时,原子以光子的形式发射能量。

第二个假设引入了整数$n$,将电子的角动量限制为特定值:$(h/2\pi)$、$(h/\pi)$、$(3h/2\pi)$等。整数$n$称为量子数(quantum number),而$l$符合某种量子化条件(quantization condition)。玻尔无法为这些假设提供物理理由,但可通过这些假设推出正确的轨道能量。经过一些推导,玻尔得出能量的公式:

$$E_n=-\frac{R_\text{y}}{n^2},n=1,2,3\cdots$$

其中$R_\text{y}$是一个物理常量,称为里德伯能量,其值为2.17987×10−18 J。根据上述公式:

  • 氢原子的能量是量子化的,即系统的能量只能取特定值:$−R_\text{y}$、$−R_\text{y}/4$、$−R_\text{y}/9$、$−R_\text{y}/16$等。
  • 所有允许的能量值为负。因为我们约定,当电子离开原子核时,即当它离原子核无限远时,系统的能量定义为0。在物理上,$n=\infty$对应于电子脱离原子核的情况。

在下一节,我们将使用玻尔模型来解释氢原子发射光谱的某些特征。玻尔模型对于预测氢原子光谱非常成功,但该模型存在很大问题。首先玻尔模型无法解释多电子原子的光谱,其次该模型是经典物理学和量子化条件的揉杂。从普朗克提出量子(1900)到成熟的量子力学出现(1926),这段时期的量子理论被称为旧量子理论。新的量子理论,也被称为量子力学或量子物理学,取代了旧量子理论。玻尔模型中电子围绕原子核运动的轨道并不存在,量子化是使用量子力学自然产生的,而不是人为假设或规定的。尽管玻尔模型是错误的,但它仍然是一项重要的科学发展,因为它促进了经典物理学向量子物理学的转变。

例题

氢原子中电子的能量可能是−1.00×10−20 J吗?

解答

根据玻尔理论,$n^2=\frac{-R_\text{y}}{E_n}$,解得$n$ = 14.76。不为整数,因此不可能。

练习

氢原子中电子的能量为−4.45×10−20 J,其处在哪个轨道上?

8.3 氢原子的能级、光谱和电离能

通过玻尔理论我们可以计算氢原子允许的能量状态,即能级(energy level)的能量。下图展示了电子是如何在不同能级之间跃迁(transition)并放出能量的。这样的图称为能级图,能级图中的横线表示允许的能级,而箭头表示能级之间的能量差。在本节我们将使用氢原子的能级图来理解原子中的能量量子化。以及电离能的概念——将电子从原子中移走所需的能量。

energy-level-diagram 氢原子的能级图,图中标明了氢原子光谱的两个谱系:莱曼系和巴尔末系。莱曼系是氢原子激发态回到基态所发的光,而巴尔末系是氢原子从$n>2$的能级到$n=2$所发出的。 energy-level-diagram 氢原子的能级图,图中标明了氢原子光谱的两个谱系:莱曼系和巴尔末系。莱曼系是氢原子激发态回到基态所发的光,而巴尔末系是氢原子从$n>2$的能级到$n=2$所发出的。

光谱学和原子线谱

通常氢原子中的电子处于最低能级,即$n=1$。这个最低能级被称为基态(ground state)。当电子获得一个能量量子时,它会跃迁到更高的能级($n=2,3\cdots$),此时原子处于激发态(excited state)。当电子从较高能级下降到较低能级时,会以光的形式释放出两个能级之间的能量差。若较高能级的量子数为$n_\text{i}$,较低能级量子数为$n_\text{f}$,那么释放出的能量:

$$\Delta E=E_\text{f}-E_\text{i}=\frac{-R_\text{y}}{n^2_\text{f}}-\frac{-R_\text{y}}{n^2_\text{i}}=-R_\text{y}\left(\frac{1}{n_\text{f}^2}-\frac{1}{n_\text{i}^2}\right)$$

$\Delta E$是原子能量的变化,其绝对值$|\Delta E|$等于吸收或发射的光子能量,因为光子的所含的能量为正的。也就是说,$h\nu=|E_\text{f}-E_\text{i}|$。

利用上述的方程可以计算氢原子发射光谱的波长。因为能级的能量是特定的,能级之间的能量差也是特定值,发射的光子能量也是如此。

例题

计算氢原子从$n=5$到$n=2$释放出的光子的波长。

解答

$\Delta E=-R_\text{y}\left(\frac{1}{n_\text{f}^2}-\frac{1}{n_\text{i}^2}\right)$ = −2.179×10−18 × (1/4 − 1/25) = −4.576×10−19 J

$\lambda=\frac{hc}{|E|}$ = 6.626×10−34 × 2.998×108 ÷ 4.576×10−19 = 4.341×10−7 m = 434.1 nm

练习

莱曼系中波长最长的谱线的波长是多少?

能量的量化为理解原子的发射及吸收光谱提供了基础。原子集合中的单个原子被激发到原子的各种可能的激发态,激发态的原子通过发射各种频率的光子弛豫(relax)到较低能量的状态,就会产生发射光谱。类似的,白光透过气态的原子,特定波长的光会激发原子到更高的能量状态从而被原子吸收,透过的光谱会产生一系列暗带。氢原子的发射和吸收光谱如下图所示:

emi-abs-spectrum 氢原子的发射和吸收光谱,发射谱线和吸收谱线具有相同的波长,因为发射和吸收过程的能量差是特定的。 emi-abs-spectrum 氢原子的发射和吸收光谱,发射谱线和吸收谱线具有相同的波长,因为发射和吸收过程的能量差是特定的。

发射光谱或吸收光谱理论上都能获得系统能级能量的信息。选择使用哪种技术取决于其他因素,例如若样品包含的原子数量相对较少,发射光谱法是首选的技术,因为它具有更高的灵敏度。因为在暗色背景上检测非常暗的线比在亮背景上检测微弱的暗线更容易。如果不考虑灵敏度,那么吸收光谱是首选技术。发射光谱的样品包含处于各种激发态的原子,每个激发态通常都能产生数个发射谱线。吸收光谱通常不如发射光谱复杂,因为吸收光谱的样品通常是冷的,基本只会发生基态到激发态的吸收,所以低温下的氢原子吸收光谱在可见区是没有吸收的。

氢和类氢离子的电离能

现在考虑将基态氢原子$n=1$的电子移走所需的能量,电子被移除时$E=0$。因此基态氢原子的电离能$E_\text{i}$就是$R_\text{y}$。玻尔理论还可以用来计算类氢原子的电离能,类氢原子是和氢原子一样,原子核外只有一个电子的原子(或离子),He+、Li2+就是类氢原子。类氢原子的轨道能量为:

$$E_n=-\frac{Z^2R_\text{y}}{n^2},n=1,2,3\cdots$$

其中$Z$是核电荷数。因为核电荷会影响轨道半径,相同半径下核电荷越大与电子的作用也越强,因此能量与$Z^2$成正比。

例题

用一个频率为5.000×1016 Hz的光子电离基态的Li2+离子,计算电离出来的电子的速度。

解答

光子的能量$E=h\nu$ = 3.313×10−17 J。Li2+的电离能$E_\text{i}=Z^2R_\text{y}$ = 9 × 2.179×10−18 = 1.961×10−17 J。因此电子的动能为1.352×10−17 J,速度为5.448×106 m s−1

练习

计算Be3+从$n=3$落到$n=2$,放出的光子的波长。

8.4 引出量子力学的两个想法

上一节指出原子光谱的解释给经典物理学带来了难题,玻尔在氢原子发射光谱方面取得了一些成功。但他的模型是不正确,他无法解释氢原子发射光谱的所有特征(光谱的精细结构),也无法解释多电子原子的光谱。在玻尔研究氢原子光谱的大约十年后,两个具有里程碑意义的想法引出了一种新的量子力学方法。本节将讲述这两个想法,下一节将讲述新的量子力学——波动力学。

波粒二象性

为了解释光电效应,爱因斯坦提出光具有类似粒子的性质,表现为一个个光子。但光的一些其他性质,例如光被棱镜色散,最好用光的波动性来理解。所以光似乎具有双重性质。

1924年,路易斯·德布罗意(Louis de Broglie, 1892-1987)考虑到光和物质的性质,提出了一个惊人的想法:小颗粒的物质有时可能表现出波的特性

继续从爱因斯坦的光量子假设说起。若粒子的质量为$m$,速度为$u$,那它的动能$E_\text{k}=\frac{1}{2}mu^2$,动量$p=mu$。光子也带有动能和动量,但它不像『正常』的粒子一样具有质量。一个不具有质量的物体是如何拥有动量和动能的?答案在爱因斯坦提出的狭义相对论(special relativity)中,他推导出了如下的表达式:

$$E^2=(pc)^2+(m_0c^2)^2$$

其中$c$是光速,$m_0$是静质量。光子的静质量为0,因此$E=pc$,所以光子的动量$p=\frac{E}{c}=\frac{h\nu}{c}=\frac{h}{\lambda}$。这一关系也应该适用于质量为$m$,速度为$u$的物质粒子。物质粒子的动量为$mu$,因此有:

$$\lambda=\frac{h}{p}=\frac{h}{mu}$$

这就是德布罗意提出的著名公式,他把这种波称为相位波。这是个含糊不清的名称,他也未对其进行物理解释,而是希望将其视为『一个物理内容尚未完全确定的方案』。这种波现在被称为物质波(mater wave),或德布罗意波。物质也可表现出波的特性,同时具有两种特性的现象称为波粒二象性(wave–particle duality)。X射线是波长约为100 pm的高能光子,并能被晶体中规整的原子衍射(产生相长干涉和相消干涉)。若电子以一定速度运动,物质波的波长和X射线接近,也可以被晶体所衍射。

1927年克林顿·戴维森(Clinton Davisson, 1881-1958)和雷斯特·革末(Lester Germer, 1896-1971)通过实验证明了慢电子束能被镍晶体衍射。同年的另一个实验中,乔治·汤姆孙(George Paget Thomson, 1892-1975)将电子束射向薄金属铝箔,获得了与X射线相同的电子衍射图。乔治·汤姆孙和戴维森因他们的电子衍射实验共同获得了1937年的诺贝尔奖。值得一提的是,乔治·汤姆孙是约瑟夫·汤姆孙的儿子,约瑟夫·汤姆孙因发现电子获得了1906年的诺贝尔奖。

注意,只有当物质波在原子尺度下才较为重要。汽车、棒球等宏观物体的物质波太短,不会表现出波动性,经典物理定律仍然适用。

例题

速度为光速十分之一的电子的物质波波长是多少?

解答

代入公式,$\lambda=\frac{h}{mu}$ = 6.626×10−19 ÷ 9.109×10−31 ÷ 3.00×107 = 2.42×10−11 m = 24.2 pm。

练习

物质波波长10.0 pm的质子运动速度多快?

不确定性原理

经典物理学定律允许我们做出精确的预测,例如弹道导弹发射后的着陆点是确定的。尽管导弹飞行过程受到多个变量的影响(重力、阻力、地球自转等),但只要这些变量能精确测得,就能获得更为精确的落地点。经典物理学中没有偶然,一切都是可以被预测的。

但20世纪20年代,尼尔斯·玻尔和维尔纳·海森堡(Werner Heisenberg, 1901-1976)进行了一个思想实验,以确定如何精确获得亚原子粒子的行为。亚原子粒子的状态可通过位置$x$和动量$p$进行描述。他们得出结论:位置和动量不能同时被精确测定,位置不确定性$\Delta x$和动量不确定性$\Delta p$的乘积大于$h/4\pi$:

$$\Delta x \Delta p\geq\frac{h}{4\pi}$$

这一表达式称为海森堡不确定性原理(Heisenberg uncertainty principle),也就是说,能高度确定粒子位置的实验不能精确测量粒子的动量,反之亦然。或者说,如果我们知道粒子在哪,就不知道粒子来自哪或去哪。在亚原子尺度上,事物是『模糊的』。

一种简单的解释是将粒子设想成不同德布罗意波长的物质波的叠加,如下图所示。不同波长的叠加会产生干涉图样,称为波包。物质波波长越短,其动量越大(因为$\lambda=\frac{h}{p}$)。而粒子的位置越精确,波包的宽度越窄。如果要更加精确地描述粒子的位置,那么需要使用更多不同动量的物质波进行叠加,动量也就越不确定,反之亦然。

uncertainty-principle-wave 一系列不同波长的波(左)叠加后产生波包(右)。波长的叠加使得波包具有平均波长$\lambda_\text{av}$以及更确定的位置$\Delta x$。 uncertainty-principle-wave 一系列不同波长的波(左)叠加后产生波包(右)。波长的叠加使得波包具有平均波长$\lambda_\text{av}$以及更确定的位置$\Delta x$。

波粒二象性的概念和海森堡不确定性原理对描述微观粒子的行为有深远的影响。电子既不是单纯的粒子也不是单纯的波,而是兼而有之。此外粒子的某些行为越确定,另一些行为就越不确定。下一节我们将用现代量子力学的眼光来了解微观粒子。

例题

阴极射线管产生能量为12 keV的电子(1 eV = 1.6×10−19 J),假设其速度的不确定度为1.5%,计算位置的不确定度。

解答

$E=\frac{1}{2}mu^2$,电子速度为2.05×106 m s−1。速度不确定度$\Delta u$ = 3.1×104 m s−1,动量不确定度$\Delta p=m\Delta u$ = 2.8×10−26 kg m s−1。$\Delta x\geq\frac{h}{4\pi\Delta p}$ = 1.9×10−9 m = 1.9 nm。

练习

质子束位置的不确定度为24 nm,其速度的不确定度是多少?

8.5 波动力学

德布罗意关系式表明电子具有波动性,因此可以使用波动方程来描述。如何用现代量子力学来理解原子中的电子?首先来看两种类型的波。

驻波

往水平如镜的湖泊投入一颗石子,圆形的水波四散,并能传播很远的距离。这样的波称为行波(traveling wave),用手摆动绳子产生的波也是行波。而琴弦的振动中可以看到另一种形式的波,如下图左侧所示。

standing-wave 长度为$L$的琴弦两端被固定,琴弦两端振幅为0。琴弦的振动模式有多种可能,但$2L$一定是波长的整数倍,否则不满足两端振幅为0的条件。类似的,圆形轨道中的驻波也需要满足$\pi r$是波长整数倍的条件。 standing-wave 长度为$L$的琴弦两端被固定,琴弦两端振幅为0。琴弦的振动模式有多种可能,但$2L$一定是波长的整数倍,否则不满足两端振幅为0的条件。类似的,圆形轨道中的驻波也需要满足$\pi r$是波长整数倍的条件。

拨动琴弦,弦各段随着时间变化上下位移,但不会超过蓝色曲线的范围。位移在固定琴弦的两端为0,而在琴弦中间也有可能出现幅度为0的位置。这些点被称为节点(node),节点处的琴弦不会发生位移。具有这种性质的波称为驻波(standing wave)。如果琴弦的长度为$L$,那么驻波的波长满足如下关系:

$$\lambda=\frac{2L}{n},n=1,2,3,\cdots$$

小提琴弦可以用一维驻波表示。类似的,圆形轨道中的电子也可以用驻波表示,如上图右侧所示。$\pi r$一定是波长的整数倍,否则将不能形成驻波。尽管该模型结合了电子的粒子性和波动性,但并不能描述氢原子中的电子。因为氢原子中的电子在三维空间中运动。

箱中粒子:驻波和波函数

1927年,波动理论专家埃尔温·薛定谔(Erwin Schrödinger, 1887-1961)提出,表现出波特性的电子(或任何其他粒子)应该可以用称为波函数(wave function)的数学方程来描述。波函数的符号是希腊字母$\psi$(psi),最简单的可写出波函数的系统是一维系统。该系统可看成有一个粒子被限制在一维箱子中。箱中粒子的波函数看起来像琴弦上的驻波,但它现在表示粒子的物质波。由于粒子被限制在箱子里,波也必须在箱子里。粒子的波函数如下图所示:

one-dimensional-box-dark $n=1,2,3$时的波函数图形,位置高低表示能量高低。 one-dimensional-box $n=1,2,3$时的波函数图形,位置高低表示能量高低。

如果箱子的长度为$L$,粒子只能沿$x$方向运动,则驻波的方程为:

$$\psi_n (x)=\sqrt{\frac{2}{L}}\sin\left(\frac{n\pi x}{L}\right)$$

其中$n$是量子数,取正整数。函数如上图所示,以$n=2$时的波函数($\psi_2$)为例:$\psi_2 (x)=\sqrt{\frac{2}{L}}\sin\left(\frac{2\pi x}{L}\right)$。显然这是一个正弦函数,当$x=0,\frac{L}{2},L$的时候,函数的值为0。

而$x=\frac{L}{4}$时,函数取到最大值$\sqrt{\frac{2}{L}}$,$x=\frac{3L}{4}$时,函数取到最小值$-\sqrt{\frac{2}{L}}$。

波函数能提供哪些有关电子状态的信息?首先考虑电子的动能,根据经典力学,动能为:

$$E_\text{k}=\frac{1}{2}mu^2=\frac{p^2}{2m}$$

现在将动能和波长联系起来,代入德布罗意关系式$\lambda=h/p$,可以得到:

$$E_\text{k}=\frac{h^2}{2m\lambda^2}$$

物质波的波长必须符合驻波条件,即波长等于$2L$的整数分之一。代入上述方程,得到:

$$E_\text{k}=\frac{h^2}{2m(2L/n)^2}=\frac{n^2h^2}{8mL^2}$$

因为电子在箱子中的波函数必须满足驻波条件(边界条件,即箱壁的波函数值为0),所以能量是量子化的,允许值由量子数$n$决定。此外若箱子大小变短,粒子的动能增加。这是符合不确定性原理的:越短的箱子大小意味着越确定的位置,所以动量越难以确定。最后值得注意的一点是,粒子的能量不能为零。$n=1$对应最低可能的能量称为零点能。因为零点能不为零,粒子不会静止。这也符合不确定性原理,因为位置和动量都必须是不确定的,静止的粒子没有任何不确定性。

波函数的玻恩诠释

箱中粒子模型帮助我们了解到能量量子化的起源——边界条件。但我们如何理解波函数?1926年德国物理学家马克斯·玻恩(Max Born, 1882-1970)给出了答案。根据玻恩的观点,波动力学不能回答『粒子的精确位置是什么?』这一问题。但可以告诉我们『在指定的空间体积内找到粒子的概率是多少?』。玻恩认为概率与$\psi^2$有关,而不是$\psi$本身的值。

在小空间中找到粒子的概率是波函数的平方$\psi^2$与该空间的体积的乘积。因此$\psi^2$被称为概率密度。

现在回到一个被约束在一维箱子中的粒子上,其波函数的平方如下图所示:

one-dimensional-probability $n=1,2,3$时的概率密度图形,位置高低表示能量高低。 one-dimensional-probability $n=1,2,3$时的概率密度图形,位置高低表示能量高低。

首先注意到,概率密度一定是非负的。仔细观察$n=1$的波函数的概率密度,$\psi^2$的最大值位于箱子的中心,粒子最有可能在中心区域发现。$n=2$时的概率密度表明粒子最有可能在箱子的中心与箱壁之间发现,而在箱子中心处发现电子的概率为0。

例题

长150 pm的一维箱子内有一个$n=5$的电子,在箱子的0~30 pm处发现电子的概率是多少?

解答

$n=5$意味着概率密度函数图像有五个凸起,因此在0~30 pm处发现电子的概率为20%。

练习

长150 pm的一维箱子内有一个$n=6$的电子,在箱子的50~75 pm处发现电子的概率是多少?

例题

长100 pm的一维箱子内有一个电子,电子从$n=2$落到$n=1$,放出多少波长的光子?

解答

计算能级的能量差:$\Delta E=\frac{h^2}{8mL^2}\left(2^2-1^2\right)$ = 1.81×10−17 J。因此波长$\lambda=\frac{hc}{\Delta E}$ = 1.10×10−8 m = 11.0 nm。

练习

一维箱子中的电子从第一激发态回到基态,放出24.9 nm的光。计算箱子长度。

现在将箱中粒子模型拓展到三维空间中,在这种情况下,粒子可以在三个方向$x$、$y$和$z$上移动,粒子的能量由以下表达式描述:

$$E_\text{k}=\frac{h^2}{8m}\left[\frac{n_x^2}{L_x^2}+\frac{n_y^2}{L_y^2}+\frac{n_z^2}{L_z^2}\right]$$

每一个维度都有一个量子数,因此三维系统需要三个量子数。有了这些箱中粒子的想法,我们再来考虑如何用量子力学方法思考氢原子。

8.6 氢原子的量子理论

氢原子是由电子与原子核组成的简单系统。这个简单的模型是化学中最重要的模型之一,因为它为理解多电子原子、元素周期表中元素的排列以及元素及其化合物的物理和化学性质提供了基础。

开始之前再来回顾一下上节中的一些关键思想。如果一个粒子被限制在一维箱子里(存在边界条件),粒子的能量就是量子化的——粒子只能拥有一定量的能量。粒子的各个状态与量子数$n$有关,$n$决定量波函数$\psi_n$,而波函数可以告诉我们有关粒子状态的信息。波函数为$\psi_n$的箱中粒子有$n-1$个节点,节点数与状态的能量有关:节点越多能量越高。

箱中粒子如何帮助我们理解氢原子?氢原子中的电子也受到约束,但和箱子的刚性壁不一样。电子被原子核吸引,我们可以认为这种引力也是一种『限制』,那么电子能量是量子化的也就不足为奇了。限制条件不一样,原子中电子的能量也与箱中粒子不同,但都是限制为某些特殊值的。此外还可以预计原子中电子的状态也是量子数决定的,并可通过波函数来描述。

薛定谔方程

1927年,埃尔温·薛定谔提出了一个包含电子的粒子性质和波动性质的氢原子方程:薛定谔方程(Schrödinger equation)。薛定谔方程是一个波动方程,通过求解薛定谔方程可以获得描述量子力学系统所需的量子数和波函数。求解薛定谔方程是一个复杂的过程,我们不要求你现在就掌握详细过程,但需要使用前面部分介绍的想法来描述和解释该方法。氢原子的薛定谔方程如下:

$$-\frac{h^2}{8\pi^2m_e}\left(\frac{\partial^2\psi}{\partial x^2}+\frac{\partial^2\psi}{\partial y^2}+\frac{\partial^2\psi}{\partial z^2}\right)-\frac{Ze^2}{4\pi\varepsilon_0 r}\psi=E\psi$$

$\psi$是电子的波函数,函数的自变量为电子的位置。$\partial$符号是偏微分,其与求导符号$\text{d}$类似。$\frac{\partial^2\psi}{\partial x^2}$的意思就是对$\psi$求两次$x$方向的偏导。

等号左侧左边的部分$-\frac{h^2}{8\pi^2m_e}\left(\frac{\partial^2\psi}{\partial x^2}+\frac{\partial^2\psi}{\partial y^2}+\frac{\partial^2\psi}{\partial z^2}\right)$表示电子的动能部分,右侧$-\frac{Ze^2}{4\pi\varepsilon_0 r}\psi$表示电子的势能部分。$E$是电子的能量,也就是说电子能量由动能和势能共同决定。

电子距离原子的核位置需要三个变量来描述。在通常的笛卡尔坐标系中,这三个变量是$x$、$y$和$z$三个方向。而在球坐标系中,它们是:$r$,即电子到原子核的距离;角度$\theta$,描述电子到原子核的连线$r$相对于$z$的方向;以及$\varphi$,描述$r$相对于$x$的方向。

polar-coordinate 笛卡尔(直角)坐标系到球坐标系的转换。 polar-coordinate 笛卡尔(直角)坐标系到球坐标系的转换。

显而易见,$x$、$y$、$z$和$r$、$\theta$、$\varphi$之间具有如下的关系:

$$ \begin{align} r^2&=x^2+y^2+z^2\\ x&=r\sin\theta\cos\varphi\\ y&=r\sin\theta\sin\varphi\\ z&=r\cos\theta \end{align} $$

在球坐标系中更容易求解薛定谔方程,此时的薛定谔方程为:

$$-\frac{h^2}{8\pi^2\mu r^2}\left[\frac{\partial}{\partial r}\left(r^2\frac{\partial\psi}{\partial r}\right)+\frac{1}{\sin\theta}\frac{\partial}{\partial\theta}\left(\sin\theta\frac{\partial\psi}{\partial\theta}\right)+\frac{1}{\sin^2\theta}\frac{\partial^2\psi}{\partial\varphi^2}\right]-\frac{Ze^2}{4\pi\varepsilon_0 r}\psi=E\psi$$

其中$\mu$是约化质量,$\frac{1}{\mu}=\frac{1}{m_\text{e}}+\frac{1}{m_\text{nuc}}$。通过求解上述方程可获得电子能级能量,和箱中粒子一样,能量由量子数决定:

$$E_n=-\frac{R_\text{H}}{n^2}$$

$n$是主量子数(principal quantum number),它只能取正整数值。而$R_\text{H}$是一个常量,其值为2.17869×10−18 J,你会发现它刚好是波长等于氢原子里德伯常量(1.09678×107 m−1)的光子的能量。薛定谔方程计算出的氢原子能量和实验完美符合,作为对比,玻尔理论推导出的$R_\text{y}$有大约5‰的差异,源于氢原子约化质量和电子质量之间的微小差异。

氢原子薛定谔方程的解不仅给出了能级,还给出了波函数。这些波函数被称为轨道(orbital),以区别于错误的玻尔理论中的轨道(orbit)。这些轨道的数学形式比箱中粒子更复杂,但仍然可以用简单的方式解释它们。

氢原子波函数可以表示为两个因子的乘积:径向因子$R$以及角度因子$Y$。径向因子$R(r)$是只与$r$有关的函数。而角度因子$Y(\theta,\varphi)$是与$\theta$和$\varphi$有关的函数。也就是说:

$$\psi(r,\theta,\varphi)=R(r)Y(\theta,\varphi)$$

径向因子$R(r)$也称为径向波函数,角度因子$Y(\theta,\varphi)$也称为角度波函数。氢原子是一个三维系统,因此每个轨道都有三个量子数来定义。一组特定的量子数决定了$R(r)$和$Y(\theta,\varphi)$的形式,从而决定了$\psi(r,\theta,\varphi)$。我们将使用轨道的各种图形表示来加深我们对原子中电子轨道的理解。

量子数分配

决定轨道的三个量子数都是在解薛定谔方程的时候产生的,只有符合如下要求的量子数才能产生正确的轨道:

首先确定的是主量子数$n$,其决定了轨道的能量。$n$只能取正整数,也就是说:

$$n=1,2,3,4,\cdots$$

其次确定的是轨道角动量量子数(角量子数)$l$,它是非负整数,且取值最大为$n-1$:

$$l=0,1,2,\cdots,n-1$$

最后确定的是磁量子数$m_l$,它是整数,且取值介于$-l$到$l$之间:

$$m_l=-l,\cdots,-1,0,1,\cdots,l$$

例题

一个轨道的量子数能否取如下值:$n=2$,$l=2$,$m_l=2$?

解答

不能,$l$最大只能取到$n-1=1$。

练习

如果$n=3$,$m_l=1$,那么$l$取值可以是哪些值?

主电子层和电子亚层

所有$n$相同的轨道都在同一个(主)电子层(principal electronic shell)中,而所有具有相同$n$和$l$值的轨道都在同一个(电子)亚层(subshell)中。

主电子层按$n$编号。第一个电子层由$n=1$的轨道组成,第二个电子层由$n=2$的轨道组成。$n$的值与能量以及电子与原子核的最概然距离有关。$n$越高,电子能量越大,电子平均距离离原子核越远。而角量子数$l$决定了轨道的角度分布(即形状),而$m_l$决定了轨道的方向。

主电子层中电子亚层的数量与角量子数$l$可能取值数相同。第一个主电子层$n=1$,$l$只能取0,所以只有一个电子亚层。第二个主电子层$n=2$,$l$可取0和1,有两个电子亚层。第三个主电子层$n=3$,有三个电子亚层,等等。换句话说,主量子数为$n$的主电子层,有$n$个电子亚层

主电子层按照$n=1,2,\cdots$,依次记为为K、L、M、N、O、P、Q层。例如M层指的是$n=3$对应的主电子层。而电子亚层按照$l=0,1,\cdots$依次记为$s$、$p$、$d$、$f$、$g$。

一个电子亚层中有多少个轨道?回忆一下$m_l$的取值范围:$-l$到$l$。因此$s$亚层只有一个轨道,$p$亚层有三个轨道($m_l$取值为±1、0),$d$亚层有五个轨道($m_l$取值为±2、±1、0),$f$亚层有七个轨道。

我们用数字和字母的组合表示处于特定电子层与特定电子亚层的轨道。例如符号$2p$表示第二个主电子层中的$p$亚层的三个轨道中的任意一个。

例题

写出量子数为$n=4$,$l=2$,$m_l=0$的氢原子轨道的符号

解答

角量子数为2,为$d$轨道。主量子数为4,所以为$4d$轨道。

练习

写出氢原子中所有与$3s$轨道能量相同的轨道。

类氢原子电子层和亚层的能量

通过求解类氢原子的薛定谔方程,可得出类氢原子的能量:

$$E=-\frac{Z^2R_\text{X}}{n^2}, R_\text{X}=\frac{\mu e^4}{8\varepsilon_0^2 h^2}$$

对于要求不那么精确的计算,约化质量可近似看成电子质量,此时$R_\text{X}=R_\text{y}$ = 2.17987×10−18 J

对于给定的$Z$,主量子数$n$相同的轨道均具有相同的能量。轨道具有相同能量的情况被称为简并(degenerate)。例如类氢原子的三个$2p$轨道以及$2s$轨道是简并的。

8.7 氢原子轨道的表示和诠释

本节的主要任务是用三维概率密度分布来描述氢原子的各种轨道。我们将用一个内含大部分电子概率的等概率面表示轨道,每个轨道的概率密度都有其独特的形状。本节虽然会用一些定量的方法来描述轨道,但更重要的是定性地理解原子轨道。原子轨道的定性理解是学习化学键(第10、11章)的基础。

轨道是波函数,是薛定谔方程的解。波函数本身没有物理意义,但波函数平方$\psi^2$是与概率有关的量。$\psi$是一个三维空间中的函数,可分为两个部分:径向因子和角度因子。

类氢原子的径向因子和角度因子的数学形式如下:

角度因子$Y_{l,m}(\theta,\varphi)$  
笛卡尔坐标系 球坐标系
$Y(s)=\left(\frac{1}{4\pi}\right)^{1/2}$  
$Y(p_x)=\left(\frac{3}{4\pi}\right)^{1/2}\frac{x}{r}$ $=\left(\frac{3}{4\pi}\right)^{1/2}\sin\theta\cos\varphi$
$Y(p_y)=\left(\frac{3}{4\pi}\right)^{1/2}\frac{y}{r}$ $=\left(\frac{3}{4\pi}\right)^{1/2}\sin\theta\sin\varphi$
$Y(p_z)=\left(\frac{3}{4\pi}\right)^{1/2}\frac{z}{r}$ $=\left(\frac{3}{4\pi}\right)^{1/2}\cos\theta$
$Y(d_{z^2})=\left(\frac{5}{16\pi}\right)^{1/2}\frac{3z^2-r^2}{r^2}$ $=\left(\frac{5}{16\pi}\right)^{1/2}(3\cos^2\theta-1)$
$Y(d_{x^2-y^2})=\left(\frac{5}{16\pi}\right)^{1/2}\frac{x^2-y^2}{r^2}$ $=\left(\frac{15}{16\pi}\right)^{1/2}\sin^2\theta\cos2\varphi$
$Y(d_{xy})=\left(\frac{5}{4\pi}\right)^{1/2}\frac{xy}{r^2}$ $=\left(\frac{15}{16\pi}\right)^{1/2}\sin^2\theta\sin2\varphi$
$Y(d_{yz})=\left(\frac{5}{4\pi}\right)^{1/2}\frac{yz}{r^2}$ $=\left(\frac{15}{4\pi}\right)^{1/2}\sin\theta\cos\theta\sin\varphi$
$Y(d_{xz})=\left(\frac{5}{4\pi}\right)^{1/2}\frac{xz}{r^2}$ $=\left(\frac{15}{4\pi}\right)^{1/2}\sin\theta\cos\theta\cos\varphi$
径向因子$R_{n,l}(r)$ $\sigma=\frac{2Zr}{na_0}$
$R_{1s}=2\left(\frac{Z}{a_0}\right)^{3/2}e^{-\sigma/2}$ $R_{2p}=\frac{1}{2\sqrt 6}\left(\frac{Z}{a_0}\right)^{3/2}\sigma e^{-\sigma/2}$
$R_{2s}=\frac{1}{2\sqrt 2}\left(\frac{Z}{a_0}\right)^{3/2}(2-\sigma)e^{-\sigma/2}$ $R_{3p}=\frac{1}{9\sqrt 6}\left(\frac{Z}{a_0}\right)^{3/2}(4-\sigma)\sigma e^{-\sigma/2}$
$R_{3s}=\frac{1}{9\sqrt 3}\left(\frac{Z}{a_0}\right)^{3/2}(6-6\sigma+\sigma^2)e^{-\sigma/2}$ $R_{3d}=\frac{1}{9\sqrt{30}}\left(\frac{Z}{a_0}\right)^{3/2}\sigma^2 e^{-\sigma/2}$

首先注意到,$s$轨道波函数的角度因子是一个恒定值$\left(\frac{1}{4\pi}\right)^2$,其与角度无关。而$p$和$d$轨道的角度因子与主量子数$n$无关,也就是说特定的轨道(如$p_x$)具有相同的角度因子。此外角度因子的名称与其在笛卡尔坐标系中的函数形式有关。

径向因子包含$\sigma$,这是一个与核电荷数$Z$有关的变量,这意味着上述公式可以用于类氢原子。$a_0$是玻尔半径,是玻尔模型中能量最低的氢原子轨道的半径:

$a_0=\frac{\varepsilon_0 h^2}{\pi m_e e^2}$ = 52.9177 pm

为了获得特定的波函数,我们只需将径向因子乘以角度因子。在此之前我们首先来看一下$n$ = 1、2和3时波函数的径向和角度因子。

径向函数

径向函数决定了特定轨道的概率密度如何随距原子核的距离$r$而变化,因此原子轨道的大小可通过径向函数来比较。

下图展示了氢原子的径向波函数,函数最终会随着$r$增加呈指数衰减,但在此之前可能会穿过水平轴数次。另外$s$轨道的径向函数在$r=0$处取非零值,而其他轨道的径向函数在$r=0$处为0。

radial-function $n=1,2,3$时氢原子轨道波函数的径向部分,横坐标是以玻尔半径为单位的距原子核距离$r$ radial-function $n=1,2,3$时氢原子轨道波函数的径向部分,横坐标是以玻尔半径为单位的距原子核距离$r$

以下几点总结了径向函数的主要特征:

  • 随着$r$的增加,径向函数呈指数衰减。因此可以认为每个轨道都有一定的大小。一般来说$n$越大,轨道越大。通过比较$1s$和$3s$轨道的径向函数可以看出这一点。$1s$轨道的径向函数在$r=6a_0$时衰减到接近于零,而$3s$轨道径向函数在大约$r=20a_0$处衰减到几乎为零。出于这个原因,我们说$3s$轨道比$1s$轨道『大』。

  • 径向函数在进入指数衰减前穿过水平轴$n-l-1$次。径向函数与水平轴相交的点对应着径向节点(radial node)。因此径向函数具有$n-l-1$个径向节点。$1s$轨道有1 − 0 − 1 = 0个径向节点,$3p$轨道有3 − 1 − 1 = 1个径向节点。

  • $s$轨道($l=0$)径向函数在原子核处具有非零值。而其他轨道径向函数在原子核处的值为零。因此$1s$、$2s$和$3s$轨道的径向函数都在$r=0$处有一个尖点,而其他轨道的径向函数在原子核处都为零。所以$s$轨道的概率密度在$r=0$处有最大值,而对于其他轨道概率密度在$r=0$处为零。

现在来仔细查看径向函数的数学形式,以解释上面这三个特征。所有的径向函数都包括指数因子$e^{-\sigma/2}$,其中$\sigma=\frac{2Zr}{na_0}$,因此函数最终以指数方式衰减至0。径向函数还包括一个$n-l-1$阶多项式因子$f(\sigma)$和一个$\sigma^l$因子,也就是说径向函数可以表示为:$R=Cf(\sigma)\sigma^l e^{-\sigma/2}$,其中$C$是系数。

$3s$轨道径向函数包括二阶多项式$(6-6\sigma+\sigma^2)$,$3p$轨道包括一阶多项式$(4-\sigma)$。当$\sigma$取某些特殊值的时候,多项式因子的值可能为0,此时就产生了径向节点。$n-l-1$阶多项式最多与水平轴交叉$n-l-1$次,也就产生$n-l-1$个节点。

$s$轨道的$l=0$,因此$\sigma^l$因子值为1。非$s$轨道径向因子在$r=0$处为0,因为$\sigma^l$在$r=0$时为0。而$s$轨道径向因子在原子核处为正值。

现在我们已经了解了原子轨道径向波函数的主要特征,为进一步理解波函数,我们还需要考虑这些函数的精确形式。氢的$2s$轨道的径向函数可写成以下形式:

$$R(r)=\frac{1}{2\sqrt 2}\frac{1}{a_0^{3/2}}\left(2-\frac{r}{a_0}\right)e^{-r/2a_0}$$

当$r=2a_0$时,$R(r)$为0,也就产生了径向节点。$2s$轨道在$r=2a_0$处有一个径向节点,而$3s$轨道在$r=1.9a_0$和$7.1a_0$处有两个径向节点。

角度函数

我们会在球坐标下绘制出角度函数,如下图所示。在球坐标中,特定角度下角度函数的绝对值大小由距原点的距离给出。例如$Y(s)$是一个常数,与角度无关,也就是说每个方向的距离都是相等的。其角度函数的图形表示会是一个圆球。下图中的图形是立体图形的截面,将这些二维图形的每个『瓣』旋转360°就能获得立体图(这一节需要用一点点空间想象能力)。

angular-function $s$、$p$、$d$轨道波函数的角度因子,蓝色表示在这个角度上的角度因子为正值,而橙色表示角度因子为负值。角度因子是三维空间中的函数,为方便表示这里绘制的是截面图。 angular-function $s$、$p$、$d$轨道波函数的角度因子,蓝色表示在这个角度上的角度因子为正值,而橙色表示角度因子为负值。角度因子是三维空间中的函数,为方便表示这里绘制的是截面图。

现在我们来一一观察这些角度函数。先从最简单的$Y(s)$开始。

$s$轨道 $s$轨道($l=0$)的角度函数$Y=\sqrt{1/4\pi}$。该函数与角度无关,因此任何方向都具有相同的值。例如,当$\theta=\pi/2$以及$\varphi=0$或者当$\theta=0$和$\varphi=\pi/2$时,它的值均为$\sqrt{1/4\pi}$。函数在球坐标下表示为圆球。所以我们说$s$轨道是球形的。

$p$轨道 $p$轨道($l=1$)有三个角度函数。尽管这些函数的数学形式不同,但它们的图形告诉我们它们形状相同,但指向的方向不同。三个$p$轨道记为$p_x$、$p_y$和$p_z$,表示它们方向对着$x$、$y$和$z$轴。与$s$轨道不同,$p$轨道的角度函数与方向有关。在这里以$p_z$轨道为例,通过角度函数来解释$p$轨道的形状。

$p_z$轨道的角度函数$Y(p_z)=\left(\frac{3}{4\pi}\right)^{1/2}\cos\theta$,因此其与$\cos\theta$成正比,而与$\varphi$无关。因此$p_z$轨道的角度函数沿着$z$轴正方向具有最大值,因为此时$\theta=0$,且$\cos\theta=1$。沿着$z$轴负方向$p_z$轨道的角度函数取最小值,此时$\theta=\pi$,$\cos\theta=-1$。另外,$xy$平面中的任何地方有$\theta=\pi/2$,$\cos\theta=0$,因此这一平面上角度函数为零,所以该平面为节点(有些人会称其为节面,在英文中都为node,本文统称为节点)。因为这个节点在角度函数中出现,其被称为角度节点。$p_x$和$p_y$轨道与之类似,但分别在$yz$平面和$xz$平面上存在角度节点。在三维空间中,$p$轨道的角度函数可表示为两个相切的圆球,相位(函数的正负)用不同颜色表示。我们会在第11章了解到,轨道的相位是原子轨道组合形成化学键中非常重要的一个因素。

$d$轨道 从它们的数学形式可以看出,$d$轨道($l=2$)的角度函数更加复杂。$d$轨道的角度函数有两个角度节点,而$p$轨道只有一个,$s$轨道没有角度节点。因此角度节点的数量等于$l$的值。

我们以$d_{x^2-y^2}$轨道的角度函数为例,该轨道的角度函数$Y(d_{x^2-y^2})=\left(\frac{15}{16\pi}\right)^{1/2}\sin^2\theta\cos2\varphi$,也就是说与$\sin^2\theta\cos2\varphi$成正比。应该如何将这个函数可视化?我们可以通过绘制$xy$平面上的截面来表示,此时$\theta=\pi/2$,函数转化为某个常数乘以$\cos2\varphi$,其极坐标图较容易绘制。这时角度函数由沿$x$轴和$y$轴方向的四个瓣组成。每个区域中$Y$的相位(符号)由蓝线和橙线表示。蓝色的两个波瓣的相位为正,另外两个波瓣的相位为负。当我们从一个波瓣顺时针或逆时针移动到另一个波瓣时,相位发生变化,存在角度节点。

绘制出的图形还包括$d_{xy}$、$d_{yz}$、$d_{xz}$和$d_{z^2}$的角度函数的横截面,这些轨道都具有两个角度节点。其中前三个与$d_{x^2-y^2}$具有相同的形状,但它们波瓣的朝向不同。而$d_{z^2}$轨道的形状完全不同,它的三维形状可沿$y$轴旋转360°得到。$d_{z^2}$轨道的角度节点是圆锥面,而不是平面。

$f$、$g$、$h$等轨道的角函数具有相当复杂的形状。这些轨道很少遇到,所以课程不要求掌握它们的形状。

波函数和轨道的形状

完整的波函数是径向函数和角度函数的乘积。因此氢原子$1s$轨道的波函数为:

$$ \begin{align} \psi_{1s}&=\color{Crimson}{R_{1s}}\times\color{DodgerBlue}{Y(s)}=\color{Crimson}{\frac{2e^{-r/a_0}}{a_0^{3/2}}}\times\color{DodgerBlue}{\frac{1}{\sqrt{4\pi}}}\\ &=\frac{e^{-r/a_0}}{\sqrt{\pi a_0^3}} \end{align} $$

我们如何使用图形表示$\psi_{1s}$?这个函数是三维空间中的函数,需要用四维图形才能『完整』表示。我们知道$\psi_{1s}$具有球对称性,因此可以任取一个过原子核的平面,用三维图形或者等高线图表示平面上函数的值。等高线图如下图所示:

psi1s-wave-function 氢原子$s$轨道沿$xy$平面切面的等高线图,正方形边长$4a_0$,原子核在中心。渐变蓝色的背景表示波函数的数值,蓝色越深数值越大,白色表示数值为0。最外层不完整的圆圈处波函数数值为0.05,等高线间距0.05。 psi1s-wave-function 氢原子$s$轨道沿$xy$平面切面的等高线图,正方形边长$4a_0$。渐变蓝色的背景表示波函数的数值,蓝色越深数值越大,白色表示数值为0。

可以想象出,这一图形如果用三维模型表示,其看起来像是一个锥形的山峰,山顶在原子核所在的位置。函数距离原子核越近,数值越大,『海拔』越高。现在我们来考虑概率密度$\psi^2_{1s}$:

$$\psi^2_{1s}=\frac{e^{-2r/a_0}}{\pi a_0^3}$$

下图用三维图形表示了氢原子$1s$轨道波函数的概率密度,这个函数也是球形对称的,且概率密度在原子核上最大。随着距原子核的距离增加,概率密度指数减少至接近于0。

psi1s-probability $1s$轨道波函数的平方(概率密度)在三维空间中的表示,立方体边长$4a_0$,原子核在中心。电子密度在空间中的分布用类似云雾的方式表示,雾浓(概率密度大)的地方颜色深,雾淡(概率密度小)的地方颜色浅。 psi1s-probability $1s$轨道波函数的平方(概率密度)在三维空间中的表示,立方体边长$4a_0$,原子核在中心。电子密度在空间中的分布用类似云雾的方式表示,雾浓(概率密度大)的地方颜色深,雾淡(概率密度小)的地方颜色浅。

现在考虑氢原子$2s$轨道的波函数,同样的,$\psi_{2s}$由径向函数和角度函数相乘得到:

$$ \begin{align} \psi_{2s}&=\color{Crimson}{R_{2s}}\times\color{DodgerBlue}{Y(s)}=\color{Crimson}{\frac{1}{2\sqrt 2}\frac{1}{a_0^{3/2}}\left(2-\frac{r}{a_0}\right)e^{-r/2a_0}}\times\color{DodgerBlue}{\frac{1}{\sqrt{4\pi}}}\\ &=\frac{1}{4}\left(\frac{1}{2\pi a_0^3}\right)^{1/2}\left(2-\frac{r}{a_0}\right)e^{-r/2a_0} \end{align} $$

波函数在$r=2a_0$处有径向节点,因为因子$\left(2-\frac{r}{a_0}\right)$为0。$2s$轨道的概率密度为:

$$\psi_{2s}^2=\frac{1}{8\pi}\left(\frac{1}{a_0}\right)^3\left(2-\frac{r}{a_0}\right)^2 e^{-r/a_0}$$

其图形如下图所示,注意立方体的边长为$16a_0$。$2s$轨道的电子相比$1s$有更大的概率出现在距离原子核更远的地方。

psi2s-probability $2s$轨道概率密度在三维空间中的表示,立方体边长为$16a_0$,原子核在中心。波函数(相位)为正的区域用蓝色表示,为负的区域用橙色表示。距离原子核$r=2a_0$有径向节点,节点处的波函数为0,电子不会在这块区域出现。 psi2s-probability $2s$轨道概率密度在三维空间中的表示,立方体边长为$16a_0$,原子核在中心。波函数(相位)为正的区域用蓝色表示,为负的区域用橙色表示。距离原子核$r=2a_0$有径向节点,节点处的波函数为0,电子不会在这块区域出现。

而$3s$轨道具有两个径向节点,在$r=(3\pm\sqrt 3)a_0$处。其相位从原子核开始由正变为负再变为正。

现在我们来看一下$2p_x$轨道的波函数,其同样是由径向函数和角度函数组合而成:

$$ \begin{align} \psi_{2p_x}&=\color{Crimson}{R_{2p}}\times\color{DodgerBlue}{Y(p_x)}=\color{Crimson}{\frac{1}{2\sqrt 6}\frac{1}{a_0^{3/2}}e^{-r/2a_0}}\times\color{DodgerBlue}{\left(\frac{3}{4\pi}\right)^{1/2}\sin\theta\cos\varphi}\\ &=\frac{1}{4}\left(\frac{1}{2\pi a_0^3}\right)^{1/2}e^{-r/2a_0}\sin\theta\cos\varphi \end{align} $$

$2p$轨道没有径向节点,但是有角度节点。$2p_x$轨道的角度节点为$yz$平面。$2p_x$轨道的图形化表示如下图所示:

psi2p-wave-function $2p_x$的波函数,长方形边长为$6a_0$及$12a_0$。右侧的波函数(相位)为正,左侧为负。 psi2p-wave-function $2p_x$的波函数,长方形边长为$6a_0$及$12a_0$。右侧的波函数(相位)为正,左侧为负。

同样的,$\psi_{2p_x}^2$是概率密度,其在三维空间中的图形为:

psi2p-probability $2p_x$的概率密度,右侧的负号只是用来标记波函数的相位(概率密度一定是非负数)。长方体长$12a_0$,两条短边长$6a_0$。 psi2p-probability $2p_x$的概率密度,右侧的负号只是用来标记波函数的相位(概率密度一定是非负数)。长方体长$12a_0$,两条短边长$6a_0$。

$2p_y$和$2p_z$轨道与$2p_x$形状完全一样,只不过方向不同。特别强调,不同的颜色只是表示波函数相位的区别,电子在$p$轨道两侧的概率密度是完全一样的。

本文不会写出$d$轨道波函数的数学形式,只给出了用等高线图简单展示的图形。这些图形是轨道的『真实』形状,但我们通常表示原子轨道的时候会更加地『随意』。因此如果你在别的书上看到长得奇形怪状的原子轨道(例如有机化学书上的$p$轨道通常不是『矮胖』的,而是『瘦高』的,这很正常。

psi3dz-wave-function $d_{z^2}$的波函数,长方体长$40a_0$,宽$12a_0$。$d_{z^2}$轨道的节点是两个圆锥,其截面为两条直线。将本图沿$z$轴旋转就能得到轨道的立体模型。 psi3dz-wave-function $d_{z^2}$的波函数,长方体长$40a_0$,宽$12a_0$。$d_{z^2}$轨道的节点是两个圆锥,其截面为两条直线。将本图沿$z$轴旋转就能得到轨道的立体模型。

仔细观察你会发现$d_{z^2}$轨道的形状和角度函数$Y(d_{z^2})$非常相像。所有的$d$轨道形状都和对应的角度函数类似,剩下的几个轨道的形状就不再给出。你需要记住不同$d$轨道的角度节点方向,$d$轨道对理解过渡元素的化学性质非常重要,相关内容会在第23章学习。

8.8 电子自旋:第四个量子数

通过求解氢原子的薛定谔方程获得了原子轨道的三个量子数,确定了量子数就确定了原子轨道。然而,1925年乔治·乌伦贝克(George Uhlenbeck, 1900-1988)和塞缪尔·古德斯米特(Samuel Goudsmit, 1902-1978)为解释氢原子光谱的一些精细结构,提出电子就像是地球一样,表现出自旋的性质。电子自旋(electron spin)有两种可能,如下图所示,这种可能性需要用第四个量子数——电子自旋量子数$m_s$来描述。电子的自旋量子数可能为$+\frac{1}{2}$(可用箭头↑表示),或者为$-\frac{1}{2}$(可用箭头↓表示)。原子轨道中$m_s$的取值与之前学习的三个量子数无关。

electron-spin 自旋方向相反的两个电子,$m_s=\pm \frac{1}{2}$。如果电子自旋产生的磁场与外界磁场方向相同,$m_s$为+1/2。如果与外界磁场方向相反,就是−1/2。 electron-spin 自旋方向相反的两个电子,$m_s=\pm \frac{1}{2}$。如果电子自旋产生的磁场与外界磁场方向相同,$m_s$为+1/2。如果与外界磁场方向相反,就是−1/2。

实际上电子自旋有两个量子数:$s$和$m_s$。$s$量子数决定了磁场的大小,而$m_s$决定了磁场的方向。电子的$s$总是为$\frac{1}{2}$,所以我们称电子是自旋$+\frac{1}{2}$的粒子。其他的粒子$s$可能不同,例如光子的$s=1$。对于给定的$s$值,$m_s$只能取$-s,-s+1,\cdots,s-1,s$。因此电子的$m_s$可以取$\pm\frac{1}{2}$。

Stern-Gerlach-experiment 施特恩-格拉赫实验装置图,银原子从炉中出来,经过小孔形成银原子束。银原子束通过不均匀磁场,施特恩和格拉赫预计银原子会分散成条带(检测器左侧的样子),但实际结果是分散成两束。/©Tatoute CC BY-SA 4.0 Stern-Gerlach-experiment 施特恩-格拉赫实验装置图,银原子从炉中出来,经过小孔形成银原子束。银原子束通过不均匀磁场,施特恩和格拉赫预计银原子会分散成条带(检测器左侧的样子),但实际结果是分散成两束。/©Tatoute CC BY-SA 4.0

电子存在自旋的实验证据是什么?1920年奥托·施特恩(Otto Stern, 1888-1969)和瓦尔特·格拉赫(Walter Gerlach, 1889-1979)进行了一项实验。虽然这个实验不是为证明电子自旋而设计的,但实验结论却是电子存在自旋的证据。他们将银放在炉中蒸发,让银原子束通过一个不均匀的磁场,发现银原子束裂成两束。这一现象可以简单地解释:

  1. 电子自旋产生磁场。
  2. 一对自旋相反的电子没有净磁场。
  3. 处于最低能量状态的银原子只有一个未成对的电子。产生的净磁场的方向仅取决于未成对电子的自旋。
  4. 在大量银原子束中,未成对电子具有+1/2或−1/2自旋的概率相等。银原子感生磁场与非均匀磁场相互作用,导致银原子束分裂成两束。

用四个量子数描述电子

我们获得了用来描述电子状态的四个量子数,它们一起可以描述氢原子的电子结构。基态氢原子中的电子处于最低能级。也就是说主量子数$n=1$,由于第一个主电子层仅由$s$轨道组成,所以轨道角量子数$l=0$。磁量子数的唯一取值是$m_l=0$。电子的任何一种自旋状态都有可能,除非我们进行施特恩-格拉赫实验。因此$n=1,l=0,m_l=0,m_s=\pm 1/2$

化学家常说基态氢原子中的电子在$1s$轨道上,或者说它是$1s$电子,用符号表示为:$1s^1$。上标1表示$1s$轨道中有一个一个电子。电子的两种自旋状态都是可能的,通常没必要特别指定自旋状态。

在氢原子的激发态中,电子占据$n$值较高的轨道。例如电子当激发到$n=2$的能级时,电子可以占据$2s$或$2p$轨道。这两个轨道都具有相同的能量。因为$2s$和$2p$轨道的概率密度更加远离原子核,我们说激发态原子比基态原子更大。这两个激发态可以表示为:$2s^1$或$2p^1$。

在本章的其余部分将讨论含有多个电子的原子。

例题

指出下面的这些量子数$(n,l,m_l,m_s)$是否是正确的。

(2,1,0,0) (2,0,1,1/2) (2,2,0,1/2) (2,−1,0,1/2) (2,1,0,−1/2)

解答

第一个错误,$m_s$不能为0。第二个错误,$m_l$不能为1。第三个错误,$l$不能为2。第四个错误,$l$不能为−1。第五个正确。

练习

指出下面的这些量子数$(n,l,m_l,m_s)$是否是正确的。

(3,2,−2,0) (3,1,−2,1/2) (3,0,0,1/2) (2,3,0,1/2) (1,0,0,−1/2) (2,−1,−1,1/2)

8.9 多电子原子

类氢原子的薛定谔方程包含两项:电子动能和电子与核的相互作用(势能)。而多电子原子的情况更加复杂,出现了一个新的因素:电子与电子的排斥。电子之间的排斥意味着原子中的电子趋于相互远离,需要考虑的作用更多。尽管如此,多电子原子的电子轨道和氢原子的轨道类似,它们的角度函数一样,但径向函数有所不同。

多电子原子的模型

氢原子轨道的概念是描述多电子原子的模型基础,在此基础上需要进行调整。因为多电子原子中存在电子和电子的相互作用。大量的实验和理论证据支持以下的几条观点:

  1. 多电子原子中电子的波函数可以近似为轨道的叠加,每个轨道都与氢原子轨道有一些相似之处。多电子原子中的每个轨道描述了单个电子在所有其他电子的平均影响下与原子核相互作用的行为。
  2. 具有$N$个电子的原子的总能量具有一般形式$E=F-G$,其中$F$表示轨道能量的总和,$F=\varepsilon_1+\varepsilon_2+\varepsilon_3+\cdots+\varepsilon_N$,$G$项考虑了电子-电子排斥。例如轨道能量$\varepsilon_1$是在所有其他电子的平均影响下与原子核相互作用的特定轨道中的电子1的能量。一般来说,轨道能量随着$n$的增加而增加,而对于相同的$n$值,随着$l$增加而增加,如下图所示。
  3. 电子填入一系列轨道的顺序使得$E$最小化。最小化的$F$的轨道顺序不一定最小化$E$。因此考虑填充顺序的时候不要过分强调轨道本身的能量。

方程$E=F-G$的形式乍一看可能有点奇怪,它似乎表明当电子-电子排斥$G$最大时,原子的能量最低。情况并不那么简单,因为每个轨道能量(以及$F$)已经包括电子-电子排斥的影响。所以电子-电子排斥在$F$中被重复计算了。例如$\varepsilon_1$包括电子1和电子2的排斥,但这个排斥也在$\varepsilon_2$中包含。$F$计算了两次电子-电子排斥的影响,所以我们必须从$F$中减去$G$以获得$E$的正确值。

multielectronic-atom-energy 氢原子和多电子原子能量高低示意图。多电子原子相同主电子层内,$l$越小的亚层能量越低。而氢原子同主电子层内的轨道是简并的。 multielectronic-atom-energy 氢原子和多电子原子能量高低示意图。多电子原子相同主电子层内,$l$越小的亚层能量越低。而氢原子同主电子层内的轨道是简并的。

总之,多电子原子中的每个电子都占据在轨道中,这些轨道性质上与类氢轨道($1s$、$2s$、$2p$、$3s$等)相似。可以想象,我们通过将电子分配给特定的轨道使$E$最低的方法,逐个电子地构建原子。

在学习如何将电子正确分配到各种轨道之前,我们首先讨论钻穿和屏蔽的概念。这些概念将帮助我们解释为什么在多电子原子中,主电子层内具有不同$l$值的轨道具有不同的能量。

钻穿和屏蔽

想象一下原子核对离原子核一定距离的特定电子的吸引力。靠近原子核的轨道中的电子将会屏蔽距离原子核远离更远的电子。屏蔽(shielding)降低了原子核吸引特定较远电子的能力,有效地减少了较远的电子感受到的核电荷。

电子感受到核电荷减少的幅度取决于内部电子所在的轨道类型和被屏蔽电子所在的轨道类型。此前我们已学到,$s$轨道在原子核处具有高概率密度,而$p$和$d$轨道在原子核处的概率密度为零。因此,与$p$或$d$轨道中的电子相比,$s$轨道中的电子能更有效地将原子核与外层电子隔离。$s$轨道电子更加接近原子核的能力称为钻穿(penetration)。具有良好钻穿能力的轨道中的电子比具有低钻穿能力的电子更具有屏蔽性。

我们必须考虑一种不同的概率分布来描述轨道电子对原子核的钻穿。我们现在考虑在距离原子核$r$的位置上发现电子的概率,也就是在半径为$r$且厚度无穷小的球壳中找到电子的概率 这种概率用径向分布函数表示,定义为$r^2R^2(r)$。以$1s$轨道为例,其波函数平方为:

$$\psi_{1s}^2=\left(\frac{1}{4\pi}\right)R^2(1s)$$

电子在半径$r$至$r+\text{d} r$出现的概率为:

$$\psi_{1s}^2\text{d} V=\left(\frac{1}{4\pi}\right)R^2(1s)\text{d} V$$

半径为$r$的球壳表面积为$4\pi r^2$,有:

$$\psi_{1s}^2\text{d} V=\left(\frac{1}{4\pi}\right)R^2(1s)\times 4\pi r^2\text{d}r$$

因此径向分布函数为$r^2R^2(r)$。

一些类氢轨道的径向分布函数如下图所示,$1s$轨道的径向概率密度$R^2(r)$表明$1s$电子在原子核附近具有最大的概率密度。但由于该区域的体积非常小($r=0$),因此原子核附近的径向概率分布$r^2R^2(r)$并不大。氢原子中的电子最有可能在距离原子核53 pm处被发现,这是径向概率分布最大的距离,其正好等于玻尔半径$a_0$。而有95%概率发现电子的边界面是一个更大的球体,半径为141 pm。在比较$1s$、$2s$和$3s$轨道的径向概率曲线时,我们发现$1s$电子比$2s$有更大概率接近原子核,而$2s$电子又比$3s$电子有更大概率接近。在比较$2s$和$2p$轨道时,$2s$电子比$2p$电子更靠近原子核。$2s$电子比$2p$电子表现出更大的钻穿能力。具有高度钻穿能力的电子有效地『阻挡』了外层轨道中电子『寻找』原子核的视线。

radial-distribution 氢原子轨道的径向分布函数$r^2R^2(r)$,注意三幅图的横坐标比例不一致。具有相同$n$的电子距离原子核的距离差不多,而$n$更大的轨道远比$n$较小的轨道靠外侧。 radial-distribution 氢原子轨道的径向分布函数$r^2R^2(r)$,注意三幅图的横坐标比例不一致。具有相同$n$的电子距离原子核的距离差不多,而$n$更大的轨道远比$n$较小的轨道靠外侧。

如果没有中间的电子,电子感受到的核电荷是$Z$,即原子序数。电子实际感受的核电荷更小,是$Z_\text{eff}$,称为有效核电荷(effective nuclear charge)。外层电子感受到的核电荷越少(即$Z_\text{eff}$的值越小),原子核对电子的吸引力就越小,轨道的能量更高。

总而言之,与同一主电子层中的$p$电子相比,$s$电子的钻穿能力更强,且没有被很好地屏蔽。所以$s$电子的$Z_\text{eff}$更大,与原子核作用更强,能量更低。同样的,同一主电子层中的$p$电子的能量低于$d$电子。因此电子亚层的能量顺序是$ns<np<nd$,相同电子亚层中的轨道具有相同的能量,因为亚层中的所有轨道都具有相同的径向函数,从而具有相同的有效核电荷$Z_\text{eff}$。因此相同主电子层的三个$p$轨道都具有相同的能量,五个$d$轨道都具有相同的能量。

8.10 电子构型

原子的电子构型是指电子如何分布在主电子层和电子亚层的各种轨道中。后面的章节中,我们会发现元素的许多物理和化学性质都与电子构型有关。本节我们将看到波动力学的结论(能级能量顺序)如何帮助我们为元素书写可能的电子构型。

电子填入轨道的规则

  • 电子以最小化原子能量的方式占据轨道。如前所述,原子的总能量不仅取决于轨道能量,还取决于将电子之间的排斥。因此不能仅通过轨道能量预测轨道填充顺序。轨道填充的准确顺序是通过实验确定的,主要通过光谱和磁场的研究。为电子填入轨道的规则符合实验测量的顺序。除少数例外,轨道填充的顺序是:
$1s,2s,2p,3s,3p,4s,3d,4p,5s,4d,6s,4f,5d,6p,7s,5f,6d,7p$
    因为同样的原因,上述填充顺序并不代表轨道的相对能量顺序。这个顺序可以通过下图辅助记忆,不过确定轨道填充顺序的最佳方法是查看元素周期表中的电子构型。
filling-subshells 填充亚层的顺序,从左上到右下依次按照斜线朝左下的方向填充。 filling-subshells 填充亚层的顺序,从左上到右下依次按照斜线朝左下的方向填充。
  • 每个轨道可以填入两个电子,这两个电子的自旋相反。1926年沃尔夫冈·泡利(Wolfgang Pauli, 1900-1958)提出泡利不相容原理(Pauli exclusion principle):原子中没有两个电子有相同的一组量子数,用来解释磁场中原子发射光谱的复杂特征。如果两个电子(标记为1和2)占据相同的轨道,则那么$n_1=n_2$、$l_1=l_2$以及$m_{l_1}=m_{l_2}$。根据泡利不相容原理,两个电子必须具有不同的自旋量子数$m_s$。
    由于每个轨道只能填入两个电子,亚层能填入电子的数量就是两倍的轨道数。因此$s$亚层可填入两个电子,$p$亚层可填入六个电子。
  • 存在相同能量的轨道(简并轨道)时,电子最开始单独占据这些轨道且自旋平行。如果填入亚层的电子数量不多于轨道数时,电子会单独占据轨道并具有相同的自旋。这一规则称为洪德最大多重度规则(Hund′s rule of maximum multiplicity)。规则的一个简化陈述是:对于给定的构型,具有最大平行电子数的构型能量最低。这一现象可以解释如下:电子之间相互排斥,如果轨道本身的能量相同,那么电子放在不同的轨道中,会使得电子在空间上尽可能远离。为什么电子自旋平行时原子的能量较低?这个问题的答案可能看起来很奇怪:与自旋相反的电子相比,具有相同自旋的电子相互排斥更多,因此相互屏蔽更少。因此自旋平行时,每个电子被原子核的吸引更强。总体结果导致电子自旋平行地填入简并轨道总能量更低。

表示电子构型

在学习不同原子的电子构型之前,我们先来了解如何表示原子的电子构型。碳原子的电子构型以三种不同的方式展示在下图中:

configuration-c configuration-c

碳原子有六个电子,因此每种表示方法都含有6个电子。这些电子有两个在$1s$亚层,有两个在$2s$亚层,有两个在$2p$亚层。前两行使用的是$spdf$记号($spdf$ notation),上标表示相应亚层中的电子数。第一行是最简单的写法,没有指明电子占据的是哪个$2p$轨道。而第二行指明电子占据了何种轨道。第三行用的图形叫做轨道图(orbital diagram),每个方框表示一个轨道。

电子自旋在轨道图中用箭头表示。向上的箭头对应某种类型的自旋(例如+1/2),向下的箭头对应另一种自旋。如果轨道中填入了两个具有相反自旋的电子,电子是成对的。碳原子$1s$和$2s$轨道中的电子是成对的。根据洪德规则,填入$2p$轨道的两个电子应当自旋平行。因此$2p$的轨道图为[↑][↑][ ]。而[↑][↓][ ]所代表的构型是碳的激发态,任何具有不平行的不成对电子的轨道图都构成激发态。

单个原子的最稳定构型称为基态电子构型。如果构型不是最稳定的,那么处于该种构型的原子处于激发态。

构造原理

我们通过构造原理(Aufbau principle)来书写原子的电子排布。Aufbau是一个德语单词,意思是『建立』,我们需要按原子序数递增的顺序为元素书写电子构型。为展示各原子的构型,填入的过程以上一个元素的电子构型为基础,在此基础上增添电子。

    $Z=1$,氢元素。其能量最低的轨道是$1s$轨道,电子构型为$1s^1$。
    $Z=2$,氦元素。第二个电子填入$1s$轨道,电子构型为$1s^2。$
    $Z=3$,锂元素。第三个电子无法再填入$1s$轨道,只能填入下一个能量最低的轨道,因此电子构型为$1s^2 2s^1$。
    $Z=4$,铍元素。电子构型为$1s^2 2s^2$。
    $Z=5$,硼元素。现在开始填入$2p$轨道,电子构型为$1s^2 2s^2 2p^1$。
    $Z=6$,碳元素。继续填入$2p$轨道,由于仍有空$p$轨道,电子填入并自旋平行。电子构型为$1s^2 2s^2 2p^2$。
    $Z=7-10$,氮到氖。继续填入$2p$轨道直到填满。此时主电子层也填满,未成对电子数从B到N增加,随后再减少直到为0。
configuration-c2ne configuration-c2ne
    $Z=11\text{-}18$,钠到氩。这八个元素的填充方式和Li到Ne类似,除了填入的亚层为$3s$和$3p$。这些元素$n\leq 2$的轨道都是全部填满的,和Ne的电子构型一样。我们将内层的电子层称为惰性气体核(noble gas core),例如Na的$1s$到$2p$是氖核,表示为[Ne]。那么Na的电子构型就可以表示为[Ne]$3s^1$。惰性气体核之外的外层电子被称为价电子(valence electrons)。请读者自行写出使用惰性气体核简化的Na至Ar的电子构型。
    $Z=19,20$,钾和钠。氩之后不是填入$3d$亚层,而是填充$4s$亚层。我们用符号[Ar]表示惰性气体核$1s^2 2s^2 2p^6 3s^2 3p^6$。那么K的构型为:[Ar]$4s^1$,Ca的构型为:[Ar]$4s^2$。
    $Z=21\text{-}30$,钪到锌。填满$4s^2$后才能填充$3d$轨道,Sc有两种表示方法:[Ar]$3d^14s^2$或者[Ar]$4s^2 3d^1$。一般来说,我们习惯把主量子数大的放在后面,因此记为[Ar]$3d^14s^2$。
configuration-sc2zn configuration-sc2zn

注意$d$轨道的填充存在两个例外:铬和铜。Cr和Cu的$d$轨道是半满($3d^5$)或全满($3d^{10}$)的。

    $Z=31\text{-}36$,镓到氪。填充方式和Al到Ar一样。氪的构型为:[Ar]$3d^{10} 4s^2 4p^6$。
    $Z=37\text{-}54$,铷到氙。本周期18个元素,依次填入$5s$、$4d$和$5p$轨道。氙的构型为:[Kr]$4d^{10}5s^2 5p^6$。
    $Z=57\text{-}86$,铯到氡。本周期32个元素,依次填入$6s$、$4f$、$5d$和$6p$轨道。氡的构型为:[Xe]$4f^{14}5d^{10}6s^2 6p^6$。
    $Z=87\text{-}118$,本周期32个元素,从钫开始,依次填入$7s$、$5f$、$6d$和$7p$轨道。之后填入$7p$轨道是科学家预计的行为,由于这些元素半衰期极短,无法通过实验证实。

例题

指出下面的这些构型是否正确。如果正确,是否是基态构型?

configuration1-question configuration1-question

解答

第3、4正确,第三个是基态构型。

8.11 电子构型和周期表

我们刚刚描述了如何通过构造原理将电子填入原子轨道。电子构型可能看起来比较抽象,但它们其实可以和元素周期表相联系起来。同族的元素具有相似的电子构型,我们观察一下第1、17、18族的价电子构型

  • 第1族元素(碱金属)有一个外层(价)电子,价电子构型为$ns^1$。
  • 第17族元素(卤素)有七个外层(价)电子,价电子构型为$ns^2 np^5$。
  • 第18族元素(稀有气体)除氦以外,最外层有8个电子,价电子构型为$ns^2 np^6$。

观察带有元素构型的元素周期表(可以在各种类型的化学教科书后面找到),可发现不同区域的元素构型有区别。根据亚层的填充情况(存在一些例外),元素周期表可分为四个区域:

  • $s$区:第1族和第2族的元素,以及He。最外层只有$s$电子。
  • $p$区:除了He以外的第13~18族元素。最外层包括$s$和$p$电子。
  • $d$区:第3~12族元素,内部的$d$轨道被填充。
  • $f$区:镧系元素和锕系元素,内部的$f$轨道被填充。

请注意,完整书写电子构型由稀有气体核心和剩下的电子构型组成。因此在稀有气体核心之后填充的$d$电子或$f$电子也需要写出来。根据元素在元素周期表中的位置,我们可以快速写出元素的构型。

第1~2族元素的电子构型非常简单,包括稀有气体核心加上外层的$s$电子。例如Sr的电子构型为:[Kr]$5s^2$。

对于第13~18族元素,若其在第$n$周期第$m$族,那么它最外层电子的构型为$ns^2np^{m-2}$。如果存在$d$电子或$f$电子需加上$(n-1)d^{10}$以及$(n-2)f^{14}$。例如Bi是第六周期第15族,因此电子构型为[Xe]$4f^{14}5d^{10}6s^26p^3$。

$d$区和$f$区元素的电子构型较为复杂,也存在较多的例外情况。本书只要求你掌握第一过渡系元素的电子构型。注意Cr和Cu的电子构型存在例外——$d$轨道是半满或全满的,而外层$s$电子仅有一个。以Cr为例:[Ar]$3d^54s^1$。

例题

构型$1s^2 2s^2 2p^6 3s^2 3p^5$是什么元素。写出砷的电子构型。

解答

元素为$p$区元素,第三周期,第7族,所以为Cl。砷是第四周期第15族,因此为:[Ar]$3d^{10}4s^2 4p^3$

练习

写出碘的电子构型,其有多少个未成对电子?

例题

写出汞的电子构型。

解答

汞是第三过渡系元素,属第6周期。其电子构型为:[Xe]$4f^{14}5d^{10}6s^2$

练习

写出铁的电子构型,并画出轨道图。

例题

指出溴的价电子个数,碲的$5p$电子个数,铟的未成对电子个数。

解答

7个、4个、1个

练习

指出锡的$4d$电子个数,砷的未成对电子个数,Ge的价电子个数。