【原】与陶哲轩“共舞”的一个周末 | 数学家发现纪实

返朴 2020-12-23

展开全文

编者按

虽然近来陶哲轩和三位物理学家发现了一个新公式的事情终究是一场乌龙，但这场小波澜仍旧激发了数学家的探索。与对这一公式惯有的解读和诠释不同，文本记载的数学家发现的经历是我们很少能读到的。作者其间所经历的挣扎、喜悦，可能很多人也都体会过（比如思考一个困难的数学题成功之后的喜悦），但旁观者细细读来，仍不失兴味和启发。

撰文 ∣ 丁玖（美国南密西西比大学数学系教授）

今年11月15日，应我的师兄李弘九 (Noah Rhee) 教授的邀请，我从美国东南部的海滨小城飞到中西部的第七大城，在他任教的密苏里大学堪萨斯城校区数学与统计系做了一个有关遍历理论的数学演讲。我乘坐早晨六点的飞机，经停亚特兰大机场，再飞到那里。没有想到的是，在堪萨斯城度过的周末值得写这篇感想之作。

早晨5点，我已在起点机场候机，便习惯性地打开了微信，朋友圈里有人转发的一篇名为《3个搞物理的颠覆了数学常识，数学天才陶哲轩：我开始压根不相信》的文章跳进了我的眼框。文章讲的是今年夏季发生的一件事。

8月的一天，一直在加州大学洛杉矶校区教书的这名天才数学家收到三位陌生物理学家的一封电邮，称：

“我们偶然发现了一个公式，如果这个公式是正确的，那么它就会在线性代数中一些最基本且重要的对象之间建立一种意想不到的关系。”

陶哲轩教授很纳闷：这么短、这么简单的东西，早就应该出现在教科书里了。这不可能是真的。但是他却相信了这个公式是新的，于是便把它证明了，这对不知证明了多少艰深数学定理，被认为是当今全世界最聪明的他，是手到擒拿的小事一桩。十天后，他们四人就合写了一篇不到三页的论文，题目是Eigenvectors from Eigenvalues（来自特征值的特征向量），其中的主要结果就是这三位物理学家发现的那个公式，还用了两种方法证明之。

这个公式将埃尔米特矩阵的长度为1的特征向量的每一个分量的模平方，即它与其共轭复数之积，用矩阵所有的特征值以及与这个分量的位置指标相对应的主子矩阵的所有特征值的某个简单代数关系表达出来，结果的确漂亮，属于“美的数学”。然而一般的线性代数教科书中却没有它的踪影，所以四名作者都以为前人把发现这个美丽公式的荣誉留给了他们。

陶哲轩是数学界的超级巨星，他关于数学的一举一动都会引起媒体的骚动，就像他的数学博客那么引人一样。所以众人也以为他们发现了一个新的公式，有人甚至宣称“这一公式的理论价值在克莱姆法则之上。”克莱姆法则将非奇异线性代数方程组的解的各分量用一个商来表示，商的分母总是方程组的系数行列式，而分子则是用方程组的右端向量取代解分量位置指标所确定的系数矩阵那个列所得到的新矩阵的行列式。

读完这篇报道，我随手将它转发到我的南大同学群。当我飞到亚特兰大机场后，又在朋友圈里读到了引起轰动的这篇数学文章。但让我一眼看到的是，文章的第一句竟然有个小小的英文笔误。

当天下午，我的一位大学同学就在群里转发了新消息：这个结果不是新的，北大数学教授徐树方在他90年代出版的一本关于矩阵计算的书中，关于实对称三对角矩阵，就给出了同样的结果。很快，其他关于同一公式的史实记录纷至沓来，一直追溯到1968年美国加州大学的一位线性代数教授汤姆生 (R. C. Thompson) 及其弟子，以及其他人发表的与之相同或等价的等式。到了第二天，陶哲轩等作者的说明也飘然而至，提供了有关这个结果的部分历史事实。在被发现的文章中，证明公式成立的基本假设似乎都没有超出埃尔米特矩阵的范畴。埃尔米特矩阵是其共轭转置等于它自己的一类矩阵。

一个小小的数学浪花，由于冲浪者的鼎鼎大名，通过快速的网络传播，汇成了一股股滔滔巨浪。这就是现代通讯技术的力量。

下午做完了学术报告，与对我演讲论题颇感兴趣的系主任交流片刻后，我待在师兄的办公室等待另有活动的他，于是在手机上开始阅读陶哲轩他们的文章，很快就读懂了漂亮而精炼的证明。突然一个念头冒出我的脑海：这个让媒体活跃的公式对比埃尔米特矩阵更为广泛的正规矩阵是否也对？一个矩阵A如果其共轭转置与它可交换，即A^HA = AA^H，则被称为是正规矩阵 (normal matrix) 。对于埃尔米特矩阵A，由于A^HA = A² = AA^H，它也是一个正规矩阵。对于酉矩阵U，由于U^HU = I = UU^H，它同样也是一个正规矩阵，然而许多酉矩阵并非是埃尔米特矩阵，如平面上的旋转矩阵。可见，正规矩阵类比埃尔米特矩阵类大得多。

我很快发现，陶哲轩关于埃尔米特矩阵所证明的公式，可以一字不漏地证明对正规矩阵也成立，因为它们具有公式证明所需的一个共同性质，那就是埃尔米特矩阵及更一般的正规矩阵A都是可酉对角化的，即存在一个酉矩阵U，使得U^HAU是一个对角矩阵。

这个发现让我的情绪开始高涨，并激起了强烈的好奇心，想知道对比正规矩阵更一般的矩阵，“陶氏公式”是否依然有效。因为可酉对角化这个性质是正规矩阵的一个特征，我猜测对于非正规矩阵，这个公式不再为真。但是这时我的师兄回到了办公室，我们需要出去吃晚饭了，然后去他家——以往我每次来访，都住他家，就像他每次应邀来访我系做报告时住我家一样。

1986年1月3日是我到达密歇根州立大学读书的第二天，那天上午当我第一次去我未来的博士论文导师李天岩教授的办公室见他时，在门口先碰到了他来自韩国的博士生李弘九，从此我就和这位师兄建立了长久的友谊。他的名字中有“九”，而我的名“玖”则是大写的“九”，所以我们生来就有亲如弟兄的缘分。他和他的四兄弟中的三个，都是汉城大学（现叫首尔大学）的毕业生。除他之外，他的二哥也在美国拿到博士学位，后来成为总统李明博的科学顾问。在他于1987年拿到博士学位离开密歇根前，那个夏天我们两人专门组成了一个讨论班，轮流报告著名数值代数学家豪斯霍尔德 (Alston S. Householder) 所作的一本矩阵论名著。三十多年来，我们不仅一直保持亲密的朋友关系，而且在过去的十多年中合写了不少论文。

这次访问堪萨斯城的周五，饭店晚饭聊天讨论数学后，回到他家已经9点半，他建议我早点洗漱休息，毕竟那天早晨我3点多就离家开车90分钟去的机场。在楼上的客房准备就寝前，我却不想睡了，因为我急于想用自己的语言写下对正规矩阵公式的证明。于是我伏案工作了一个小时，写下了这个证明。

第二天早晨我起得较迟，因为前一天实在累了。我们决定早饭后去他的办公室继续讨论数学，包括我已做好的关于正规矩阵的公式证明。我的师兄有很强的数学根底，李天岩教授也曾在我面前夸奖过他的数学。尽管他和他当护士的太太将人生的一大块用于宗教活动，希望拯救一些人类分子的心灵，但他同样一直保持着对数学的热爱和对未知世界的探索激情。这一点他和我的大师兄、北卡州立大学的朱天照教授完全一样；朱教授在他的个人网页上这样讲：Teaching is my love, Research is my hobby, and Preaching is my calling.（教书是我的所爱，研究是我的嗜好，布道是我的使命。）我对他们两人的人生取向十分敬佩，可惜我却做不到所有这些。

我们两人周六的办公室讨论、思考及数值试验，富有成效。在多年的合作中，我更多地担当着思想者的角色，常有新奇的想法从脑子里冒出，而他常以实践者的面貌出现，在计算中时有出乎意料的观察与发现。比如在将近十年前，我们在研究用最大熵方法计算不变密度函数时，正因为他在计算的实验中发现了关键矩阵的奇异性，促使我想出了将有限元的思想与最大熵原则相结合的现代最大熵方法，一举扫除了经典最大熵方法的病态问题，导致了第一个样条函数最大熵算法的诞生。我的师爷约克 (James Yorke) 曾经说过：“计算可能导致伟大发现。”此话不假。这一次，师兄的计算验证也加快了我改进埃尔米特矩阵特征向量计算公式的步伐。

一到办公室，李弘九就用他熟练掌握的MATLAB随机地取了一个正规矩阵，一验算就发现我所证明的公式正确。这里还有一个插曲。当我从洗手间回到他的办公室，刚刚完成计算的他对我说：“Jiu，your formula is wrong！(玖，你的公式不对！) ”我一听大吃一惊，但我不相信这个断言，于是请他给我再现计算过程。到了最后一步的检验阶段，终于发现了一个下标错误，改正后电脑的屏幕上立刻出现了令人兴奋的等号。

接着，他又随机地算了一个矩阵，果然如我意料之中，公式不对。这样我们对公式的本质有了进一步的认识。下面的事就是寻找公式的进一步的推广。

陶哲轩证明公式成立的关键假设是可酉对角化矩阵A具有相互正交的特征向量基底。比可酉对角化矩阵更一般的矩阵是可对角化矩阵。对于矩阵A，如果存在一个非奇异矩阵S，使得S^-1AS是一个对角矩阵，那么A被称为是可对角化的。这时S的所有列均为A的特征向量，并且构成酉空间的一个基底。然而这些特征向量一般不满足所希望的正交性条件。缺乏特征向量两两正交的有用性质，我同样能获得那个漂亮的等式吗？整个周六，我都在思考这个问题。

当我沉浸于求解一个问题时，我的注意力都会高度集中，这是我在几十年的学习和研究生涯中养成的习惯。在我以前所写的文章《数学应该怎么学》中，我强调了“专注”对于研习高等数学的极端重要性，把它列为读书成功的必要因素。这时，我再一次得到了专注的眷顾。

我敏锐地注意到，陶哲轩对公式给出的第二个证明的思路可以继续向前推进，但是它的叙述方式却不易找到推广的新方向。于是，我将矩阵视为有限维线性变换，采用了线性代数的“函数论”分析法：两个线性变换如果在定义域空间的基底上给出同样的结果，那么它们相等。正如林开亮博士在刊登于《数学文化》杂志上的一篇书评中所述，这种线性代数中的几何论证法，在哈尔莫斯 (Paul Halmos，1916-2006) 的名著《有限维线性空间》及他的徒孙、我的老师阿克斯拉 (Sheldon Axler) 教授的教科书《线性代数应该这样学》中到处可见。

于是，将陶哲轩的原始证明思想稍加变形，我找到了将正规矩阵推广到一类可对角化矩阵的关键想法。借助于正交投影之力，我终于开辟出到达目标的一条通道。我觅得的宝藏是：设v₁，v₂，…，v_n为矩阵A的线性无关的特征向量，若第i个特征向量v_i长度为1，并且与其他n-1个特征向量都正交，则陶哲轩的公式依然为真。

其实上述的推广公式仅仅是我对任意可对角化矩阵获得的一个等式的推论！它的另一个推论则给出了n乘n阶可对角化矩阵的所有特征值与它的n个(n-1)乘(n-1)阶主子矩阵的所有特征值的一个等式关系。虽然我从未见到过这个看上去也长得不错的公式，但常常孤陋寡闻的我不敢相信我是这个关系的第一个发现者，或许顶多只是一个独立的发现者，就像这一波数学新闻的主角那三个物理学家和陶哲轩一样。

当我完全写满五页纸的数学手稿，其中两页竟然是我出发前打印出的两张登机牌的空白反面，并留下更多页数的演算草稿时，我也快要结束我的堪萨斯城之旅了。这是一次收获满满的旅行，不仅仅是因为我们师兄弟俩在两年不见后再次相遇，也不仅仅听我讲座的研究生事后告诉他如何从我的演讲中爱上了遍历理论这门学科，更令我愉悦的是现代通讯支撑、中国腾讯发明的微信给了我再次被数学所激励的动力和干劲，让我过足了充分满足好奇心的瘾！

手稿的其中一页 | 丁玖拍摄

周日下午，当和我一样因与陶哲轩“共舞”一场而同样兴高采烈的李弘九教授把我送到归程的机场后，我候机时突然想起了三十年前的一次数学之旅，不过它与旅行无关，更没有微信的帮助。那年夏季，李天岩教授在教了我们几个弟子一门一学年新课《[0, 1]上的遍历理论》后，给了我一次练笔的机会，帮助他在其于日本京都大学所作的一系列演讲稿的基础上写出一本计划出版的书稿。当我写到著名的“乌拉姆方法”以及他对一类区间映射的“乌拉姆猜想”证明这书中最后一章时，突然好奇心大发：乌拉姆方法用的是“逐片常数函数逼近”，作为计算数学专业的本科毕业生和硕士，为什么不试试逐片线性函数或更高阶的逼近法？于是我拿起纸笔，劲头十足地演算起来，很快就大功告成，设计出两类新的数值方法，并证明了收敛性。这项没有“计划经济”指导的“市场经济”产品，马上成就了我的博士论文，尽管之前我已经写出两篇不同领域的文章。我在南京大学受过训练的最优化理论出身，却终于让位于“计算遍历理论”这一新兴学科，让我后来为此忙碌了三十年。

坐在机场的候机厅，我也想起另一次数学之旅。将近十年前，我读到一篇杨振宁先生的采访记，其中有他关于杨-巴克斯特方程的历史描绘和“辫子解释”，非常生动。读后我想，如果将这个方程的每个因子视为矩阵，则可定义一类二阶矩阵方程，不妨称之为“杨-巴克斯特矩阵方程”，以示对这两位老先生的尊敬，就像解非线性代数方程组的牛顿方法一样。于是我拉上了我的李师兄，一起踏上好奇这个非线性矩阵方程解结构的挖掘之旅。我的大学同学魏木生率领他的弟子对一般的矩阵找到了这个方程的所有可交换解。

带着对中西部平原有点依依不舍的离别心情，带着对师兄太太为我准备精美健康早餐的美好回忆，我登上了飞向亚特兰大的飞机。在万米的高空，窗外是一片蓝天，心中是一片阳光。是啊，如果时光回流，我再年轻三十岁，我还会有许多可能不让机会流逝，探索数学之美，满足好奇之心，享受发现之乐。年轻的学子，你们生活在知识信息大爆炸的时代，你们有数不清的机遇，抓住它们，与之共舞，你的创造之源就会汹涌喷薄而出，你的智慧之光就会照亮前方。不管你的发现是大是小，不管你的结果是重是轻，最值得你自豪的，最值得你回味的，最值得你沉浸之中而忘掉一切的，最值得你孜孜以求度过时光的，就是你“吾将上下而求索”的整个过程。这就是我度过11月15日到17日这个周末的全部感想。

写于2019年11月29日星期五