这次再版,除了将原文的错误之处改正过来外,特别从科学月刊的“益智益囊集”专栏中选出四篇与微积分有关系的文章做为本书的附录。 在古时能求得球体的体积是被视为了不起的成就。它的求法和积分学的发展有密切的关系,附录一〈优雅美丽的球体〉所谈的就是祖冲之与阿基米德在这方面的成就。 无穷是微积分最需要澄清的观念,为了它微积分发展了计算的技巧。事实上,数学只用数学的方法解释无穷,而时空中的无穷则是千百年来哲学家、科学家谈论不休的焦点。附录二〈Achillies的脚跟〉提供这方面谈论的一些资料。 微积分的基础在于实数系统的建构;人类认识实数有一段漫长而曲折的历史,附录三〈无法理解的数〉及附录四〈实在而具体的数〉是这方面的参考资料。 曹亮吉于台大数学系73年11月
要学好一门学科,总希望弄清楚它的来龙去脉。微积分是人类文化史上的一大成就。其历史更是每个现代人该具有的基本常识。可惜一般微积分课本言不及此,或浮光掠影而不能深入。专论微积分历史的书本又往往深入而不浅出。使读者迷失于细节发展而昧于主流变化。 这本小册子适合大一学生之所需,可做为学习微积分的前瞻与回顾,希望借此而对微积分有更深刻的认识。为此,我们只以解析几何的知识为本,鸟瞰微积分历史。并附以习题。以收深浅适宜,反覆咀嚼之效。 曹亮吉于台大数学系69年夏天 写作主要参考资料
近几世纪以来,科学技术非常发达,究其原因,数学要居首功。举凡物理、天文、化学、工程、地质、生物等等,甚至社会科学所产生的许多问题,往往要依靠数学工具来解决,而数学工具之中尤以微积分学最为犀利、最具功效。 微积分是微分和积分的合称。微分是用来研究变化率,而积分是用来求积的(即算曲线长、面积、体积)。但就像乘法和除法一样,微分和积分两者之间却有互为反运算的密切关系,所以必须合起来一起研究,因而合称为微积分。 本文的主要目的是想从历史的眼光来探讨微分、积分观念的由来,技巧的演进,微、积分的合流,微积分的用途,其发展中所遭遇到的困难及解决的途径。 历史上,积分的观念比微分的要发展得早,所以我们先从积分谈起
人类进入了农业社会后,因为丈量土地、建谷仓、筑宫室等等的需要,求积的方法就日形重要起来。 首先,人类可能用一日的行程、一头牛一天可耕过的土地等方法来量长度、算面积。但随着精确度的要求,长度及面积都必须要有固定的单位。 通常面积都是以某种正方形为单位的(譬如一平方公尺)。由此出发逐步可得一般正方形的面积为一边的平方,矩形的面积为长乘宽,平行四边形的面积为底乘高,而三角形的面积则为底乘高之半。因多边形可分划成三角形之和,所以其面积也可求得。除了这些图形之外,最简单、最吸引人也最实用的可算是圆形了。那么圆形的面积怎么求得?在此我们触到了积分学的源头了。 “圆形的面积是多少?”“圆周率乘半径的平方。”“圆周率是什么?”“圆周与直径之比。”“比值是多少?”“3.14”“再精确点!”“3.1416”“再精确点!!”“3.1416……”“……是什么?”“?” 圆周率通常以希腊字母π 来表。大家都知道求圆面积就等于求圆周率。那么圆周率到底是多少?怎样求得它的近似值呢? 据史籍所载,四千年前的巴比伦人用做圆周率,同时期的埃及人则用 ,而三千年前的中国人则用3。其后有用、 、、3.14等等来代表圆周率。这些都是近似值,有的纯由经验求得,有的则佐以一些理论。此外,最值得称道的是西元前三世纪的希腊科学家阿基米德(Archimedes, 287~212 BC)算得圆周率介于 及之间,而三国(大约西元260年)时的刘徽,则得其近似值为3.14159。他们的特色是提供一套能够计算圆周率值精确到任何位数的方法──至少理论上可行
阿基米德的方法是由圆内接正六边形出发,先计算其周长,做为圆周长的一个近似值,然后再由此周长计算内接正十二边形的周长,做为圆周长更正确的近似值。如此边数逐次倍增。则所得周长虽仍然小于圆周长,但却愈接近圆周长。一般而言,单位圆内接正n边形和正2 n边形两者周长S n和S 2 n之间,有一代数关系,如果前者已知,则后者亦可求。同时阿基米德又用外切正多边形的周长从外方逼近圆周长。当内接及外切正多边形的边数为96时,阿基米德就得到他的圆周率估计值。阿基米德的方法源自所谓的“穷尽法”(method of exhaustion)。古希腊数学家尤多绪斯(Eudoxus,约408~355 BC)就有用已知的面积(或体积)逐渐穷尽某一面积(或体积)的想法,再辅以一些技巧而证明了“两圆面积之比等于其半径平方之比”,“两球体积之比等于其半径立方之比”,“圆锥的体积为同底等高圆柱体积的三分之一”等定理。 刘徽则用正多边形的面积来逼近圆面积,当边数增加到3072时就得到他的近似值。这种逼近方法原理虽然简单,但计算时要不断开平方,过程非常繁复。南北朝的祖冲之(429~500)居然算到16384边,而得知圆周率介于3.1415926与3.1415927之间。 这种圆面积的算法虽然繁复,但其逼近的原理却发展成了积分学。(关于圆周率,可参考《科学月刊》第十卷第八、九、十期(1979)的“益智益囊集”或Petr Beckmann 原着,姜家齐、朱建正、林聪源合译的《π的故事》,凡异出版社。)
穷尽法虽然创自尤多绪斯。但大大发扬光大的就要数阿基米德了。阿基米德除了求圆周率的近似值外,还巧用穷尽法求得许多面积和体积。现在我们来看他如何求得抛物线的弓形面积。
如图一,AB为抛物线的一割线,自其中点M作直径(平行于抛物线轴的直线叫做抛物线的直径)交抛物线于C,则阿基米德证明了弓形ACB的面积要等于的倍。
首先,他证明了弓形ACB可以被一连串的三角形所“穷尽”。这一连串三角形的作法如下:从AC、BC的中点K、L各作直径,分别交抛物线于P、Q,得三角形、填充于弓形与之间的空隙处。依同法,从AP、CP、CQ、BQ的各中点作直径交抛物线于四点,而又可得四个三角形填充于所剩下的空隙。如此反覆进行,就可以得到一连串的三角形。那么这一连串的三角形能“穷尽”弓形面积吗?也就是问,能把空隙填满吗?用眼睛看显然不成问题,但阿基米德还是给了一个证明:如图二,过C点作切线,则此切线平行于AB;过A、B作直线平行于CM,分别交切线于D、E,则得平行四边形ADEB。因此弓形ACB。同理可证 弓形APC,弓形BQC。一般而言,每一新阶段所作的三角形都能把剩下的空隙填掉一半以上,所以这一连串的三角形终究能把弓形穷尽。
第二步要证明这些小三角形的面积和有着简单的关系。阿基米德证明了= 、 。如果的面积为A 0,则第一次填空隙的两个三角形其面积和为 。同理,第二次填空隙的四个三角形每个面积都等于第一次填空隙所用三角形(如)的,所以总面积和。如此类推,第n次填空隙的三角形面积和A n等于 。所以
这不就得证了?但慢着,上面的计算用了无穷等比级数的和公式 而阿基米德时代的人们只会求有限项等比级数的和。所以为了证明弓形的面积确实等于 ,他用穷尽法中典型的间接证法做了第三步的讨论: 由等比级数的和公式知
假如弓形的面积A大于 ,则因诸A n可以穷尽A,所以当n够大时,会落在 及A之间,即;但由先前的(1)式知应小于 ,故得矛盾。反之,如果A小于,则可以选很大的n,使得
但由(1)式,得
比较(2)、(3)两式,得 ,这又是个矛盾。既然或 的假设都不对,A当然就得等于 了。 当然,实际上阿基米德是求得了无穷等比级数的和,但因为他没有明确的极限观念,不能由 的等比级数和公式,一下子跳到 的结论。(即愈加愈多时, 变得愈来愈小,终致消失。)事实上,在那时代,大家还不会处理负号,所以上面的说明及计算中,凡有负号的都要移到等号的另一边,这更使我们了解阿基米德论证之不易。
除了抛??物线的弓形面积外,阿基米德还用穷尽法求得很多面积和体积(譬如球面的面积和球体的体积等)。因为情况的不同,阿基米德用的穷尽办法也不一样,譬如在穷尽抛物线弓形面积时,他就利用了不少抛物线所特有的性质。所以在求各种面积(体积)时,穷尽的原理虽然相同,其方法却未能统一,这是穷尽法的致命伤。阿基米德之后,后继无人,将近两千年之间,求积的方法居然没有什么进步。
其实,阿基米德另有方法来补穷尽法之不足。为了知道某一面积该是多少,他把该面积想成是由无穷线条所组成(见图三AB),然后技巧地应用杠杆原理求得了面积。但他认为这种方法不够严密,所以知道了面积之后,再用传统的穷尽法加以证明。
用现在积分学的眼光来看,他用杠杆原理求面积的方法并没有什么不严密之处;只是当时对“无穷”及“线条”没有明确的观念罢了。 阿基米德把如何用杠杆原理求积的方法写在一部叫做《方法》(The Method)的书上。可惜这本书消失了两千一百年之久,直到1906年才重新出现。但求积历史发展的结果,却与阿基米德把面积看成由无穷个线条所组成的看法吻合。一旦大家弄清楚了“无穷”个“线条”(宽为“无穷小”的矩形)之“和”,也就是积分学成熟的时候。 杠杆原理和求积扯得上关系?这是杠杆原理开山祖师阿基米德的一项杰作,详情请参考附录一。(或参阅康明昌先生的《微积分入门》,七十一年故乡出版社,第二章第一节。)
阿基米德之后,后继无人,直到文艺复兴时代,古希腊之学逐渐受西方重视,科学渐兴,求积问题才引起很多人的探讨。 为了求得更多的面(体)积,大家放松对严谨的要求,几乎舍弃了阿基米德步步为营的精神。这之中经得起考验而日后成为积分学主要思潮的有两种方法,其一就是把面(体)积看成由无穷线条(薄片)所组成的无穷小方法;另外一个是经过改良的穷尽法──动态穷尽法。第一种方法诉诸直观,虽然论证欠缺严谨,却予积分学的发展很大的动力;第二种则论证较严谨,终于使求积方法有了深厚的数学基础。 在这一节里,我们光看无穷小与求积的关系。
无穷小的观念起源很早,到文艺复兴以后,用它求积的人很多,且看法、求法各有千秋,我们只能举几位代表性人物,如刻卜勒(J. Kep??ler, 1571~1630)、伽利略(Galileo Galilei, 1564~1642)及卡法里约利(B. Cavalieri, 1598~1647)等人。 刻卜勒认为圆是个无穷边正多边形,所以圆面积等于无穷个无穷小三角形的面积和。每一三角形的高为圆的半径,而其无穷小的底边则在圆周上。因为每一三角形的面积为×半径×底,所以这些三角形的面积和为×半径×圆周。同理,他认为圆球是由无穷小的圆锥体所组成,每一圆锥体的顶点就是圆球的球心,高就是半径,而底面积(无穷小)则在球面上,由此可推得圆球体积为×半径×球面面积。除此之外,他还求得一些面积和旋转体的体积。
伽利略在讨论等加速运动时,用无穷小的论证法证明时─速曲线下的面积就是距离,这是求积的应用跨出纯粹求积范围的一大步。他的想法如下:设一物的运行速度v和时间t的关系为v = 32 t,则在t - v坐标中,该关系由一直线OB所表(见图五)。在任一时刻A '的速度等于A ' B '长,所以在此时刻所走的距离为A ' B '长乘以“无穷小”的时刻,即“线条A ' B '的面积”。当时间由O变到A时,线条A ' B'也逐次由O变到AB,所以总距离为诸线条A ' B '“面积”之和,也就是的面积。设A点的坐标为t,则距离= 的面积= 。
速度是距离的变化率,而将速度函数“求积”则回到距离函数,这种求积与变化率的互逆关系,就是所谓的微积分基本定理。当然,那时候时机还未成熟,伽利略没办法有这么深刻的认识。 以严谨的眼光看无穷小方法,会发现它有种种的困难,譬如,什么是无穷小?无穷个无穷小的和又是什么意思?虽然很多人想办法要把这些几何观念严密化,但一直没有成功。直到最近经罗宾生(A. Robinson, 1918~1974)等人的努力,无穷小的观念才有了数学基础。但要深入了解无穷小的数学,却需要有些逻辑学的训练,一般人是否能经由此途径学得微积分,还有待时间的考验。 无穷小方法虽然身分一直不明,但若谨慎使用,用处也很大,所以深受数学家的欢迎,譬如,卡法里约利就用无穷小的方法推算出很多面积。但是许多人对其不严密性深感不安,而另谋发展途径,其中最有成就的是下一节要谈的动态穷尽法。
无穷小方法除了提供直观看法外,还留下一条非常有用的卡氏原理(Cavalieri Principle)。卡氏原理不但是直观的产物,而且是可用现代微积分学证明的一个定理。我们先用一个例子来说明卡氏原理的大意。如图六,设、等底等高,我们可用无穷小方法证明其面积相等:设B ' C '、E ' F '为分别平行于BC、EF的直线,且距底边等高,则由比例可知B ' C '= E ' F '。既然、分别由相等的线条B ' C '、E ' F '所组成,所以两三角形应该有同样的面积。
卡法里约利所提的原理可由下面两段文字来表示。 一、如果两立体具有同样的高度,而且与底等高且平行于底面的截面积两两成固定的比值,则这两个立体的体积比等于该固定的比值。 二、如果两面积具有同样的高度,而且与底等高且平行于底线的截线长两两成固定的比值,则这两个面积的比等于该固定的比值。 可注意者,卡氏原理虽由直观而得,但其内容却不含任何暧昧字眼(如无穷小等);用现代的眼光来看,它是个定理。反覆利用这个原理。卡氏证明了圆锥体的体积为同底等高圆柱体体积的三分之一。 不但西方有卡氏原理,中国也有,而且要早千年之久。南北朝时的祖冲之,就一再巧用这个原理,不用现代微积分技巧,就求得球体体积的公式(请参考附录一)。卡氏原理也应该叫做祖氏原理! 我们现在用这个原理来求椭圆的面积。
为了了解动态穷尽法。我们再举抛物线的例子。 例:求抛物线y = x 2及两直线y =0、x = b之间的面积。 由§2抛物线弓形面积可推得我们现在要求的面积等于 。但我们现在要用动态穷尽法做这个题目。
设B点的坐标为( b ,0)。将OB等分成n段,每段长,分段点的横坐标各为、、…、 。如图八,在这些线段上、抛物线下作矩形。这些矩形的面积和为 S n可以做为欲求面积??S的一个近似值。如果n愈变愈大,则由直观可知S n愈来愈近于S。所以我们让n趋向于无穷大,看S n能否趋近于一个定数。如果能,则此定数应该就是我们所要求的面积S。 我们可以用数学归纳法证明 所以 如果n愈变愈大,则、 这两项愈变愈小,而S n就愈来愈趋近于,所以S应该等于。用现代的符号来表示,则 表示n愈变愈大的情况下,表在此情况下取极限值(limit)
很明显地,上面这种计算面积的方法也是一种穷尽法,但它和§2中所谈的穷尽法却有些不同。§2的方法,在作第n +1阶段逼近时,把第n阶段所得的面积固定不动,再在空隙中填进一些小面积,合起来作为第n +1阶段的逼近。现在的方法并不把第n阶段的近似面积固定,而是重新用比较瘦小的矩形和作n +1阶段的逼近。因为用作逼近的矩形随时在变动,所以称为动态穷尽法。这种方法有很多特色: 一、随着n的增加,每个矩形愈变愈瘦,渐渐趋近于线条,而终于能把面积穷尽,直观上和无穷小方法的看法相当接近。 二、每一阶段的逼近有一定的规则可寻,不像传统的穷尽法要利用所给曲线的特殊性质。 三、每一阶段的逼近只用有限个矩形,其面积和理论上可以算得,不像无穷小方法不知道如何严格处理无穷个无穷小的和。
穷尽法和无穷小方法最大的不同处,是前者每一阶段都是我们能够处理的有限项和,但我们又让项数趋向于无穷大而取得极限值,所以它又能担任无穷的角色,因此这种用极限的穷尽法是潜在的无穷法,而不是真正的无穷法。有了这些特色,动态穷尽法应用的范围较广,所得的结果也较令人信服。譬如y = x m(m为正整数)、、等曲线下的面积就可以用这种方法求得。
动态穷尽法也有它的困难处: 一、每一阶段的逼近面积不一定可以用简单的式子表得出来。 二、纵使表得出来,当n趋向于无穷大时,其极限值为何有时候也不容易求得,尤其当时对极限的观念、求法都还在摸索阶段。 三、“随着n的增加,所得的逼近面积是否愈来愈接近所要求的面积?”也就是问“逼近面积能否穷尽原面积?”这个问题也没办法用严密的方法证明(指当时而言)。 动态穷尽法可以说开始于史蒂芬(S. Stevin, 1546~1620)的工作。(一说阿基米德就用过,待考。)他在算一物体的重心时,就曾经用许多瘦长的平行四边形来逼近三角形。(重心的计算也可以用积分的方法!) 其后瓦略里奥(L. Valerio, 1552~1618)曾经提出:一面积如果由内逼近和由外逼近(譬如圆由内接正多边形和外切正多边形来逼近)的两种逼近面积之差可以变得任意小(内外夹击!),则内逼近或外逼??近的面积都会穷尽原面积。这种看法在观念上算是解决了动态穷尽法的第三项困难,其技巧上的困难连同第二项困难则有待极限观念、技巧的澄清。(即,何谓穷尽?)这个工作直到十九世纪,经柯西(A. Cauchy, 1789~1857)、维尔思垂斯(K. Weierstrass, 1815~1897)等人的努力,才获得完全的解决。 为解决第一项困难,大家试着用更具弹性的逼近法,即每一阶段的逼近并不要求把横轴等分,而且第n阶段也不一定要分为n线段,只要每一分段长随着n变大而变小,终于趋近于0就可以了;此外线段上矩形的高度不一定要在曲线下(内逼近)或在曲线上(外逼近),只要在两者之间就可以了。主要的目的,就是利用所给曲线的特性而作适当的横轴分段,作适当高度的矩形,使所得的逼近面积容易计算。这就更显得“动态”两字的意义!现在我们习用的积分就是由动态穷尽法演变而来的。
现在再回到抛物线下的面积,看它由内、外两方逼近的情形。如图九,由外逼近诸矩形的面积和为 因外逼近T n与内逼近S n的差T n - S n( )可以变得任意小,所以根据瓦略里奥的原则,我们可以确定S n ( T n )的极限值确实是S的面积。 若把等分横轴的方法用到曲线y = x 3下的面积时,则第n阶段的内逼近面积和为 要把 的公式求出来可要花很大的工夫。纵使想办法把它解决了,当遇到y = x 4时又得算 ;y = x 5时,则要算……。 这样逐题解决绝不是办法。那么有没有“通吃”的办法把曲线y = x m(m为正整数)下的面积问题一举解决呢?有的,至少有两种办法,一种是不算而直接算 的极限值,另外一种就是费玛(Fermat, 1601~1665)所巧用的横轴分割法,他一举就求得逼近面积的公式。 例:求曲线y = x m(m为正整数)下的面积。
解:固定0与1之间的一个数c(见图十),费玛把OB分成无穷段,其分段点的横座标从B点往O点算各为 bc , bc 2 , bc 3 , …, bc k ,…。所以每一分段长并不相等,但成等比数列,愈接近原点线段长愈短。在这些分段上做内逼近矩形,得其面积和为 这个逼近面积当然和c值有关,所以我们用A ( c )来表。为了使每一分段的长度bc k- bc k +1(= bc k (1- c ))趋近于0,我们就让c趋近于1,这样A ( c )就应该趋近于所要求的面积。因为 所以当c趋近于1时,A ( c )的分子b m +1 c m趋近于b m +1,而分母共有m +1项,所以趋近于m +1,因此曲线y = x m下的面积为 。用现代的符号来表示,则 等式的第一项表曲线y = x m下及在横座标0与b之间的面积,读做函数x m在0与b之间的定积分。 值得注意的一点是,在A ( c )化成 之前,,如果这时候让c趋近于1,则分子、分母同时趋近于0。而A ( c )趋近于何值就不知道了。这种情形在做极限及求变化率时常常发生,如果学会如何处理这种情形,则极限及微分的技巧就学到大半了。 费玛的方法没有所谓的第n阶段逼近,因为对0与1之间的任何数c我们都可以做一次逼近,要点是最后让c逐渐趋近于1。如果勉强要分阶段,则第n阶段时令就可以了。 用同样的方法,若m为任何大于-1的有理数,费玛也求得 m = -1时的面积,则和对数函数有关,在此不做进一步讨论。另外有一个和费玛的方法类似,但只用有限个分段而能求得 (0 < a < b,m为不等于-1的任何有理数)的办法,请见本节的习题9
十七世纪的前三分之二,可以说是微积分学的酝酿时期。那时候因为科学的进步,除了求积的问题外,数学家还考虑种种其他的问题,其中最重要的有: 一、由距离求速度及加速度;反之,由加速度求速度、求距离。 第四类问题起源较早,我们大致已经谈过。值得补充的是,到十七世纪大家已经知道求曲线长或重心的问题,都可??化约成为求面积、体积的问题。 关于第一类问题的第二部分,我们已经谈过伽利略的看法。他是对的:由速度函数求积就得到距离函数。 剩下求速度、切线及极大、极小的问题,就是我们这一节所要谈的主题──微分学。 由于文明的推进,静态事物的研究已经不能满足人类的需要,动态的世界逼着科学家研究起速度来;从纯几何的观点来看,数学家对任何曲线都要想办法求其切线,而光学上的需要更促使科学家急着寻找作切线的方法;人总是想用最经济的办法做最高度的发挥,而描述自然界现象的函数,往往在其极值时有特殊的物理意义,这种种都使人关心起求极值的问题。
平均速度的观念很容易使人接受,但(瞬间)速度的观念则使人类奋斗良久,才弄得清楚。刻卜勒的行星运动定律、伽利略的落体运动定律、钟摆、抛射体的运动等等,当时大家有兴趣的问题都显示运动常常不是等速的,所以(瞬间)速度的研究有其必要。最早的想法,瞬间速度就是“瞬间”的平均速度。但“瞬间”到底是多短呢?如果这一“瞬间”没有长度,则在这一“瞬间”内距离没有什么变化,所以 不是个数,自然不能表速度,所以此路不通。好了,“瞬间”一定要有长度。但所谓的长度如果是通常观念中的长度,那么它的一半不也是长度吗?那么“瞬间”怎么还能称做“瞬间”呢?此路又不通!那么“瞬间”到底是什么?于是有人想出绝招说:“瞬间”的长度为无穷小,它不为0,但比任何的长度都要小。又遇到了“无穷小”! 同样地,当时作切线、求极值时都要诉诸无穷小方法。我们谈积分的时候,说到无穷小的观念虽然诉诸直观,但其运算却没有严格的基础,当时只能用一些巧妙的方法求得零星的结果。直到后来才知道用极限的观念及技巧来代替无穷小,而做严格且有系统的处理。求速度、切线、极值这些微分学方面的历史发展也是一样,有无穷小的观念,有巧妙的方法,有极限的方法。 大概说来,积分的观念容易懂但计算难,而微分正好相反,难懂而易算。为了不使大家像前人一样,陷入微分观念的泥沼里,我们先用极限的方法弄清楚了微分的观念后,再回过头来看前人如何在泥沼中用巧妙的方法挣扎着。
不但在x =2可以求得速度,在任一时刻x = x 0,求速度的方法也是一样: 这种求速度的方法不限于y和x间要有如y = x 2的特殊关系,只要y和x有任何关系y= f ( x ),我们都可以考虑在x 0附近的平均速度 ,然后考虑 ,即当x趋近于x 0时D ( x )的极限值。如果极限值存在,我们就说该极限值就是在x 0的速度。
既然求斜率及求速度的方法完全一样,为了综合也为了推广,对任何函数y = f ( x),都可以考虑平均变率 及其极限值(瞬间变率) 。如果极限值存在,则称此极限值为函数f ( x )在x 0的导数(derivative),记做f '( x)。若X 0在某范围内,f '( x 0 )都有定义,则X 0到f '( x 0 )的对应是一种函数,称做原函数f ( x )的导函数,记做f ' ( x )。求导数的过程叫做微分(differentiation),研究变化率及其应用的这门学问叫做微分学(differential calculus)。用微分的观点来说,求速度和求斜率是一码事(即求导数),可以一起考虑。不只如此。凡是想知道一函数f ( x )在x 0点因变数x而变化的情形,我们就要求其变化率,也就是f ( x)在x 0点的导数f '( x 0 )。所以从现代的眼光看来,微分是求变化率,而速度与切线斜率只是其中的两种特例。 导数的一大应用就是决定函数的极大、极小值。把函数y = f ( x )用曲线表出(见图十二),则过其极大值或极小值点的切线要平行于x轴。所以切线斜率要为0。因此满足f '( x )=0的x 0,可能(但不一定)就是函数f ( x )取得极大或极小值的地方。
现在来对照一下,在没极限观念之前,大家是怎么求速度、切线及极大、极小值
刻卜勒最先注意到极值与变化率之间的关系。他在计算啤酒桶的体积时,想到了种种的极值问题。譬如,他曾证明内接于一定球内的圆柱体体积,要以直径与高度之比为者为最大。他列了一连串圆柱体直径与高度及其相对应体积的数据,从其中取体积最大者而得其“证明”。在检视数据时,他发现一项有趣的事实,即,将近极大值时,体积的(随直径或高度而变的)变化率变得愈来愈小。根据这种观察费玛用无穷小方法解决了一些极值问题。下面是一个例子。 例:设一线段长为a,将它分成两段,以之作矩形的两边。问如何分法,使所得的矩形面积最大。 解一:(微分的方法)设两段长各为x及a - x,则面积为f ( x )= ax - x 2。若x = x0时有极大值。则求导数 f '( x 0 )= a -2 x 0,令其为0而得a =2 x 0,即将原线段等分可得最大面积。(等周的诸矩形中以正方形的面积为最大。 解二:(费玛的方法)设两段为x 0及a - x 0时面积最大,则矩形面积为ax 0 - x 02。设E为无穷小量,以x 0 + E代替面积公式中的x 0,而令之与原式相等: a ( x 0+ E ) - ( x 0 + E ) 2 = ax 0 - x 0 2,化简得 a 0 E = 2 x 0 E + E 2,除以E后得a=2 x 0 + E,丢掉无穷小量E,得a =2 x 0。 根据刻卜勒的观察,当f ( x )近于极大值时,其变化率愈来愈小,所以费玛认为在x0及其无穷小近邻x 0 + E的f值应该相等,这是费玛方法的关键处(妙着!)。得a=2 x 0 + E后,因E为无穷小,起不了作用,所以过河拆桥就把它丢了(又是一妙着!)。但在求得a =2 x 0 + E前要先以E去除,否则一下子把E丢掉(E =0)则什么都没有了──还没过河不能拆桥! 仔细比较两种解法,会发现解二其实就是解一:令x = x 0 + E,则 a ( x 0 + E )-(x 0 + E ) 2 = ax 0 - x 0 2就是f ( x )= f ??( x 0 );化简除以 E (= x - x 0 )后就得;丢掉无穷小E其实就是令x趋近于x 0,而得f '( x 0 )=0。
费玛的方法巧则巧矣,但就像积分中的无穷小方法一样,有许多地方不能令人信服:把f ( x 0 + E )和f ( x 0 )相等及丢掉E时,就是认为E =0;但用E除等式时,则认为,这是无穷小神秘狡滑的两面性。但是也像积分中的无穷小方法一样,微分的无穷小方法颇受数学家的激赏,直到两个世纪后,导数有了严格的定义,才能完全取而代之
最早的切线观念,大概是研究圆而有的。早期的数学家认为切线就是只交曲线于一点的直线,而其求法则依曲线而有不同。有了解析几??何,笛卡儿(R. Descartes, 1596~1650)想到用求重根的方法来求切线的方程式。但如果遇到复杂一点的曲线,则求重根的方法非常不好用,而且切线也不一定只交曲线于一点。另外有一种方法,就是把曲线看成一物体在水平及垂直两方向有了速度而描出的轨迹,所以切线应该是水平及垂直两速度向量的合向量。罗伯瓦(GP Roberval, 1602~1675)、托里拆利(E. Torricelli, 1608~1647)等人就用这种看法求得不少曲线的切线。但曲线怎么一定和运动有关呢?况且求速度的问题也和求切线的问题一样,大家还在摸索之中。可是这种看法却大受欢迎,日后且演变成牛顿的流数法──一种微分法。
费玛求切线的方法如下:设PT为过P点的切线,交横轴于T(见图十三)。TQ称为次切线(subtangent)。费玛的方法就是想办法求得TQ长,以之决定T点,由T点就可作切线了。设QQ 1 (= E )为TQ方向的无穷小增加量。因 与 相似,故 。但T 1 R几乎和P 1 R相等(因E为无穷小),所以用后者代替前者可得 在费玛所考虑的曲线,上式右边的分母都很容易提出E而与分子的E约掉,然后丢掉E(E =0),求得TQ的值。 仔细研究一下,就知道费玛的方法和现在的极限求导数的方法相近:以P 1 R代替T1 R就是先以割线代替切线;丢掉E就是极限的方法。只是当时动态的极限观念还待萌芽,只能以具有两面性的无穷小量来代替了。 这时代求速度或求变化率时所遭遇到的困难和求极值、切线时所遭遇的一样,大家都没有明确的极限观念来处理“瞬间”的问题,只能诉诸神秘的无穷小方法。其典型的技巧及改进的方向将在下一节谈到
一般简略的说法说:“微积分是牛顿(1642~1727)及莱布尼兹(G. Leibniz, 1646~1716)两个人发明的。”这句话怎么讲呢?在他们之前不是有许多人做了很多积分及微分的工作吗?不错。但是牛顿、莱布尼兹承继了前人零碎的知识, 一、有系统地发展了微分的技巧, 如果把微积分看做一整体性的学问,则无疑地,牛顿与莱布尼兹是这门学问的催生者。我们固然不能否认前人的贡献,但也得承认牛顿与莱布尼兹是促进微积分发展的第一大功臣
动态穷尽法虽然使求积进了一大步,可是繁复的步骤以及求和、求极限的困难,都限制了它的应用范圈。而微积分基本定理的发现,不但使看起来毫不相关的求积与求变化率紧密相连,而且使求积的方法有了革命性的突破。基本定理的要义之一,就是说求积是求变化率的反运算,所以会求变化率就能解决许多求积的问题,而微分学经有系统的发展后。求变化率的计算变成远较求积简单的一种运算。 在牛顿、莱布尼兹以前,对微分、积分最有贡献的大概要算费玛了,可惜他未能体会两者之间的密切关系。而牛顿的老师巴娄(I. Barrow, 1630~1677)虽然知道两者之间有互逆的关系,但他不能体会此种关系的意义,其原因之一就是求导数还没有一套有系统的计算方法。古希腊平面几何的成功,予西方数学非常深远的影响,一般认为,唯有几何的论证方法才是严格的,才是真正的数学,代数也不过是辅助的工具而已。直到笛卡儿及费玛倡导以代数的方法研究几何的问题。这种态度才渐有转变。可是一方面几何思维方式深植人心,而另一方面代数方法仍然未臻成熟,实数系统迟迟未能建立,所以许多数学家仍然固守几何阵营而不能有有效的计算方法,如巴娄就是。牛顿虽然背叛了他老师的纯几何观点,发展了有效的微分方法,可是他的方法迟迟未敢发展。虽然他用了微积分的技巧,由万有引力及运动定律出发说明了他的宇宙体系,但为了害怕时人的批评,在他1687年的巨著《Principia》中,却把微积分的痕迹抹去,而仍以古典的几何论证方式论述。
把微分学从求速度及作切线,转变成求一般变化率的要首推牛顿。他的微分方法的演变,可分为三个阶段,以他的三本有关微积分的书为代表。第一本《论分析》(De Analysi),于1669年在其朋友间开始流传,但直到1711年才出版。在《论分析》中,他用的方法和费玛的类似,属于无穷小方法。他假设某曲线y = f ( x )下的面积z和x的关系为z = ax m(m为分数)(见图十四)。如果x增加了无穷小量o(这是牛顿用的符号,不是零),则面积增加了oy,所以z + oy = a ( x + o )m。右边以二项级数展开得z + oy = ,消去z = axm,再去掉o,则得 ,再去掉o,得y = amx m -1。
在这个过程中,牛顿不但给了有系统的微分方法,而且证明了求积可以从变化率着手──微积分基本定理。譬如令,则面积为 ()的曲线是y = xm -1;反过来说,即曲线y = x m -1下的面积为 。牛顿利用微积分基本定理以及无穷级数,求得许多面积及许多求和(可以化为求面积 ??)的问题
牛顿的第二本书《流数法与无穷级数》(Methodus Fluxionum et Serierum Infinitarum),成书于1671年,但直到1736年才出版。他认为“变数”(现代的用语)是随时间而变动的,而不是由无穷小量所组成的。这种变数x , y ,……称为“流”(fluent),而其变化率, ,……则称为“流数”(fluxion)。如果o是时间的无穷小变化量,则、是x、y的无穷小变化量。如果x和y有y = ax m的关系,则。以下的做法和第一种方法一样,而得 。若要求y对x而言的变化率,则以除以可得变化率= amx m -1。流数法和第一种方法形式上并没有什么差别,而观念基本上仍然持无穷小看法,但“流”比静态的无穷小量较具有动态的意义。
牛顿的第三本书《曲线求积法》(Tractatus de Quadratura Curvarum),成书于1676年,但直到1704年才出版。在这本书中他的做法就是现代的极限方法,但他的极限观念并不成熟,譬如他不以为极限值是个数,而认为是个“最后”的比值。 虽然牛顿引进了极限方法求变化率,但他并不是极限方法的热心倡导者。做为自然科学家,他只要能有效地求得变化率,并不在乎求法的逻辑严谨。所以有时他用极限方法,有时又回到流数法;有时甚至忘了把流数、乘以时间的无穷小变化量o,来表x与y的无穷小变化量。而仍以变化率、表示变化量。他的从者更是搞不清,甚至认为流数就是无穷小变量,而把它和莱布尼兹的无穷小量“微分式”(differential)搞混在一起。
莱布尼兹的微分法是以微分式起家的。在他之前,许多人都利用类似§5图十二中“三角形”PRP 1;P 1和T 1(或三角形PRT 1;P 1和T 1在无穷小微分法中总是被看成一点)的特有性质。莱布尼兹注意到求斜率实际上就是求“三角形”PRP 1的两边P 1 R及PR之比。这两边分别是y轴方向及x轴方向的无穷小变量,分别以dy及dx表之,而有斜率 。既然斜率是两量之比,为了舍弃无穷小量的神秘性,可把dx定义做x轴方向的任何变量(不是无穷小),而dy就随着y与x之间的关系而定义成为(斜率) × dx。这样dx、dy都是平常的量,而且还是等于斜率。事实上、莱布尼兹就是这样定义dx和dy的,而现代的微积分也是这样定义的。可是斜率要先有明确的定义后,这样定义dx和dy的方法才有意义。但莱布尼兹刚好相反,没明确地定义斜率就有了dx及dy,然后为了要得到斜率,他还是得把dy、dx看成无穷小量,而以其比值为斜率。 因此,在莱布尼兹的著作中,dx、dy实际上还是脱离不了无穷小量的神秘色彩,这和现代先有斜率(导数)后有普通变量dx、dy的看法完全不同。无论是怎样的看法,dx、dy都称为微分式。 莱布尼兹怎样处理dx和dy,而得到微分式的公式呢?首先,他考虑两个变数x 1、x2,而求其乘积的微分式d ( x 1 x 2 )与dx 1、dx 2之间的关系。他猜了一阵子,最后给他猜对了:d ( x 1 x 2 ) = x 2 dx 1 + x 1 dx 2。(用现代的微分式观点,这个式子是对的。)上式中,如果令x = x 1 = x 2,y = x 2,则dy = d ( xx ) = xdx +xdx = 2 xdx,所以斜率= ,这是对的。一般假设 dx m -1 = ( m -1) x m -2 dx是对的(m -1为正整数),则当y = x m时, dy = dx m = d ( xx m -1 ) = x m-1 dx + xdx m -1 = x m -1 dx + x ( m -1) x m -2 dx = mx m -1 dx。所以由归纳法可得:若m为正整数,y = x m,则 dy = mx m -1 dx,而斜率= 。 同样地,他先猜出 与dx 1、dx 2之间的关系是 ,然后导出当m为负整数时,y = x m的微分式也是dy = mx m -1 dx。更进一步他没经证明就大胆地说:不论m为任何分数,上式总是对的。
莱布尼兹微分式的关键之一,在 d ( x 1 x 2 ) = x 2 dx 1 + x 2 dx 2。这是怎么得到的呢?d ( x 1 x 2 )表量x 1 x 2的变量,这个变量是因x 1变成x 1 + dx 1,x 2变成x2 + dx 2而产生的,所以d ( x 1 x 2 )应该等于 ( x 1 + dx 1 ) ( x 2 + dx 2 ) - x 1 x 2= x 2 dx 1 + x 1 dx 2 + dx 1 dx 2。现在非得假定dx 1 , dx 2为无穷小变量了。在此假定下,dx 1 dx 2比dx 1或dx 2都要小得多,所以可以略去不计,而得 d ( x 1 x2 ) = x 2 dx 1 + x 1 dx 2。 莱布尼兹用无穷小的方法求得很多公式,譬如指数函数。对数函数的微分式等。他把积分看成无穷小的和,也知道微积分基本定理,而且更将微分及积分的运算性质和公式做个总整理。而使微积分学变成一套有系统的学问。他的微积分符号非常方便,不久就取代了牛顿的符号,直到现在还是独他一家,别无分号。 虽然莱布尼兹的论证不严格,但他的观察非常敏锐,知道怎样的公式才是对的,??又设计一套非常方便的符号及运算方法,所以他对微积分的贡献非常大。其不严格处,则有待极限方法的引入后,先定义导数再定义微分式这种方法来补足。 微积分学在牛顿及莱布尼兹手中以崭新的姿态出现,也在他们的手中发挥了解释自然现象的最大功效。这方面的贡献,毫无疑问地。要把牛顿放在第一把交椅上。有了微积分这种犀利的工具,牛顿用他的万有引力定律及三大运动定律,解释星球的运行、物体在媒介(如空气、水等)中的运动;决定星球的密度、地球的偏扁率、行星的日长;解释并决定地轴旋转的周期、潮汐的成因与高度等等。 牛顿的后人继续操着微积分这把牛刀,披荆斩棘,把人类的科技文明带向空前未有的高度。
粗略地说,微积分学经过两千多年的酝酿,在牛顿、莱布尼兹手中诞生,在十八世纪成长,而在十九世纪有了严格的基础后变得成熟了。牛顿、莱布尼兹虽然把微积分系统化,但它还是不严格的。可是微积分被成功地用来解决许多问题,却使十八世纪的数学家偏向其应用性,而少致力于其严格性。当时,微积分学的发展幸而掌握在几个非常优越的数学家,如欧拉(L. Euler, 1707~1783)、拉格朗日(JU Lagrange, 1736~1813)、拉普拉斯(PS de Laplace, 1749~1827)、达兰伯(J.??de R. d'Alembert, 1717~1783)及伯努利(Bernoulli) 世家等人的手里。他们有敏锐的直观感,知道什么样的公式是对的;而且研究的问题由自然现象而来,所以能以自然现象的数据来验合微积分的许多推论。使微积分学不因基础不稳而走向歧途。在他们的手中,微积分学的范围很快地超过现在大一所授的微积分课程,而迈向更高深的解析学。 微积分的应用非常广泛。我们知道积分原来是要求积的,但逐渐地,大家发现许多问题都可以化成求积的问题,如重心、重量、压力、矩、功等等。下面来谈谈微分学的功用。
我们要研究动态的事物,就要研究各种变数的变化率,这是微分学最重要的课题。如果两变数之间有某种关系,则其(对某变数而言的)变化率之间也会有关系的。如果知道其中的一个变化率,则其他的一个也随之而决定了。反之,若两变化率之间有某种关系。则我们可用积分的方法,求得原来两变数之间的关系。自然界的许多现象,其变化率和变数间常有某种关系,若用数学式子表示出来就是微分方程了。研究微分方程当然要用微积分。
除了 ??研究变化率及解微分方程式外,微分学还有一个非常重要的用途,那就是逼近。这要由切线谈起。切线是条直线,比曲线好研究太多。而且在切点附近,以切线代替曲线(即,在图十二中,以微分式dy(= T 1 R)代替y轴方向的变量P 1R),其误差很小。当然,在有些情况下,用切线代替曲线所得结果不很理想。但是简单曲线不只是直线而已,譬如二次维线我们也相当熟悉,也可以用来代替曲线。譬如图十五中用圆代替曲线,就比用切线代替曲线要好得多(在切点附近)。作切线要求导数,而作适当逼近的圆(叫做吻切圆)则要求导函数的导数。后者虽然较精确,但方法较繁,有得必有失,不能两全,取舍之间就要注意到实际的需要。研究了曲线的切线及吻切圆之后,曲线的性质就知道大半了。同样地,我们可以用微分的方法研究空间的曲线和曲面,这都属于微分几何学的范围。
如果把曲线看做量与量之间的函数,则上面的做法就等于求函数的近似值。当然,近似值就是有误差的意思。在数学上有误差不是不好吗?不尽然。首先,误差并不是错误;其次,就实际应用而言,在把研究对象加以量化时就已经产生误差,纵使我们在用数学工具时要求绝对准确,所得的结果仍然和实际的有差别。所以如果用切线代替曲线的误差,比量化时所产生的误差要小得多,我们何不轻轻松松作切线来代替曲线呢?如果精密度不够,则可以求导函数的导数或更高阶的导数。许多数值表,如三角函数表、对数函数表就是这样得到的。就实用而言,我们不怕误差的存在;就数学而言,我们要研究误差有多少,要把误差控制在许可范围之内。
其实,微积分的发展和函数的研究是相互的。牛顿求y = ax m的导函数时,就利用到函数( x + o ) m的二项展式。如果m是分数或负数,这个展式是个无穷幂级数。牛顿先用其他的方法推得这种幂级数,然后用来求y = ax m的导函数。反之,后人学会用别的方法求y = ax m的导函数,则可用来求( x + o ) m的幂级数表示法。一个函数用幂级数来表示,至少有下面种种的好处: 一、若 f ( x )= a 0 + a 1 ( x - c ) + a 2 ( x - c ) 2 + ,则用牛顿的方法可得f'( c )为a 1。 二、将幂级数的每项分别积分(微分),然后加起来得到的幂级数就是f ( x )的积分(导函数)。 三、如果只取幂级数的前几项,则所得的多项式为原函数的逼近多项式,譬如只取两项,则 y = a 0 + a 1 ( x - c )表过点( c , a 0 )的切线,这是所谓的线性逼近(linear approximation)。通常项数愈多则愈逼近。 用幂级数表函数固然方便,但有种种的问题发生。譬如,是不是所有的函数都能表成幂级数?如果不是,则那些函数能?能表成幂级数的才叫函数吗?函数是什么?如果某函数能表成幂级数,则其表法如何求得?幂级数是否收敛?用多项式逼近其误差如何决定?……
十八世纪的微积分利用函数的幂级数表示法迅速地成长了。反之,微积分变成研究函数的有力工具。连带地,函数的范围日渐广泛,而其观念也日益成熟。而级数的收敛问题,也逼使数学家再次面对整个微积分的基础问题:极限。 十八世纪的数学家知道微积分没有严格的基础,有些人也努力想办法补救,但都失败了。当时的大数学家欧拉和拉格朗日认为微积分虽然没有严格的基础,但其推论往往正确,其原因是在论证过程中,我们犯了一些错误,而这些错误互相抵消了(错错得对)!达兰伯甚至叫学生不要气馁,说持之有恒地用微积分,自然对微积分就会有信心。(就像老学究要学生背古书,不必求甚解,日积月累,终会把文义弄通一样!) 我们谈过无论是积分或是微分,想要把静态的无穷小法严格化,我们最后只能放弃无穷小观点,而代之以动态的极限观点,但极限的观点很不容易被当时的人接受。譬如,微分中的极限是两量比的极限,由于几何观点根深蒂固,人们总认为两量比的极限也应该是某两量之此,而不是纯粹的一个数。所以他们总是在探求这种“最后”比值的几何意义为何?而且不期而然地会认为是两无穷小量之比,或是两个零之比。这也就说明了虽然牛顿曾提过极限的方法,但他的流数法及莱布尼兹的微分式法还是大行其道。此外,遇到复杂一点的函数时,由定义直接求导数很难,这也使人裹足不前。同时极限的观念还牵涉到实数的观点,在后者没弄清楚以前,前者也很难发展得完美,这一点容稍后再谈。
有些人注意到,纯几何的方法没办法使微积分有严格的基础,所以转而求代数的方法,而错以为微积分是一种新的代数学。微分式法就是典型的代数方法。(回想一下,y = x m时,dy = mx m -1 dx是怎么得到的。)同样看法,级数间的运算也被认为是多项式间运算的一种延伸(幂级数就是无穷项多项式! ),而不必探讨这些运算的合法性。拉格期日为了避免微积分基础问题的苦境,也转用代数观点,他说任意函数都可表成幂级数,而其一次项系数就是导数。他的说法曾盛行一时,但也失败了。用现代的观点来看很清楚:不是任何函数都可表成幂级数,而纵使可表,其各项系数还是得用极限微分的方法求得。 十八世纪的积分学则因过分强调微积分基本定理而变成微分学的附庸。有的人干脆就把积分看做反微分,而不深究其定义。
微积分基本观念的混乱直到十九世纪初柯西力倡极限方法才得大部分的解决。他用现代的极限观念定义了导数、积分,重新证明了许多基本公式,证明了微积分基本定理,又探讨了级数的收敛问题。这是现代解析学的诞生,微积分不但不是一种几何学而且也不再是一种代数学。 十八世纪微积分学发展的结果,使函数的范围增广,包括了一些不完全连续的函数。对不完全连续的函数而言,微积分基本定理要做相当的修正,也就是说积分不完全是微分的反运算。积分被平反了,不再被看成完全是反微分。这件事自有其历史上及观念上的意义。
柯西的极限方法并没有把问题完全解决。有两个大难题: 一、譬如,直观上,若一数列S 1 , S 2 , … S n , …递增(即 )且有界(即|S n |恒小于某定数),则 应该存在。但 到底是什么样一个数呢?我们会问什么样的数可以是极限值。举个例说,若 ,则S n是递增且有界的。但 是什么?这个问题就是所谓的实数系统的问题。除了 ??我们熟悉的分数,带根号的无理数外,还有那些数是实数?整个实数系统有那些特性?能够回答这些问题,才能知道在那种情形下会有极限值。很巧地,在1872年,维尔思垂斯等人不约而同地提出各种(实质上相同的)描述实数系统的方法。有了严格定义的实数系统做基础,这个问题就迎刃而解了。 二、如果猜到极限值为某值,如何严格地证明这就是我们要的极限值?譬如, ,则我们猜到 ,但怎么证明呢?为了回答这个问题,维尔思垂斯引进了所谓的 (念做epsilon delta)方法。 如此,微积分经过两世纪之久,才从诞生经成长而迈向成熟的阶段。 |
|