马尔科夫

刘钝 苏淳

(中国科学院自然科学史研究所)(中国科技大学)

  马尔科夫, A A(МapKOBAHдpeй AHдpeeBич)1856614日生于俄国梁赞市;1922720日卒于彼得格勒.数学.

  马尔科夫的父亲原先是梁赞省林业厅的一个低级官员,后来在官场遭到倾轧,只好带领全家迁居彼得堡.(彼得堡(пeTepбypr),1914-1924年改称彼得格勒(пeTpoгpaд),)他自己在一个有钱的寡妇家里担任管家.大约在此同时,马尔科夫腿部患了骨结核,直到10岁左右方经手术治疗好转,但是仍然留有一点后遗症,这段痛苦的经历对他的早年意志是一个很好的磨炼.

  中学时代,马尔科夫喜欢阅读Н.Г.车尔尼雪夫斯基(ЧepHь- IшeBCKий)、Н.А.杜勃罗留波夫(ДoбpoлюбOB)等进步作家的作品,因此屡屡遭到东正教会控制的学校领导的警告.有一次由于他在祈祷仪式上心不在焉,被学监斥责为无神论者和无政府主义者,只是考虑到他在数学方面的才华和父亲再三赔礼道歉之后,校方才保留了他的学籍.

  马尔科夫在中学时就开始自学微积分,有一次他独立地发现了一种常系数线性常微分方程的解法,因此写信给俄国当时最有资望的数学家В.Я.布尼亚科夫斯基(БyHOBCKий),信被转到彼得堡大学数学系的А.Н.科尔金(KopKиH)和Е.Н.佐洛塔廖夫(ЗoлoTapB)手里,从此马尔科夫与彼得堡大学的数学家建立了联系.

  1874年,马尔科夫考入彼得堡大学数学系.1878年毕业并留校工作,他的毕业论文“以连分数解微分方程”(Oб иHTeгpиpoBa- Hии ДиффepeHциaлHьIX ypaBHeHий пpи пoMo-щи HeпpepьIBHьIX дpoбeй,1878)获得当年系里颁发的金质奖.1880年,马尔科夫完成了“关于双正定二次型”(O биHap- HьIX KBaдpaTичHbIX фOPMax пoлoжиTeлbHoгo oпpeдeлиTeHия,1880)的硕士论文;从这一年起,他正式给学生开课.1883年,马尔科夫与М.И.瓦里瓦契耶瓦娅(BaльBaT-ъeBaя)结为伉俪,新娘的母亲正是他父亲当年的女雇主.1884年,马尔科夫以“关于代数连分数的某些应用”(O HeKoTopьIX пpи-лoжeHия aлгeбpaичecKиX HeпpepьIBHьIX дp- oбeй,为题通过了博士论文的答辩.

  1886年,经П.Л.切比雪夫(ЧeбьIшeB)提名,马尔科夫获得彼得堡科学院联络成员资格,1890年成为候补院士,1896年升为正院士.他积极地参加了科学院数理学部的学术和组织活动.

  马尔科夫从1880年开始,先是担任助教和讲师,1886年成为副教授,1893年成为正教授,1905年退休并获荣誉教授称号.二十五年来,他在彼得堡大学先后讲授过微积分、数论、函数论、矩论、计算方法、微分方程、概率论等课程,培养了大批出色的数学人才.19179月,因为彼得格勒已无正常的工作秩序,马尔科夫自愿来到梁赞省萨兰斯克城,无偿地为当地中学担任数学教师.十月革命后的1918年秋,马尔科夫重返彼得格勒,并为彼得格勒大学开设概率论讲座.

  1921年秋,马尔科夫的健康开始恶化,只得离开母校.在生命的最后一年里,他还在抓紧时间对汇集了生平心血的《概率演算》(Иcч-иcлeHиe BepoяTHOCTeй,CПБ,1900,изд.,2-e-19083-e-19124-e-1924)一书进行修改.

  在马尔科夫从事科学活动的时代,一个以彼得堡大学为中心的俄罗斯数学学派正在逐步形成,切比雪夫是这一学派当之无愧的领袖,科尔金、佐洛塔廖夫、Ю.Ь.索霍茨基(CoxoцKий)KA.波瑟(Пocce)、А.М.李雅普诺夫(ЛяпyHOB)和马尔科夫本人都是这一学派的重要成员.正是在这些人的共同努力下,俄国数学开始摆脱落后局面,并在数论、函数论、概率论等分支里出现了具有世界意义的成果.

  马尔科夫的硕士论文是关于代数数论中双正定二次型的极值问题的,他推进和完善了科尔金和佐洛塔廖夫不久前得到的结果,并建立了二次型表示论与丢番图分析之间的联系.在这项工作中,马尔科夫已表现出了善于联系经典问题、充分利用初等工具、追求解的精确性和实用性以及不畏繁复计算的典型的“彼得堡风格”.由切比雪夫所开拓的这种独特风格正是使俄罗斯数学走向世界并引起法、德等传统数学大国刮目相看的主要原因.的确,在切比雪夫众多的弟子们之中,没有人比马尔科夫更加“彼得堡化”了,多年以后有人向他请教数学的定义,他不无骄傲地说:“数学,那就是CF.高斯(Gauss)、切比雪夫、李雅普诺夫、斯捷克洛夫和我所从事的事业.”

  1901年以后,马尔科夫又一再回到二次型这一课题上来,并得到关于三元、四元二次型的较好结果.他也曾致力于理想素因子的分解研究,

  理想素因子的当时最好结果,并算出了A70的所有数据.

  切比雪夫曾将力学中矩的概念应用于证明概率论中的极限定理,他以连分数形式给出了某些极值不等式,但是没有提供证明.1884年,马尔科夫在“某些切比雪夫积分的证明”(Démonstrationde certaines inégalités de MTchebycheff 1884)一文中给出了证明,又在同年通过的博士论文的第三部分给出了切比雪夫问题的完整解答.这一研究导致了马尔科夫关于矩论的一系列论文,后来他在概率论的研究中对切比雪夫的矩问题作了许多深入的拓广.这些拓广的一个重要方面的内容是:若前n+1个矩为已知的非负函数f(x)在区间(ab)上满足不等式0 f(x) L(L为一给定常数),又设g

  能的f(x)的最大值和最小值,并分别确定使其达到极值的两个具体的函数f1(x)f2(x).这里已经出现了泛函的雏形,马尔科夫在假定了g(x)n+1阶导数存在且它本身在(ab)上不变号的条件下解决了这个问题,这使他得以建立起一种相当简单而又带有修正项的新的求积公式.他的这些工作,最初见于1896年发表的“连分数的一些新应用”(HoBьIeпpилoжeHияHeпpepьIBHьIXдpoбeй,1896)一文,而后又在1897年的一系列论文中作了进一步的阐述,其中最为重要的一篇是“关于矩的L问题”(L-пpoблeMa MOMeHTOB1897)

  马尔科夫的这一系列工作几乎是与荷兰数学家ThJ.斯蒂尔吉斯(Stieltjes)的工作同时而独立地进行的,但是后者更关心积分形式的意义,而不是其估值的结果,从而导致了一类应用广泛的积分的出现,为实变函数论的发展奠定了基础.斯蒂尔吉斯于去世前不久发表的综述性论文中,解决了无穷区间(0,∞)上的矩问题,并且给出了所要寻找的函数的一切整数阶矩的连分数表达式.作为回答与对这位学术知己的纪念,马尔科夫于1895年发表了“关于某些连分数收敛性的两个证明”(Deux démonstrationsde la convergence de certaines fractions continues 1895)一文,文中给出了斯蒂尔吉斯连分数收敛的充分条件.

  马尔科夫对实际问题具有浓厚兴趣.1889年,他在“关于一个门捷列夫问题”(Oб OдHOM BOпpoce Д.И.MeHдeлeeBa1889)一文中,解决了由彼得堡大学著名化学家д.И.门捷列夫(MeHдeлeeB)提出的一个问题,从数学上来说这一问题相当于找出定义在闭区间[ab]上的n次多项式f(x)之导数f(x)在某种条件下的最大值,它与切比雪夫所开创的对偏离零点的多项式的最大偏差的估计有关.三年之后,马尔科夫的同父异母弟弟弗拉基米尔(Bлaди- Mиp)将这一问题推广到求导数多项式的上确界的情况,可惜他这位颇具数学才华的弟弟26岁时便死于肺结核.马尔科夫还研究过空间曲面的投影转换、铁路弯道的曲率等实际问题.在微分方程领域,他致力于G.拉梅(Lamé)方程和超几何方程的研究,其成果包括确定了一个超几何方程的两个解的乘积可为整函数的条件,以及这类函数与拉梅函数的零点分布问题.

  马尔科夫对数学的最大贡献是在概率论领域作出的.十九世纪后二十年,他主要是沿着切比雪夫开创的方向,致力于独立随机变量和古典极值理论的研究,从而改进和完善了大数定律和中心极限定理.二十世纪初,他的兴趣转移到相依随机变量序列的研究上来,从而创立了以他命名的著名概率模型——马尔科夫链.

  概率论中的一个基本问题就是探索概率接近于1时的规律,特别是大量独立或弱相依因素累积结果所发生的规律,大数定律就是表达有关这种规律的命题之一.1845年,切比雪夫第一次证明了伯努利形式的大数定律,次年又把结果拓广到泊松形式之上.马尔科夫不满意切比雪夫证明中要求随机变量的方差值一致有界这一条件,经过努力他找到了两个更合理的条件,极大地改进了切比雪夫的结果.

  中心极限定理是概率论极限理论的又一重要内容,它讨论随机变数和依分布收敛到正态分布的条件.在1884年马尔科夫对矩方法所涉及到的切比雪夫不等式给出了证明之后,切比雪夫于1887年得到了这一定理

夫提出的命题给出了精确的陈述与证明,文中所使用的改进后的矩方法后来被人称为“切比雪夫
-马尔科夫矩方法”.

  1900年前后,马尔科夫的低班校友李雅普诺夫引入了特征函数来考察中心极限定理,从而避免了矩方法要求高阶矩存在的苛刻条件,并为这一定理的进一步精确化准备了条件.多年来,马尔科夫力图在概率论中恢复矩方法的地位,最后他创造出了一种“截尾术”,即在适当的区域截断随机变量使之有界,从而在不改变它们和的极限分布的前提下保证任意阶矩的存在,他的这一成果发表在“关于李雅普诺夫院士情形的概率极限的定理”(TeopeMa Oпpeдeлe Bep- oяTHOCTи для CлyчaeB aKaдeMиKa AM ДяпyHoBa1909)一文中.马尔科夫的创造克服了特征函数方法过分依赖独立性的弱点,开辟了通向非独立随机变量研究的道路,并为强极限理论的发展提供了有力的手段.他与李雅普诺夫关于方法论的竞争,极大地丰富了本世纪初概率论的内容,对这门学科的现代化产生了深远的影响.

  出于扩大极限定理应用范围的目的,马尔科夫在本世纪初开始考虑相依随机变量序列的规律,并从中选出了重要的一类加以研究.1906年,他在“大数定律关于相依变量的扩展”(PacпpocTpaHeHиe зaKo- HOB бoлbщиX чиCeлHA BeличиHbI,зaBиCяшиe дpyг OT дpyгa1906)一文中,第一次提到如下一种试验序列:若每次试验能够实现且仅能够实现k件互不相容事件A1sA2s,…,Aks(s表试验号码)中的一件,而在第s+1次试验中实现事件Ais+1(i=12,…k)的条件概率只与第s次试验中发生的事件有关,而与更早的试验中发生的事件无关.这就是被后人称为“马尔科夫链”(严格说是“简单马尔科夫链”)的概率模型.

  例如,一个受到在t1t2t3,…时刻发生的随机推动的影响而沿着一条直线运动的质点,在运动过程中位于具有整数坐标aa+1a+2,…b的点上;在a点和b点上有反射性的壁障.当质点不在壁上时,每次推动使该质点以概率p向右移动而以概率q=1-p向左移动;若质点在壁上,则任何推动使它在两壁之间移动一个单位.可以看出,该质点在ti时刻以多大的概率在什么位置仅仅与它在ti1时刻的位置有关,而与它在t1t2,…,ti-2诸时刻的位置无关,这个质点徘徊的例子就提供了一个马尔科夫链的实例.

  在这篇论文中,马尔科夫证明了:在这种随机变量序列中,如果变些前提下证明了模型的各态历经性,成为统计物理中具有重要作用的遍历理论的第一个被严格证明的结果.

  马尔科夫链的哲学意义可用苏联数学家 А.Я.辛钦(XиHч-иH)的一句话来概括,这就是承认客观世界中有一种现象,其未来由现在所决定的程度,使得其关于过去的知识丝毫不影响这种决定性.马尔科夫链的建立实际上是Ch.惠更斯(Huygens)无后效原理的概率推广,同时也是对PS.拉普拉斯(Laplace)决定论的否定.在后者的宇宙图景中,任意系统在tt0时的状态ξ可由其初始时刻t0和初始状态ξ0唯一决定:ε=f(t0,ξ0t),这里f是一个微分方程.可是在马尔科夫的概率模型中,代替初始条件t0和ξ0的是一个条件概率,即在时刻t0处于状态ξi的条件下,于时刻t出现状态ξj的概率p(t0,ξit,ξj)对于三个相邻时刻t0t1t2之间的条件概率,存在着这里n表示状态的总数.这一公式与拉普拉斯的微分方程的不同就在于否定了系统中任一状态ξ与其初始状态ξ0之间的因果必然性.

  马尔科夫是第一个建立这样一种服从无后效原理的数学模型的人,但是他本人并没有提到这一模型在物理世界的应用.有趣的是,他曾用语言学方面的材料来验证这一模型.在《概率演算》的第四版中,他以 A C.普希金(ПyшKиH)的长诗《叶甫盖尼·奥涅金》中元音字母和辅音字母交替变化的规律,验证了只有两种状态的简单马尔科夫链在俄文字母随机序列中的存在.

  完成了关于链的大数定律的证明之后,马尔科夫又在一系列论文中开始研究链的中心极限定理.1907年,他在《科学院通报》(ИзBT-ияX AkaдeMии HayK)上发表了“相依试验的一种特殊情况”(ИccлeдoBaHиe зaMeчaTeлbHoгo cлyчaя зaB-иCиMьIX иcпьITaHий,1907)一文,文中证明了仅有01两种状态的齐次马尔科夫链的中心极限定理.1908年,他又在“一个链中变量和的概率计算极限定理的推广”(PacпpocTpaHeHиe пpe-дeльHьIX TeopeM иcчилeHия BepoяTHoCTeйHa cy- Mmy BeличиHCBязaHHbIX B цeпь,1908)一文中将结果推广到具有有限状态的任意齐次乌尔科夫链的情况,在这里转移概率满足一些特定条件.如同他的其他许多工作一样,他在这一证明中使用了矩方法.1910年,马尔科夫发表了“成连锁试验的普遍情况研究”(ИccлeдoBaHиe oбщeгo cлyч-aя иcпьITaHий.CBязaHHьIX B цeпь,1910)一文,文中证明了两种状态的非齐次马尔科夫链的中心极限定理,其中四个转移概率位于一个固定的区间(c1c2)内.

  马尔科夫提出的概念后来被扩充到连续时间和任意位相空间,按照欣钦的建议被称为马尔科夫过程,它是现代概率论中的一个重要分支——随机过程理论中的一部分.马尔科夫过程的一般理论及其分类是苏联数学家А.Н.柯尔莫哥洛夫(KoлMoгopoB)1930年完成的.马尔科夫所开创的这一研究引起了近代物理学、化学、遗传学乃至经济学与社会学观念上的革命,其真实性可由下述事实得到证明:那就是,在马尔科夫从事他的研究之前或同时,一些关于马尔科夫链甚至马尔科夫过程的实例就由其他科学家提供了.例如,1889年英国遗传学家F.高尔顿(Galton)对一个家族生存的调查就可归为一种具有可数状态的马尔科夫链;另一个模型于1907年由荷兰物理学家P.厄伦费斯特(Ehre-nfest)关于容器中分子扩散的实验提供.1912年,法国数学家Н.庞加莱(Poincaré)在其《概率演算》第二版(Calcul des probabilités2nded.,1912)中提出的洗牌问题,涉及到一个定义在置换群上的链的各态历经性质.法国数学家L.巴歇列埃(Bachelier)19001901年的关于投机理论的研究中接触到连续性的马尔科夫过程.其后А.爱因斯坦(Einstein)和波兰物理学家М.冯·斯莫卢霍夫斯基(Smoluchowski)在对布朗运动的研究中也接触到这一课题.第一个用马尔科夫过程来严格地描述布朗运动的工作是由美国数学家N·维纳(Wiener)1923年给出的.

  马尔科夫关于链的理论在本世纪得到一大批优秀数学家的继承与发展,他们当中有С.Н.伯恩斯坦(БepHшTeйH)、М.弗雷歇(Fréchet)、В.И.罗曼诺夫斯基(PoMaHoBcKий)、柯尔莫哥洛夫、W.费勒(Feller)P.莱维(Lévy)J.达布(Doob)等.近年来,中国数学工者作在与马尔科夫过程论有关的众多课题上也取得了令人瞩目的成果.

   马尔科夫生活的时代,正当俄国民主启蒙运动空前高涨和社会主义革命走向胜利的时代,他的思想和行为都体现了鲜明的时代特征.他曾就滥用概率论于“伦理科学”和用神学干预科学的倾向与布尼亚科夫斯基展开过论战.在《概率演算》一书中,他针对后者对“某些哲学家以极不体面的方式,试图把关于证据和传说弱化的概率公式应用到宗教信仰上”的攻击而写道:“对不大可能的事件的叙述就仿佛对久远年代以前发生的事件一样,显然应该予以极端的怀疑.”1912212日,马尔科夫致信东正教最高会议,信中写道:“我最诚挚地请求革除我的教籍.我所写的《概率演算》一书中的一些言论可以作为开除我的理由,因为这些言论已经充分表明我对成为犹太教和基督教教义基础的那些传说所持的否定态度.”教会一面在报纸上对他组织围攻,一面派人来劝说他改变初衷,但是马尔科夫声称“只与来人谈数学”,最后教会只好开除了他的教籍.

  1902 2月,科学院文学部联席会议通过了接纳М.高尔基(Гop-ьKий)为名誉院士的决议,但是很快引来了沙皇А.尼古拉二世(H-иKoлaй )的粗暴干涉,受到压力的科学院院务委员会只好又发布了一个取消高尔基当选资格的文告.马尔科夫同В.Г.科罗连科(KopoлeHKO)、А.П.契诃夫(ЧeXOB)等人一道参加了抗议活动.46日,他向院务委员会递交了抗议声明.在公开宣读这一声明的要求被拒绝之后,他又于两天后向院长递交了辞去院士称号的报告.直到1905年,他还不忘上书院务委员会,提请其撤销1902年的错误文告.

  1905年的民主革命失败以后,马尔科夫抵制了代表沙皇利益的第三届国家杜马的选举.他在给科学院的声明中说:“第三届国家杜马的建立完全违背了宪法,因而它根本不是一个代表人民意愿的议会,而只是一个非法的团体,因此我坚决请求院务委员会不要把我的名字列入选民的名单之中.”针对国民教育部1908年关于重申取消大学自治的通告,马尔科夫给教育大臣写信表示:“我最坚决地拒绝在彼得堡大学充当沙皇政府走卒的角色,但我将保留自己开设概率论讲座的权力.”

  1913年,沙皇政府为了转移国内日益高涨的革命情绪并准备帝国主义战争,决定以1613年全俄贵族会议选举M.Φ罗曼诺夫(PoMaHoB)为沙皇这一历史事件为标志举行罗曼诺夫王朝建立三百周年的庆典.与此针锋相对,马尔科夫以雅格布·伯努利(Bernoulli Jakob)的《猜度术》(Ars Conjectandi1713)的出版为标志,在科学界发起了庆祝大数定律发现二百周年的庆祝活动.

  马尔科夫去世后,他的遗体被安葬在彼得格勒的米特罗方耶夫斯基公墓.他的墓碑如同他的文章与讲课风格一样朴素无华.他在数学上的贡献和他为了科学与民主而奋斗的一生是值得后人景仰的.