二、郝柏林院士报告 主题:生物是物、生物有理
今天非常高兴能够回到59年前我曾经学习过的校园,刚才去转了一下,原来的东西剩的很少,变化非常之大。最大的变化是操场变得太小了,原来的操场非常大,在北京是有名的大操场,现在几乎三面都让建筑占掉了。总之,回到这儿来,心情是很不一样的。
今天是奉王绶管先生之命,到这儿来讲,题目是“生物是物、生物有理”。今天讲物体,说一点“活物”的物理。“物理”这两个字是来自庄子。我非常喜欢庄子的这段话,这段话告诉我们“天地有大美而不言,万物有成理而不说。夫圣人者原天地之美,而达万物之理”,做物理的人是圣人,在这个意义上讲,我们要把大自然的美弄清楚,达万物之理。
如果大家到颐和园去玩,到盘云殿,那是园中园,另外花钱买小票。从西面下来,有一个铜亭,铜亭出来的时候有一个门,出这个门以后回头看一下那幅对联,有一句叫“物含妙理总堪寻”。
20世纪的物理学,从微观世界到宇观世界,宇宙的大尺度,研究的是又深又远、又微又细,博大精深。不过基本上是研究“死物”。然而,20世纪的物理学,其中有一些方面,比方对凝聚态的研究、高分子、橡皮、非晶态、液晶,现在有一个大的名词叫软物质的研究,已经给研究“活物”做了很多准备,而且有一些直接的贡献。
从理论上看,20世纪有很大发展的自然科学、数理科学,随机过程、统计物理、计算机科学、非线性科学、复杂系统的研究,实际上给我们研究“活物”也提供了相当多的准备。
有人说21世纪是生物学的世纪,我作为一个物理工作者,我愿意说的是21世纪是活物质和生命现象成为物理学研究对象的时代。说的稍微远一点,作为物理学工作者,自己在这儿吹牛,有许多学问物理做进去了,这门学问才彻底明白了。有一个例子,化学其实比物理还古老,从炼金术,从古人炼丹的时候就开始了,但是化学的基本东西弄清楚,什么叫化学反应,实际上等到物理把原子和分子闹明白了,化学才彻底明白了。生物是要复杂的多的,物理学跟生物在21世纪会发生非常之多的交叉和相互作用的,对于我们不敢说是彻底,而是比较深入的了解生命现象,物理学肯定可以起到作用的。
物理学跟生物的作用,实际上是古老的问题。意大利人Galvani做了最早的化学电池,用电解质液体的瓶子放在桌子上,但是有一个电流源,可以拿电流做实验,1791年,18世纪的最后。有了电以后,干什么呢?给蛤蟆腿通电,他逮了一些活的蛤蟆,然后通电,一通电蛤蟆腿收缩,他想弄清楚电的生理作用,想发展电疗。所以我们常说电学跟电生理学是在同一位手里开始的。
生物学对物理学有过很大的贡献,这就是能量守恒定律。这个能量守恒定律是生物学家、医学家先明白的。这个故事是德国的大夫叫Mayer,他是一个随船大夫,那时西方的航海要比我们的厉害,19世纪,他在爪哇岛给病人看病,发现静脉血跟动脉血相差比较大,德国人的静脉血跟动脉血差别比较大,那时拉瓦西知道血液是传输送氧气的,所以Mayer想,之所以在爪哇岛反差不大,是因为那个地方温度高,人们消耗的热量少一些,而在德国氧的消耗多,所以反差比较大,他进一步想到马吃草,然后拉车,车轱辘在石头路上打出火花来,这都是能量在变,而这个能量一定是来自吃的草料里的能量。所以他想机械的能跟热量一定有关系,大家在物理学里现在学的是热功当量。实际上Mayer大夫是最早把热功当量的人,不过他算的并不精确,他想发表文章,寄到德国的物理杂志,被很多杂志拒绝掉,接受不了他这个观点。最后他找了一个小杂志,算是发表了一篇文章,时间是1842年。这篇文章还比大家公认的热功当量、热能跟机械能守恒,比焦尔的文章早了一年,焦尔的文章是1843年。同样是一个大夫,后来的物理学家Joule,把这个推广到其它的现象,乃至生命现象。
从历史上看,物理学给生物学提供了非常之多的研究工具,显微镜是非常重要的一个。显微镜是在荷兰这一带,在16世纪末发明的。有一个荷兰人叫Leeuwenhoek,他在1683年,首先在脏水里,在显微镜下面看到很多小的活动的东西,确认这些小东西是生物。到18世纪末,X射线衍射晶体结构,对生物学起了很大的作用。2003年全世界纪念了DNA双螺旋的发现50周年,1953年,这个发现很重要的实验根据是把DNA设法结的晶,然后做X光衍射,在衍射里可以看到有螺旋结构的图像。同样的蛋白质的结构,最早用X光衍射定出来的是1957年-1959年,这是英国的师生两个人做的,他们做的什么对象呢?做的是肌红蛋白跟血红蛋白,这就是在血肉里传输或保存氧气的蛋白质。他们之所以能做这个工作,是因为在市场上买到好几公斤新鲜的鲸鱼肉,鲸鱼是哺乳动物,它要呼吸,但它长期在水下,需要在肌肉里保存比较多的氧,它的血红蛋白比较发达。他们从新鲜的鲸鱼肉开始提取分离蛋白、结晶,最后测它的结构。血红蛋白比肌红蛋白大,大致是四倍,四个肌红蛋白凑在一块是一个血红蛋白。老师跟学生说你做小的,我做大的,大家要注意,这些老师是自己动手的老师,现在有一些老师只动口,不动手,这不是好现象。他让学生做小的结构,他自己做大的结构。学生在1957年做出来,他在1959年做出来,差了两年,不过在那个时代,差两年可以认为是同时做出来的,因为非常艰苦。如果大家查一查这位老师的经历,就会知道他为把这个结构定出来,准备工作了30年,才定出来最早的蛋白质结构。因此在60年代初,师生两个人分享了诺贝尔奖。
其它的各种各样的仪器,我只能点一下名字,各种各样的显微镜,扫描电镜、隧道电镜等等,各种各样的光谱设备,放射性的标记、示踪原子,核磁共振对认识生物起了很大的作用。近一百年发的诺贝尔奖,大概有五个诺贝尔奖跟核磁共振有联系。如果用X光做蛋白质,一定要把蛋白质分离成结晶才能做,很多蛋白质不知道怎么结晶,这不是科学,是一种艺术。但是如果用核磁共振做共振,可以在溶液里做,不要求结晶,问题是做的蛋白质比较小,大了有困难,当然人们正在努力的往大的蛋白质走。还有许许多多仪器,叫做化学仪器、生物仪器,从本质上看都是物理仪器,到了生物跟化学的实验室里。
1943年量子力学的创始人之一薛定谔,1943年由于战争的缘故,他在英国爱尔兰首府待着,他在那儿做了两次公众演说,演说的题目叫“什么是生命”,这是非常著名的演说,他把这个演讲整理出来,出了一个小册子,也是这个题目“什么是生命”,翻译成世界各国语言,包括中文汉语,在演说里他提了一些对现代生物学起了很大作用的思想。比如他说人吃饭或者动物吃东西,吃的是什么?到现在也这么说,我们吃的是热量,算卡路里,他说我们吃的是负熵。熵是混乱程度的测量,一个东西越乱熵越高,越有组织,越有系统,熵就降低。他说我们吃的是负熵,吃的是有组织的东西,增加我们组织程度的东西。道理很简单,吃进去的各种东西,把它消化到哪一步开始吸收。要消耗到原子、分子,不如干脆吃土、吃沙子、喝水,那就太不划算了。从哲学上讲叫做异化和同化,要把这个东西分解到一定的程度,但是要很上算,开始吸收,不能因为吸收以后,在你耳朵上长出猪耳朵,耳朵还是你的。所以异化和同化的过程,在大自然的净化里解决的很好。薛定谔用物理语言说你吃进去的组织有序,尽量使用上。遗传藏在哪儿,基因在什么地方,基因大概在组织非晶体里面。在1943年里,基因的概念已经有了,基因这个词是一九零几年出现的,那个时候知道许多重要的遗传特征藏在基因里头,基因排在染色体上,而且大概是线性排列的,甚至估计过一个基因很可能是几千、上万个原子,因为在那个时候人们已经相信物质的基本的东西都是原子、分子,如果估计出来一个基因是几千、上万的原子,马上就遇见一个严重的物理问题,这个物理问题是热涨落,遗传是非常保守、非常顽强的,虽然有点变异,变异率是相当低的,粗的说,如果看一个固定的蛋白质的某一个位置的氨基酸,什么时候从一个变到另外一个,十亿分之一的概率,在一年里发生变化,概率非常低,有点变化,但基本上非常保守。正因为这个缘故,才能种瓜得瓜,种豆得豆。比如人活在生理温度37度C,原子不断远东运动,这时就会把你保存的信息破坏掉,怎么解释这个信息能够一代一代在几十亿年保留下来,是一个根本性的物理问题,当时还不知道这个基因就是在GNA,在GNA里放着,薛定谔猜了大概放在非周期晶体里,在他说了这个话十年之后,定出了DNA双螺旋结构,就是1953。大自然把一个个基因连在非常大的大高分子里,热涨落的作用就要小多了,同样的可能同学们听说过遗传密码、三联码,“三”的思想也是物理学家先提出来的,有一个物理学家叫Gamow,1953年定出双螺旋结构,54年他就猜一定是三联码,不光猜,还造了一套三联码,Gamow错了,大自然没有采用他的码。薛定谔讲完报告以后50年,在1993年,在他做报告的同一个地方开了一次会,同一个题目“什么是生命”,请了6个诺贝尔获得者,还请了一些做了很多贡献的人做报告。1943年薛定谔做报告的时候,听众里有一个年轻的中国人,叫彭环武,是一个不知名的著名科学家,是彭先生70大寿的时候,《人民日报》专门发表了一篇文章,庆祝他的70大寿,文章的题目就叫做“不知名的著名科学家”,今年是彭先生90大寿,彭先生健在,共和国50年的时候给23位两弹一星的元勋发了奖,彭环武是23个人的名单中的最后一名,不是因为他的贡献小,而是因为他的比划太多,彭环武先生当时很年轻,他的学问很好,40年代后期回国的时候已经是爱尔兰皇家学会的会员。彭先生收到了邀请,让他去参加93年的会,彭先生说我年纪大了,不出国,不过我们从彭先生那儿知道了这个会,盯住了这个会,这个会议的文纪,很小的一本小册子,《什么是生命?下一个五十年》。
要想了解生物跟物理,从思想上讲有一个很不一样的地方,就是净化的观点。我们搞物理的东西喜欢定态,不随时间变,要是变的话也是周期,这类系统我们研究的比较多。一接触生物,就得知道所有的东西都是进化来的,而现在还在变,想了解进化,最好的办法就是看一下地球上的自然史。140亿年前的大爆炸,产生了我们所在的这部分宇宙,40多亿年,将近50亿年前产生了太阳系,这些年代都不那么可靠,人们用各种方法想办法推算。30多亿年以前,在地球上出现了最简单的生命。恐龙灭绝是6500万年以前,不到一亿年,人跟我们最近的亲戚灵掌类猿猴,在古生物里把化石做分类,追溯到350万年,要去查,现在连700万年的说法也有,几百万年里在古化石里可以区分古人类化石跟古猿的化石。跟我们最近的亲戚黑猩猩分开70万年前。我们的祖先从非洲走出来好多次,很多次失败了,没有活下来。我们这部分人的祖先智人,智人是生物学的学名,从非洲走出来到现在,大概只有3000代,不到10万年以前,有一小群人从非洲走出来,有人估计这群绝对没超过50个人。就是这一小群勇敢分子,沿着海边,他们那个时候学会打鱼,一点点到世界各地,成为了我们的祖先。年头并不是很多,北京的周口店的北京人,从学问上讲,真正分类,大概不是我们的祖先,它在分类里是属于直立人,跟智人不一样,不是同种。但是在同一个地方生活过的山顶洞人是智人,可能是北京人的祖先,这个话就很难说了,这段历史所有考古的问题都是有非常多的中间丢失的环节,很难连起来。
这些数字告诉我们,整个地球上的生命现象的变化,发生在几十亿年的时间里,而人的历史实在太短。我在最后一行给的是公元前221年秦始皇统一中国,到现在是2226年,时间非常短。在这么短的时间里,人已经从所有生活在地球上的动物里面脱离出来,太脱离了,脱离到由我们主宰这个地球,脱离到所有别的物种的生存依赖于我们,我们自己也开始认识这个问题,开始认识自然,认识我们自己。不过人类认识自然、认识自己的过程更晚,19世纪中叶以后,1859年,这个年头很重要,大家应当注意一下。1859年达尔文发表了著名的书叫做《物种起源》,这是现在的书名,我愿意用第一个中文翻译本叫“物种原始”,第一个把这本书翻译成中文的人是谁?是马军武博士,在座的人可能知道蔡元培,不大知道马军武。蔡元培是1911年孙中山先生领导辛亥革命胜利,成立中华民国临时政府,那个政府很精简,可能不到十个部,其中教育部长就请蔡元培担任,蔡元培做北大校长是之后的事。当时还有一个实业部,就是现在各种各样的工业加在一块儿,工业部的部长请的是千年科技史上最后一位状元张状元张柬,副部长叫次长请的是工学博士马军武,这两位都是做完部长、副部长以后当大学校长的人,做教育,马军武创办了广西大学,蔡元培后来做北大校长,是有名的教育家。在这点上,这些老教育家也是值得我们学习的。现在做完部长的人,再去做大学校长的可能不多,脑子里的等级观念太厉害。
马军武做完了实业部的部长也好,到广西做无烟火药工厂的厂长,然后创办大学,自己做第一任校长,做很多具体事情。他是孙中山的追随者,在20世纪初,一九零几年流亡日本的时候,就着手翻译达尔文这本书,后来因为辛亥革命就扔下来了,到1918年这本书才在上海出版,到1920年这本书第四次印刷。1859年,对于我们认识生物,认识自然界是重要的,因为达尔文的进化论那个时候提出来。1859年对物理学是重要的,大家可能听到过量子力学的产生是由于经典物理遇见了一些大的矛盾解决不了,其中有一个矛盾就是描写黑体的热辐射的理论,它要发散,没有一个有限的理论,而这个理论实际上的苗头从哪儿开始的?就是从1859年发表的辐射定律开始的,直接钻这个定律最终要钻到经典物理的矛盾。
1859年还有一件大事,马克思发表了政治经济学批判导言。马克思的这本书实际上是资本论第零卷,后来在资本论第一卷的序言里提到一场断断续续拖了很长时间的疾病,把我这本书的写作拉的很长,政治经济学批判是他最早准备的,已经提出了思想核心的东西,是一本很值得看的小册子。不管人们怎么看,马克思改变了19世纪后半夜,20世纪一直到现在世界历史的发展,是一个伟大的思想家,也是一个伟大的学者,当然也是革命家。这些事情都发生在1859年,算起来不长,一百几十年。
生物太多了,怎么研究?不可能研究所有的各种各样的生物,所以现在生物学家们几十年来、上百年来把工作集中到一些典型的生物上,比方说大肠杆菌、病毒、酵母,酵母是单细胞的,但是不能叫它细菌,它相当高级,跟人一样是有细胞核、染色体的,细菌只是在细胞里飘着的DNA,没有跟我们一样意义的染色体。小虫子,有一种非常短的小虫子叫线虫,果蝇立了大功,遗传学的很多知识从那儿得到的,有时我开玩笑讲线虫拿了一次诺贝尔奖,果蝇拿了两次,玉米拿了一次,看它研究的什么东西拿的诺贝尔奖。中国现在在做水稻基因组,水稻还没有拿诺贝尔奖,不会因为你研究水稻而拿诺贝尔奖,而是通过研究它作为一个典型的生物,发现了重要的生物现象、生物规律,这才有可能拿诺贝尔奖。当然,人自己是最重要的模式生物,所有的研究里,人占了很大的分量。
现代生物学研究的核心是遗传,遗传是有遗传物质、DNA等等。我把几个词先点一下,这几个词现在从做物理、做理论的人看来,已经粗略化,简化到符号序列的程度,通常考虑的DNA,脱氧核糖核算,或者没有脱氧的叫RNA核酸,是高分子、大分子。大家见到的普通的高分子,聚乙烯、聚氯乙烯,是一种单体,把乙烯聚起来就是聚乙烯,把二类乙烯聚起来就是聚氯乙烯等等。DNA是四种不同的单体,每种单体都是好几十个原子,起了一个名字,通常大家简单的都知道这几个字母叫SRAP,四个分子组成四个大分子,是一维的,一条线,不分杈,这个很重要,要是分杈就会出现很多麻烦。它有很多方向,不是人给它的,是许多生物过程自己按照方向进行的,比如复制、转路都有一定的方向。现在知道DNA是保存信息的,而生物功能多数是由蛋白质体现的,蛋白质自己又是大分子,而且不是一种单体,是20种单体,每种单体叫一个氨基酸,一共有20种,这些东西比核苷酸平均数还要小一点,几十个原子,用20个字母代表,它所构成的大分子也是一条线,不分杈,有方向,这个方向是生物学自己的,不是人给的,比方说有的蛋白质要在细胞膜或者某种膜上来回穿七次,注定尾巴在一面,脑袋在另一面,哪个放在外面,哪个放在里面是固定,不是乱的,从生物学上有方向的。大小不大一样,DNA从几百个字母到百万甚至一千万个字母,非常长。蛋白质从几十个字母到几千个,也许上万,但是现在绝大多数到7000、8000就算是很大的。再大了以后,从我们的观察,自然界不是采取把一个蛋白质做的特别特别长,开始用几个蛋白质把它们拼到一块,拼成一个复合体起作用,这件事情还需要研究和理解。
说到复合序列的时候,不要以为DNA蛋白质可以用序列符号描述。蛋白质的结构也可以用序列符号描述,蛋白质结构里有很多小层次的东西,可以起名字,用一个符号代表,然后说蛋白质从一个小的结构转入另外一个小的结构。生物学的文献非常多,把文献调到屏幕上就是符号串,英文字母、标点符号组成的,所以符号串的研究已经抽象离开生物一段距离了,对生物还很重要。
生物学的“中心法则”,DNA可以到DNA,叫复制。DNA可以转路到RNA,信使MRNA,可以翻译成蛋白质。绝大多数蛋白质是起催化作用的酶,酶就是蛋白质的某些种。变成蛋白质以后折叠起来,还要折叠成一定结构,发生相互作用,才体现出生物功能。这个图叫做现代分子生物学的“中心法则”。围绕“中心法则”已经给了30多个诺贝尔奖,现在可能并没有给完。
看一个简单的图,细菌只有一个简单的DNA的圈,托着尾巴的椭圆形的,差不多像大肠杆菌。而另一个细胞大的多,这是不成比例的,细胞里面那块是细胞核,里面有很多很多各种各样的东西,三个桔黄色的东西,弯弯曲曲的,叫线粒体,跟我们的呼吸、能量转换有关系。这两个细胞里有很多圆点,这些圆点是造蛋白质的工厂,叫核糖体,大肠杆菌大概有几万个,人的细胞里可能有百万个。
我们的遗传物质在细胞核里藏着,而且在细胞核的最中间这块藏着。蓝色的是遗传物质,染色体,这是23对染色体,黑白条不是乱画的,是把染色体在显微镜底下拿特定的染料染一下,什么地方白就一定白,黑就一定黑,研究的人一看就知道是几号研究体,正常不正常。
一个染色体是从DNA折叠出来的,这个地方的物理到现在还没有完全明白,画在最底下的是一个双螺旋,直径是两个纳米,是真正的纳米结构,微观的东西。但是这样的东西要每隔一定距离,绕到一团蛋白上,这个蛋白叫组蛋白,绕两圈半,再往前拉,再绕两圈半,再往前走,可以叫做丝线上绕上珠子,编辫子,辫子卷成麻花,麻花排成饼,饼要摞起来,最后变成在显微镜底下看的时候像一个叉。底下的东西是微观的,两纳米,而上面的东西是亚宏观的,用眼睛虽然看不见,用800倍显微镜就可以看到大致的样子。整整齐齐的染色体只是在细胞里生活的一段时间是这样的,很多情况之下不是这样的,在一段时间可以叫做比较标准的画在书里的样子。
怎样从这样的一股东西,经过六次明显对称的改变,组织上的折叠,成为一个亚宏观的对象。这个对象真正要转路的时候,有些部位需要很快的用上,要打开,还得把它折叠起来,这些过程在我看来非要到物理学家抠这些东西,两个大分子缠在一块儿,把那边算上去是四个大分子缠在一块,这些东西的过程要在分子一级最终弄清楚。
生物有很多结构,这是艾滋病病毒,不过看不到它的样子,要用电子显微镜等各种手段去做,做完以后艺术家画出来,画成这样的,它相当的对称和漂亮。这个东西很小,底下白的斜的是人的免疫系统T细胞的细胞表面,相当于T细胞,很小。生出一些东西欺骗T细胞,最后可以钻进去。
这些结构的东西里面有很多物理,为什么接近球形?如果一个细菌是圆球,球菌,这是最简单的形状。如果这个细菌成为一个棍,成了杆菌,从物理的角度讲,就必然有特殊的原因把它的一个方向变得跟其它方向不一样,它才能变成杆菌。
底下这张图是从一本书里借的,这是欧洲一些教堂的截面。上面是现在残留的一千年前的古教堂,那些教堂很小,里头没有柱子,旁边有几个小窗户,在欧洲的一些山里还可以看到。后来教堂变大了,这两个尺度不是一回事,底下的教堂大的多,变大以后,就得长出各种结构,各种泡,里头就得出各种各样的柱子,这时教堂才能变大。这件事情对生物也是必然的,只有单细胞的时候是球,后来变成别的形状,里头要出现很多别的结构,这里的问题归根结底要靠物理。
这是黏乎乎的黏菌,如果生活环境好就各自为战,一个分裂成两个,两个分裂成四个。如果环境不好,一个细菌感觉到很难活下去了,就向周围发信号说大事不好,这个信号是什么东西呢?是有机分子,把这些分子往外发。许多生物是用化学的化合物做信号,传递信号。所有的细菌觉得环境不好,都发信号,所以信号是很乱的一片,但是过一会儿它们突然找到了一个中心,大家都向这个中心聚拢,聚拢起来以后,长成一个菌珠,有一个菌丝,上面长了一个大泡,大量黏菌凑在一块长出来的。形象地说,大概要牺牲掉80%黏菌才能长出一个泡,泡里有很多孢子,每一个孢子将来可以变成新的黏菌。成为这个子以后,风一吹就可以飘到比较远的地方去,靠原来微观的那点,再爬也爬不了多远,这是它的生存秘诀,情况不好以后就变成孢子,风一吹飘走了,它的后代总有一些有机会碰到可以继续生存下去的。但是这件事情从物理学来讲,是非常典型的自组织现象,一开始是乱发信号,突然出现了一个中心,大家往那儿聚,这是突变。光是说这件事就可以说不少,所以黏菌作为自组织的对象,实验研究已经研究了很多年。
说一下轮子的问题。大家没有见过哪个虫子是蹬着轮子走的。哪吒是蹬着风火轮的,可是不要以为轮子是人类的专利。细胞里有不少转的东西,大肠杆菌有一根尾巴,使它可以运动,安到细胞膜上,是通过滚柱轴承安上去的,蓝色的东西是多个蛋白排成的,比方有九对对称的,是滚柱轴承。做轴承的可以是圆球,可以是钢柱,这是滚柱轴承,尺寸很大。
线粒体里有很多表面弯弯曲曲,有很多黑点,如果用超声波把它打碎,有一小部分自己马上变成一个小泡,黑点到外面了。再继续研究这个东西,就发现这个东西是长在膜上的,是好几个蛋白组成的一个小机器,这是一个分子马达,它换转,把这些蛋白划出来,上面有六块,三块大,三块小,中间有个轴,桔黄色的东西镶在膜里,膜的两面如果有一定的电位差,轴就会转,剩下的三个蛋白,大块的,做一件事,一种分子叫ATP,变回来,把ADP变成ATP。
所有的生物过程都需要能量,这些能量不是乱存乱用的,生物体是以非常经济的方式,把它们保存在一个磷酸根里,三磷酸根,什么时候需要能量,就变成二磷酸根放出能量,但是放完以后需要重新充电,重新变回去,在哪儿变的?在红色的块里变,靠它转的时候里面的一些生化过程。这些事情做结构做出来的,它果然是转的,在物理实验室里有人想了办法,把单个东西拿出来,人做不出来,这是巧夺天工的事情,变成足够的变位差转,在头儿上接上一根长丝,长丝上接点发光的东西,可以把它甩出来,长丝的直径可以是它的200倍,甩起来的东西可以在荧光显微镜下看到一个亮点,所以它是转的马达。
我转到这个领域里,现在是第八年,我们做了一些工作。看DNA的有些结构,这个网址里有一个软件,大家得用Unix系统,是.TAR.GZ文件,意义装到自己的Linux玩去,给出各种各样的图案,这是大肠杆菌等等。
发表水稻基因组的Science,2002年的杂志,定出水稻的12个染色体的基因草图,这只是很小的一点东西,不是染色体,是水稻的叶绿体,叶绿体也有一点DNA,很小,13万5000个字母,这是头,只有4个字母,A、C、G、T,没有别的,但是还编码着好几十个蛋白,编码着33个TRNA。人是32亿,水稻是4.3亿,我们拿到了3.9亿了,那些在染色体头上和中间,基因很少,也很难测量,还没有拿到。
要寻找基因,现在非常多的要靠计算机,把生物知识变成模型,在计算机里实现,去寻找基因。基因组有很多用处,细菌的分类。分类是人类认识自然界的头一步,给你周围的东西起名字,谁跟谁一样,都叫做驴、马、狗,各种各样的名字,哪些不一样,我们跟有一些东西比较接近,都是胎生的,都是喂奶吃的,有一些动物是下蛋的,这就是各种各样的形态特征,靠形态特征对动物和植物油了两三百年的分类系统。林可能大家听说过所谓林乃的分类系统,但是用这个原理给细菌分类比较伤脑筋,在显微镜下看到球叫球菌,棍叫杆菌,螺旋的叫螺旋菌,有的细胞不吃葡萄糖,有的喜欢空气,有的是厌氧的,有的是脱硫的,但是对细菌而言,没有多少形态特征可以供分类用,因此细菌的分类,长期以来是一笔糊涂帐。当然,从上个世纪70年代后期开始有分类,这点分类靠的是DNA、RNA里的序列,最近几年测了好多个细菌的完全基因组,所谓完全基因组就是全部的遗传密码测出来了,细菌比较小,全部的测比较容易。现在大概公开发表的,大家可以自己下载的不下230个细菌。怎么利用完全基因组细菌?就是从基本的密码出发把类分出来,这方面我们做了一些工作。有一棵树,相当不错,红色的一角这一大类叫古细菌,八个绿色的东西是有细胞核的,不是细菌的真核生物。旁边一大堆蓝色的是细菌,或者叫真细菌。古细菌跟真细菌分开,这就是上个世纪70年代后才明白的事情,原来把细菌叫做两大类。三类的分杈就在大红点上,所有的生物在大红点上分成三个大的超界也好,大的域也好。细菌分成了26个门,不过现在测了序的只有16个门,在这个图上规规矩矩的待着,不光门待着,门里的纲,比如固硫菌、固氮的菌都在这里待着,这个分类的图只用了基因组数据,这里输进去,那边计算机输出图,计算机输出的图没这么漂亮,拉的很长,比例不合适,没有文字,经过一点人的美学加工,但是这个图拿数学语言叫拓扑,这个东西是不能随便动。开玩笑地说这些细菌分类学的科学家们真不简单,他们工作了一百多年,得到了很好的分类系统,这个分类系统跟计算机一次输出达到了相当一致的程度。
我们可以做很多很多事情。我今天讲的有些内容实际上已经写出来过,在《物理》杂志上,2003年曾经连载上下两期,这篇文章在我的网页上也放着。
谢谢。
|