基因(Gene,Mendelian factor),也称为遗传因子。是指携带有遗传信息的DNA序列,是控制性状的基本遗传单位。基因通过指导蛋白质的合成来表达自己所携带的遗传信息,从而控制生物个体的性状表现。[1]
现代遗传学认为,基因是DNA分子上具有遗传效应的特定核苷酸序列的总称,是具有遗传效应的DNA分子片段。
基因位于染色体上,并在染色体上呈线性排列。基因不仅可以通过复制把遗传信息传递给下一代,还可以使遗传信息得到表达,也就是使遗传信息以一定的方式反映到蛋白质的分子结构上,从而使后代表现出与亲代相似的性状。
一个基因要有正常的生理机能,它的几个正常组成部分一定要位于相继邻接的位置上,也就是说核苷酸要排成一定的次序,才能决定一种蛋白质的分子结构。假使几个正常组成部分分处于两个染色体上,理论上就是核苷酸的种类和排列改变了,这样就失去正常的生理机能。所以,基因不仅是一个遗传物质在上下代之间传递的基本单位,也是一个功能上的独立单位。[2]
基因有两个特点:一是能忠实地复制自己,以保持生物的基本特征;二是基因能够“突变”,突变大绝大多数会导致疾病,另外的一小部分是非致病突变。非致病突变给自然选择带来了原始材料,使生物可以在自然选择中被选择出最适合自然的个体。
基因概念的提出
遗传学的奠基人奥地利人孟德尔(Gregor Johann Mendel 1822年—1884年),在布尔诺(Brno, 德Brünn,现属捷克)的奥古斯丁教派修道院的菜园里,挥洒了8年的汗水,于1865年2月在奥地利自然科学学会会议上报告了自己植物杂交研究结果,第二年在奥地利自然科学学会年刊上发表了著名的《植物杂交试验》的论文,发现了遗传学的两个基本规律——分离律和自由组合规律。文中指出,生物每一个性状都是通过遗传因子来传递的,遗传因子是一些独立的遗传单位。这样把可观察的遗传性状和控制它的内在的遗传因子区分开来了,遗传因子作为基因的雏形名词诞生了。基因的存在最早是由他在19世纪推断出来的,并不是观察的结果。在达尔文发表进化论后不久,他试图通过对豌豆进行试验来对此解释该理论。但是直到19世纪末他的研究才被人们所重视。虽然孟德尔还不知道这种物质是以怎样的方式存在,也不知道它的结构是怎样的,但孟德尔“遗传因子”的提出毕竟为现代基因概念的产生奠定了基础。
萨顿和鲍维里两人注意到在杂交试验中遗传因子的行为与减数分裂和受精中染色体的行为非常吻合,他们作出“遗传因子位于染色体上”的“萨顿—鲍维里假想”:他们根据各自的研究,认为孟德尔的“遗传因子”与配子形成和受精过程中的染色体传递行为具有平行性,并提出了遗传的染色体学说,认为孟德尔的遗传因子位于染色体上,即承认染色体是遗传物质的载体,第一次把遗传物质和染色体联系起来。这种假想可以很好地解释孟德尔的两大规律,在以后的科学实验中也得到了证实。1909年丹麦遗传学家约翰逊(W.Johansen 1859~1927)在《精密遗传学原理》一书中提出“基因”概念,以此来替代孟德尔假定的“遗传因子”。从此,“基因”一词一直伴随着遗传学发展至今。基因一词来自希腊语,意思为“生”。约翰逊还提出了“基因型”与“表现型”这两个含义不同的术语,初步阐明了基因与性状的关系。不过此时的基因仍然是一个未经证实的,仅靠逻辑推理得出的概念。
基因概念的进一步发展
在一项的研究中,美国格莱斯顿病毒学与免疫学研究所的Warner C. Greene与同事证明,基因Rfv3就是基因Apobec3(一个带有抗逆转录病毒活性的先天免疫基因)。70年代后,基因的概念随着多学科渗透和实验手段日新月异又有突飞猛进的发展,主要有以下几个方面:
1、基因具重叠性。1977年桑格(F. Sanger)领导的研究小组,根据大量研究事实绘制了共含有5375个核苷酸的ΦX174噬菌体DNA碱基顺序图,第一次揭示了遗传的一种经济而巧妙的编排——B和E基因核苷酸顺序分别与A和D基因的核苷酸顺序的一部分互相重叠。当然它们各有一套读码结构,且基因末端密码也有重叠现象(A基因终止密码子TGA和C基因起始密码子ATG重叠2个核苷酸;D基因的终止密码子TAA与J基因起始密码子ATG互相重叠1个核苷酸,顺序为TAATG)
2、内含子和外显子。人们在研究小鸡卵清蛋白基因时发现其转录形成的mRNA只有该基因长度的1/4,其原因是基因中一些间隔序列的转录物在RNA成熟过程中被切除了。这些间隔序列叫内含子,基因中另一些被转录形成RNA的序列叫外显子。小鸡的卵清蛋白基因中至少含7个内含子。因而从基因转录效果看,基因由外显子和内含子构成。
3、管家基因和奢侈基因。具有相同遗传信息的同一个体细胞间其所利用的基因并不相同,有的基因活动是维持细胞基本代谢所必须的,而有的基因则在一些分化细胞中活动,这正是细胞分化、生物发育的基础。前者称为管家基因,而后者被称为奢侈基因。
4、基因的游动性。早在20世纪40年代美国遗传学家麦克林托克(B.McClintock)在玉米研究中发现“转座因子”,直至1980年夏皮罗(J.Shapiro)等人证实了可移位的遗传基因存在,说明某些基因具有游动性。为此,这位“玉米夫人”荣获了1983年度诺贝尔奖。
所有这些成果无疑给基因概念中注入鲜活科学的内容,帮助人们揭开层层面纱去更加全面了解基因的真面目。时代在发展,科学在进步,基因概念的深入发展,必将对人类的文明进步产生强大的推动作用。
关于遗传物质基础,科学家早就有所臆测。1864年英国哲学家斯宾塞曾提出“生理单位”,1868年达尔文将其称为“微芽”,1884年瑞士植物学家冯内格列称之为“异胞质”,1889年荷兰学者德弗里斯称为“泛生子”。
1883年德国魏斯曼称之为“种质”,并指明生殖细胞中的染色体便是种质,认为种质是遗传的,体质不遗传,种质影响体质,而体质不影响种质。这在理论上为重新发现和广为人们接受的孟德尔遗传规律铺平了道路。
1928年英国细菌学家Frcdrick Griffith利用肺类双球菌(Streptcoccus pneumoniae )的光滑型(有荚膜,毒性强,可引起动物发生肺炎,简称S型)和粗糙型(无荚膜,不引起疾病,简称R型)分别给小鼠注射,S型使小鼠死亡,R型不使小鼠致死;若将S型加热杀死再注入小鼠体内,小鼠不死;若将加热杀死后的S型与R型混合,并给小鼠注入,则小鼠死亡并在小鼠体内发现S型。他们的结论是:可能是死细菌中的某一成分(转化源,transforming principle)将无致病能力的细菌转化为病原细菌。
1944年,美O.T. Avery等为了寻找导致细菌转化的原因,他们发现从S 型肺炎球菌中提取的DNA与R型肺炎球菌混合后,能使某些R型菌转化为S型菌,且转化率与DNA纯度呈正相关,若将DNA预先用DNA酶降解,转化就不发生。结论是:S型菌的DNA将其遗传特性传给了R型菌,DNA就是遗传物质。从此核酸是遗传物质的重要地位才被确立,人们把对遗传物质的注意力从蛋白质移到了核酸上。
1952年美国冷泉港卡内基遗传学实验室的Hershey及其学生Chase利用噬菌体同位素标记感染实验,进一步证明了DNA是遗传物质。他们将噬菌体外壳的蛋白质用35S标记,核酸用32P标记,结果进入宿主细胞能复制的是32P标记的核酸,35S蛋白质外壳留在宿主细胞的外面。
1956年德国科学家Fraenkel-Conrot将烟草花叶病病毒的蛋白质和RNA分别提取出来,分别涂抹在健康的烟草叶子上,结果只有涂抹RNA的叶片的病,而涂抹蛋白质组分的叶片不得病。这就证明在不具有DNA的病毒中,RNA是遗传物质。[3]
关于基因的本质确定后,人们又把研究视线转移到基因传递遗传信息的过程上。在20世纪50年代初人们已懂得基因与蛋白质间似乎存在着相应的联系,但基因中信息怎样传递到蛋白质上这一基因功能的关键课题在20世纪60年代至20世纪70年代才得以解决。
从1961年开始,尼伦伯格(M.W. Nirenberg)和科拉纳(H.G. Khorana)等人逐步搞清了基因以核苷酸三联体为一组编码氨基酸,并在1967年破译了全部64个遗传密码,这样把核酸密码和蛋白质合成联系起来。然后,沃森和克里克等人提出的“中心法则”更加明确地揭示了生命活动的基本过程。
1970年特明(H.M. Temin)以在劳斯肉瘤病毒内发现逆转录酶这一成就进一步发展和完善了“中心法则”,至此,遗传信息传递的过程已较清晰地展示在人们的眼前。过去人们对基因的功能理解是单一的即作为蛋白质合成的模板。但是1961年法国雅各布(F. Jacob)和莫诺(J.L. Monod)的研究成果,又大大扩大了人们关于基因功能的视野。他们在研究大肠杆菌乳糖代谢的调节机制中发现了有些基因不起合成蛋白质模板作用,只起调节或操纵作用,提出了操纵子学说。从此根据基因功能把基因分为结构基因、调节基因和操纵基因。
结构基因和调控基因
根据操纵子学说,并不是所有的基因都能为肽链进行编码。于是便把能为多肽链编码的基因称为结构基因,包括编码结构蛋白和酶蛋白的基因,也包括编码阻遏蛋白或激活蛋白的调节基因。有些基因只能转录而不能翻译,如tRNA基因和rRNA基因。还有些DNA区段,其本身并不进行转录,但对其邻近的结构基因的转录起控制作用,被称为启动基因和操纵基因。启动基因、操纵基因与其控制下的一系列结构基因组成一个功能单位叫做操纵子(operon)。就其功能而言,调节基因、操纵基因和启动基因都属于调控基因。这些基因的发现,大大拓宽了人们对基因功能及相互关系的认识。
断裂基因
20世纪70年代中期,法国生物化学家查姆帮(Chamobon)??发现,细胞内的结构基因并非全部由编码序列组成,而是在编码序列中间插入无编码作用的碱基序列,这类基因被称为间隔或断裂基因。这一发现于1977年被英国的查弗里斯和荷兰的弗兰威尔在研究兔β-球蛋白结构时所证实。1928年,生化学家吉尔伯特(Gilbert)提出基因是一个转录单位的设想,他认为基因是一个嵌合体,包含两个区段:一个区段由遗传密码组成,将被表达,称为“外显子”;一个区段由非遗传密码组成,将在mRNA中被删除,称为“内含子”。近年来的研究发现,原核生物的基因一般是连续的,在一个基因的内部没有非遗传密码的序列(即不含“内含子”),而真核生物的绝大多数基因都是不连续的断裂基因。断裂基因的表达程序是:整个基因先转录成一条长RNA前体,其中的非编码序列被一种称为“剪接”的酶切除,两端再相互连接成一条连续的密码顺序,以形成成熟的mRNA。DNA分子断裂基因的存在为基因功能的发展赋予了更大的潜力。
重叠基因
长期以来,人们一直认为在同一段DNA序列内是不可能存在重叠的读码结构的。但是,1977年,维纳(Weiner)在研究Q0病毒的基因结构时,首先发现了基因的重叠现象。1978年,费尔(Feir)和桑戈尔(Sangor)在研究分析φX174噬菌体的核苷酸序列时,也发现由5375个核苷酸组成的单链DNA所包含的10个基因中有几个基因具有不同程度的重叠,但是这些重叠的基因具有不同的读码框架。以后在噬菌体G4、MS2和SV40中都发现了重叠基因。基因的重叠性使有限的DNA序列包含了更多的遗传信息,是生物对它的遗传物质经济而合理的利用。
假基因
1977年,G·Jacp在对非洲爪赡5SrRNA基因簇的研究后提出了假基因的概念,这是一种核苷酸序列同其相应的正常功能基因基本相同,但却不能合成出功能蛋白质的失活基因。假基因的发现是真核生物应用重组DNA技术和序列分析的结果。现已在大多数真核生物中发现了假基因,如Hb的假基因、干扰素、组蛋白、α球蛋白和β球蛋白、肌动蛋白及人的rRNA和tRNA基因均含有假基因。由于假基因不工作或无效工作,故有人认为假基因,相当人的痕迹器官,或作为后补基因。
移动基因
1950年,美国遗传学家麦克林托卡在玉米染色体组中首先发现移动基因。她发现玉米染色体上有一种称为Ds的控制基因会改变位置,同时引起染色体断裂,使其离开或插入部位邻近的基因失活或恢复恬性,从而导致玉米籽粒性状改变。这一研究当时并没有引起重视。20世纪60年代未,英国生物化学家夏皮罗和前西德生物化学家西特尔分别在细菌中发现一类称为插入顺序的可移动位置的遗传因子,20世纪70年代早期又发现细菌质粒的某些抗药性可移动的基因,到20世纪80年代已发现这类基因至少有20种。20世纪90年代之前,科学家终于用实验证明了麦克林托卡的观点,移动基因不仅能在个体的染色体组内移动,并能在个体间甚至种间移动。现已了解到真核细胞中普遍存在移动基因。基因移动性的发现不仅打破了遗传的DNA恒定论,而且对于认识肿瘤基因的形成和表达,以及生物演化中信息量的扩大等研究工作也将提供新的启示和线索。
人类只有一个基因组,大约有5-10万个基因。人类基因组计划是美国科学家于1985年率先提出的,旨在阐明人类基因组30亿个碱基对的序列,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息,使人类第一次在分子水平上全面地认识自我。
为了破译人体DNA分子的全部核苷酸顺序,建立完整的遗传信息数据库,由多国政府支持的人体基因组计划在1989年启动,先后有美、英、日、德、法及中国等6个国家参与,并于2003年4月宣布完成人类基因组序列绘制。此后,有塞莱拉遗传信息公司等多家公司和实验室先后宣布独立或联合破译人体基因组。破译人类基因组序列这一生命科学成就将促进生物学的不同领域如神经生物学、细胞生物学、发育生物学等的发展;医学也将从中获得极大益处,5000多种遗传性疾病以及恶性肿瘤、心血管疾病和其它严重危害人类的疾病,都有可能得到预测、预防、早期诊断和治疗。
1990年,美国启动“人类基因组计划”,拉开解读和研究遗传物质DNA的序幕,截至2009年10月20日,全世界已有5973种生物进行基因组测序,其中已完成发表的有1117种。[4]
基因突变是指由于DNA碱基对的置换、增添或缺失而引起的基因结构的变化,亦称点突变。在自然条件下发生的突变叫自发突变,由人工利用物理因素或化学药剂诱发的突变叫诱发突变。基因突变是生物变异的主要原因,是生物进化的主要因素。在生产上人工诱变是产生生物新品种的重要方法。 根据基因结构的改变方式,基因突变可分为碱基置换突变和移码突变两种类型。
碱基置换突变
由一个错误的碱基对替代一个正确的碱基对的突变叫碱基置换突变。例如在DNA分子中的GC碱基对由CG或AT或TA所代替,AT碱基对由TA或GC或CG所代替。碱基替换过程只改变被替换碱基的那个密码子,也就是说每一次碱基替换只改变一个密码子,不会涉及到其他的密码子。引起碱基置换突变的原因和途径有两个。一是碱基类似物的掺入,例如在大肠杆菌培养基中加入5-溴尿嘧院(BU)后,会使DNA的一部分胸腺嘧啶被BU所取代,从而导致AT碱基对变成GC碱基对,或者GC碱基对变成AT碱基对。二是某些化学物质如亚硝酸、亚硝基胍、硫酸二乙酯和氮芥等,以及紫外线照射,也能引起碱基置换突变。
移码突变
基因中插入或者缺失一个或几个碱基对,会使DNA的阅读框架(读码框)发生改变,导致插入或缺失部位之后的所有密码子都跟着发生变化,结果产生一种异常的多肽链。移码突变诱发的原因是一些像吖啶类染料分子能插入DNA分子,使DNA复制时发生差错,导致移码突变。
根据遗传信息的改变方式,基因突变又可以分为同义突变、错义突变和无义突变三种类型。
同义突变
有时DNA的一个碱基对的改变并不会影响它所编码的蛋白质的氨基酸序列,这是因为改变后的密码子和改变前的密码子是简并密码子,它们编码同一种氨基酸,这种基因突变称为同义突变。
错义突变
由于一对或几对碱基对的改变而使决定某一氨基酸的密码子变为决定另一种氨基酸的密码子的基因突变叫错义突变。这种基因突变有可能使它所编码的蛋白质部分或完全失活,例如人血红蛋白β链的基因如果将决定第6位氨基酸(谷氨酸)的密码子由CTT变为CAT,就会使它合成出的β链多肽的第6位氨基酸由谷氨酸变为缬氨酸,从而引起镰刀形细胞贫血病。
无义突变
由于一对或几对碱基对的改变而使决定某一氨基酸的密码子变成一个终止密码子的基因突变叫无义突变。其中密码子改变为UAG的无义突变又叫琥珀突变,密码子改变成UAA的无义突变又叫赭石突变。[5]
基因治疗,顾名思义,就是用基因治病,实际上是指用导入人体内的基因的产物蛋白质来治病。日前在此间举行的一个国际医药生物技术研讨会上,美国人类基因组科学公司资深研究员倪健博士称,直接用基因来治疗是生物医药业发展的一条重要途径,新一代的生物医药——基因组医药和基因治疗将经历一场变革,带来生物医药业的第三次浪潮,给人类医药保健事业带来革命性的变化。
基因治疗所采用的方式,归纳起来可分为“ex vivo”与“in vivo”两种。
“Ex vivo”指的是从病人身上取出特定的细胞 (如骨髓细胞,但已坏了),施以基因工程技术改造病症,举例来说,放入血友病人缺乏的正常基因,再选出会制造血友病人需要的血液蛋白质的细胞。接着采用移植的观念将改造成功的细胞植入病人体内,如果成功的话,病人将不再常常依靠施打血友病蛋白以止血。达到这个目标则必需 (a) 细胞不会受到排斥 (所以用病人自己的细胞),而且永远制造血液蛋白质,(b) 制造的血液蛋白质量足以治疗出血,(c) 植入的细胞不会变成恶性细胞为害病人。
“In vivo”的方式是将要治疗病人的基因经由遗传工程技术处理后,直接注射入病人身体内,人类对注射疫苗最有经验,因此许多基因疗法的策略是肌肉注射,肌细胞如忠实的 "吞入或感染了" 打入的基因且发挥功能如长期制造足量所需的蛋白质,则为成功的治疗,此法不需担心排斥的问题,但是要防止打入的基因到处乱窜,万一窜入生殖细胞,可能破坏染色体危及子代。[6]
显性和隐性性状
父母双方的眼睛都为褐色,并且双方都有一个隐性蓝眼睛基因,那么生出来的孩子将有四分之一的概率从父母双方获得蓝色眼睛基因,从而拥有一双蓝色的眼睛。(最后这个基因配对的例子说明了隐性基因如何能够确定无疑地呈现出来,从而使得性状特征出乎意料地隔代显示。)
农业
几个主要的应用领域包括:①将固氮菌的固氮基因转移到生长在重要作物上的根际微生物或致瘤微生物中去,或将它引入到这类作物的细胞中,以获得能独立固氮的新型作物品种。②将木质素分解酶的基因或纤维素分解酶的基因重组到酵母菌内,使酵母菌能充分利用稻草、木屑等地球上贮量极大并可持续利用的廉价原料来直接生产酒精,可望为人类开辟一个取之不尽的新能源和化工原料来源;③改良和培育农作物和家畜、家禽新品种,包括提高光合作用效率以及各种抗性(植物的抗盐、抗旱、抗病基因,鱼的抗冻蛋白基因)等。
美国科学家研究发现,讨厌还是喜欢猪肉做成的菜可能与个人体内的OR7D4基因有关。











