《《蛋白質工程》word版》由會員分享,可在線閱讀,更多相關《《蛋白質工程》word版(6頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、基因(gene):指編碼RNA和蛋白質序列信息及表達這些信息所必需的全部核苷酸序列。
基因組(genome):一個細胞或生物體所載的全部遺傳信息。
基因組學(genomics):闡明整個基因組結構與功能及基因之間相互作用。
轉錄組學(transcriptomics):全面了解基因組的整體轉錄情況及調(diào)控。
斷裂基因(splite gene): 真核生物結構基因,由若干個編碼區(qū)和非編碼區(qū)互相間隔開但又連續(xù)鑲嵌而成,去除非編碼區(qū)再連接后,可翻譯出由連續(xù)氨基酸組成的完整蛋白質。
外顯子(expressed region):是真核生物基因的一部分,它在剪接(Splicing)后仍會被保
2、存下來,并出可在蛋白質生物合成過程中被表達為蛋白質。外顯子是最后出現(xiàn)在成熟RNA中的基因序列,又稱表達序列。
內(nèi)含子(introns):在轉錄后的加工中,從最初的轉錄產(chǎn)物除去的內(nèi)部的核苷酸序列。
啟動子:指與RNA聚合酶結合的DNA序列(20-300bp),包括識別位點、結合位點和轉錄起始點。啟動子具有方向性,一般位于上游。不同基因的啟動子之間存在一定的保守性,稱為一致序列或保守序列(consensus sepuence)。
位于轉錄起始點上游,由轉錄因子識別和結合并決定RNA Pol結合和轉錄起始的核苷酸序列
多數(shù)啟動子位于真核細胞基因轉錄起點的上游(-100~-200),啟
3、動子本身通常不被轉錄。
少數(shù)啟動子(如編碼tRNA基因的啟動子)位于轉錄起始點的下游,這些DNA序列可以被轉錄。
終止子(terminator)和Poly A加尾信號( polyadenylation signal ):加尾信號為3′端下游的AATAAA序列;其下游有一個反向重復序列,形成發(fā)夾結構,使轉錄終止;加尾信號和反向重復序列稱為終止子。
依賴ρ因子的轉錄終止:ρ因子:
ρ因子是由相同亞基組成的六聚體蛋白質,亞基分子量46kD。
ρ因子能結合RNA,又以對poly C的結合力最強。
ρ因子還有ATP酶活性和解螺旋酶(helicase)的活性。
目前認為,ρ因子終止
4、轉錄的作用是:與RNA轉錄產(chǎn)物結合,結合后ρ因子和RNA聚合酶都可發(fā)生構象變化,從而使RNA聚合酶停頓,解螺旋酶的活性使DNA/RNA雜化雙鏈拆離,利于產(chǎn)物從轉錄復合物中釋放 。
非依賴 Rho因子的轉錄終止
DNA模板上靠近終止處,有些特殊的堿基序列,轉錄出RNA后,RNA產(chǎn)物形成特殊的結構來終止轉錄。
近終止區(qū)的轉錄產(chǎn)物形成發(fā)夾(hairpin)結構是非依賴ρ因子終止的普遍現(xiàn)象。
莖環(huán)結構使轉錄終止的機理:
使RNA聚合酶變構,轉錄停頓;
使轉錄復合物趨于解離,RNA產(chǎn)物釋放。
增強子(enhancer)
增強真核基因啟動子工作效率,決定著每一個基因在細胞內(nèi)的
5、表達水平。
能夠在相對于啟動子的任何方向和位置(上游或者下游)上發(fā)揮這種增強作用,大部分位于上游。
增強子序列距離所調(diào)控基因距離近者幾十個堿基對,遠的可達幾千個堿基對。
常與啟動子有交錯,有時也可位于內(nèi)含子之中。
不同的增強子序列結合不同的調(diào)節(jié)蛋白。
沉默子:是抑制基因轉錄的特定DNA序列,當其結合一些反式作用因子時對基因的轉錄起阻遏作用,使基因沉默。
絕緣子: 位于啟動子與正負調(diào)控元件之間,為一種邊界元件。絕緣子本身對基因的表達既沒有正效應,也沒有負效應,其作用是不讓其他調(diào)控元件對基因的活化效應或失活效應發(fā)生作用。
反應元件(response element):是啟
6、動子或增強子的上游元件,通常位于啟動子附近、啟動子內(nèi)或增強子區(qū)域。能介導基因對細胞外的某種信號產(chǎn)生反應的DNA序列。
基因組(genome):細胞或生物體中,一套完整單倍體的遺傳物質的總和稱為基因組。
真核生物基因組包括一套完整單倍體DNA(染色體DNA)和線粒體DNA的全部序列
某些病毒的基因組由RNA組成。
基因組的大小有巨大差別:C值:單倍體基因組中的全部DNA的量。單位:bp(堿基對)
不同生物基因組的結構與組織形式也明顯不同:
原核生物的基因組一般較小,結構比較簡單;
病毒基因組的大小和結構差異較大;
真核生物基因組一般較龐大,但結構基因在基因組中所占的比例較小,
7、其中編碼序列更小,且存在大量重復序列(人的基因組中只有2~3% 的DNA序列是編碼序列)。
不同生物基因組的結構特點:
真核基因組:
一、 人類基因組貯存于染色體和線粒體中
人單倍體基因組DNA約為3×109bp
由染色體DNA和染色體外DNA(細胞器DNA)構成
細胞器DNA通常是環(huán)狀DNA分子,位于核外
人類基因組中90%序列可以轉錄
編碼序列:凡是可以轉錄出RNA的序列均屬于編碼序列
2%的編碼序列會翻譯成蛋白質,其他為非編碼RNA(non-coding RNA,ncRNA
1.高度重復序列
重復頻率>105,占人類基因組長度的20%
1)反向重復序列(inver
8、ted repeat)
兩個順序相同的拷貝在DNA鏈上呈反向排列,又稱回文結構(palindrome)占人類基因組5%,可能與復制、轉錄調(diào)控有關。
2) 衛(wèi)星DNA(satellite DNA)
存在于間隔DNA和內(nèi)含子中的非編碼區(qū)重復序列,具有固定的重復單位,首尾相連。
2.中度重復序列
重復頻率為103-105,占人類基因組長度的35%
1)短分散重復序列:Alu家族。Alu家族為靈長類基因組所特有,可作為天然標記
長約300bp,重復30-50萬次,在170bp處有個限制性內(nèi)切酶AluI的酶切位點。
2)長分散重復序列
3.單拷貝序列/低度重復序列
在單倍體基因組中只
9、出現(xiàn)一次或數(shù)次,大多數(shù)蛋白質編碼基因
編碼酶、激素、受體、結構蛋白和調(diào)節(jié)蛋白等。
假基因:指與某些有功能的基因結構類似,但不能表達產(chǎn)物的基因,由功能基因發(fā)生突變或者cDNA插入所致。
線粒體DNA:mtDNA編碼的RNA和多肽有:線粒體核糖體中2種rRNA(12S及16S),22種tRNA,13種多肽。
線粒體DNA的特點:
遺傳物質不為核膜所包被。
DNA不為蛋白質所壓縮。
基因組沒有包含那么多非編碼區(qū)域(調(diào)控區(qū)域或“內(nèi)含子”)。
一些密碼子與通用密碼子不同。
一些堿基為兩個不同基因的一部分:某堿基作為一個基因的末尾,同時作為下一個基因的開始。
很多基因沒有完整
10、的終止密碼,以T或者TA結尾。
原核基因組:
轉位因子
轉位因子(transposable element) 即可移動的基因成分(可移動基因,movable gene mob),是指能夠在一個DNA分子內(nèi)部或兩個DNA分子之間移動的DNA片段。在細菌中指在質粒和染色體之間或在質粒和質粒之間移動的DNA片段(文獻上有時形象地稱其為是跳躍基因,jumping gene)。轉位也是DNA重組的一種形式。
(一)轉位因子的種類及特征
原核生物:插入序列,轉座子及可轉座的噬菌體。
1.插入序列(insertion sequence,IS):
不含
11、有其它編碼蛋白質結構基因,本身沒有表型效應,但會使該基因發(fā)生失活,或者極性效應。
2.轉座子(transposon,Tn)
——是一類較大的可移動成分,除轉座相關基因外,尚含有其它基因,如抗藥基因等。
3.可轉座的噬菌體(transposable phage)
(1)包括Mu和D108兩種噬菌體,是一類溫和噬菌體。
(2)感染細菌后,可以整合到細菌染色體中,插入位點是隨機的(而入phage插入位點是專一的),可以插到結構基因內(nèi)部,引起突變。
(三)轉位的遺傳效應
1.基因重排 可能產(chǎn)生1個新的蛋白分子等,基因重排是進化的動力。
2.基因突變 插入到基因內(nèi)部,可引起
12、插入失活。
3.插入位點引入新的基因 如引進抗藥基因。
病毒基因組
① 種類單一;②單倍體基因組:每個基因組在病毒中只出現(xiàn)一次;③形式多樣;④大小不一;⑤基因重疊;⑥動物/細菌病毒與真核/原核基因相似:內(nèi)含子;⑦具有不規(guī)則的結構基因;⑧基因編碼區(qū)無間隔:通過宿主及病毒本身酶切;⑨無帽狀結構;⑩結構基因沒有翻譯起始序列。
質粒DNA—獨立于染色體外的有自我復制能力的雙鏈環(huán)形DNA,會賦予細胞新的表型
質粒的特點:
1. 分子相對較小 (在5kb左右,比較穩(wěn)定,不易受物理因素的損傷,此外,較小的質粒一般有較高的拷貝數(shù)。)
2. 含有高效的自主復制成分(有復制起始點,
13、利用細菌染色體DNA復制所用的同一套酶系統(tǒng),在細菌中獨立地進行自我復制及轉錄。分為低拷貝型(嚴密控制型)和高拷貝型(松弛控制型)復制調(diào)控系統(tǒng) 分配系統(tǒng) 細胞分裂控制系統(tǒng))
3. 不相容性 利用同一復制系統(tǒng)的不同質粒不能穩(wěn)定地和平共處,可稱之為不相容質粒,當兩個上述質粒被導入同一細胞時,它們在復制及隨后分配到子細胞的過程中彼此競爭。
最初拷貝數(shù)的微小差異,導致優(yōu)勢質粒占絕對上風,細菌生長幾代之后,占少數(shù)的質粒將會喪失殆盡,在原始細胞的后代中可含有兩種質粒中的任意一種,但不會兼而有之。
4.可轉移性:在自然條件下,很多質粒都可以通過一種稱為細菌接合的作用轉移到新宿主內(nèi)。
5.選擇性標記;帶
14、有一個或幾個可供選擇的標記,便于對轉化株的篩選。
抗生素抗性基因
lac Z基因—編碼半乳糖苷酶
X-gal X + gal
無色 藍色產(chǎn)物 半乳糖
X-gal:5-溴-4-氯-3-吲哚-β-D-半乳糖苷
6. 多個限制性內(nèi)切酶單一切口(多克隆位點)
便于外源基因的插入。
若處于選擇標記基因的內(nèi)部,外源基因片斷插入后會導致該基因失活便于篩選。
結構基因組學:揭示人類基因組全部DNA序列及組成
比較基因組學:通過模式生物基因組之間和模式生物與人類基因組之間
15、的比較鑒定,為預測新基因的功能和研究生物進化提供依據(jù)。
功能基因組學:利用結構基因組所提供的信息,分析和鑒定基因組中所有基因的功能。
遺傳作圖(genetic mapping):確定連鎖的遺傳標志位點在一條染色體上的排列順序及它們之間的相對遺傳距離,用厘摩(cM)表示 。當兩個遺傳標記之間的重組值為1%時為1cM。
限制性片段長度多態(tài)性(RFLP)(restriction fragment length polymorphism)
利用特定的限制性內(nèi)切核酸酶 識別切割基因組DNA,得到大小不等的DNA片段,所產(chǎn)生的DNA數(shù)目和各個片段的長度實際上反映了DNA分子上不同酶切位點的
16、分布情況。
單核苷酸多態(tài)性(single nucleotide polymorphism, SNP)
指在基因組水平上,由單個核苷酸變異所引起的DNA序列多態(tài)性。
不再以“長度”的差異作為檢測手段,而直接以序列的變異作為標記
原核生物基因組結構特點:
1. 基因組通常僅由一條環(huán)狀雙鏈DNA分子組成。
2. 基因組中只有1個復制起點。
3. 具有操縱子結構
4. 基因序列是連續(xù)的,無內(nèi)含子結構。
5. 編碼區(qū)所占比例較大(可達到50%左右)
6. 基因組中的重復序列很少。
7. 具有編碼同工酶的基因(isogene)
8. 不同的原核生物基因組中的GC含量變化很大(25~75%),測量基因組的GC含量可以識別細菌種類。
9. 細菌基因組中存在可移動的DNA序列,包括插入序列和轉座子。