時間:2021年09月06日 分類:農(nóng)業(yè)論文 次數(shù):
摘要:SNP基因分型芯片是分子育種的重要工具,高密度SNP芯片往往存在標(biāo)記冗余、價格高、目標(biāo)性不強(qiáng)等問題,是分子育種走向常規(guī)化、規(guī)模化的主要限制因素之一。在此,我們開發(fā)了一款低密度育種芯片,并就芯片在種質(zhì)資源評價中的價值進(jìn)行了分析。首先,我們對份玉米自交系進(jìn)行0X重測序,獲得了8.2Mb的SNP標(biāo)記,從中挑選2,080個NP;再從已開發(fā)55K芯片中挑選3,390個缺失率低、多態(tài)性高、ConversionType為PolyHighResolution的標(biāo)記;最后從apMap3中挑選586個標(biāo)記,設(shè)計的育種芯片共包含6,056個SNP,采用靶向測序基因型檢測(Genotypingbytargetsequencing,GBTS)技術(shù)對標(biāo)記進(jìn)行檢測。通過自然群體、雙親群體和多親本重組自交系(Multiparentadvancedgenerationintercross,MAGIC)群體驗證表明,設(shè)計的育種芯片平均捕獲率為0.6,檢測到的原始設(shè)計位點數(shù)為4,773~5,963個,AF>0.4和IC0.4的標(biāo)記比例分別為57.6和88.6。用該芯片對26份玉米種質(zhì)資源進(jìn)行評價,主成分分析可以將其劃分為溫帶和熱帶兩大類群,PGMA聚類分析進(jìn)一步將其劃分為個已知類群,分別是瑞德、蘭卡斯特、旅大紅骨、四平頭和熱帶類群,Structure群體結(jié)構(gòu)分析沒有出現(xiàn)最佳值,但熱帶材料都獨立成群;類群內(nèi)和類群間的遺傳距離平均值分別為0.394和0.47,其中群內(nèi)的遺傳距離最小(0.316),熱帶類群內(nèi)的遺傳距離最大(.424);類群間,瑞德與熱帶之間的遺傳距離最大(0.493);類群間的遺傳分化系數(shù)(ST)表明,類群與其他類群間的ST均較大。
關(guān)鍵詞:玉米;NP;育種芯片;種質(zhì)資源
分子育種技術(shù)的大規(guī)模推廣應(yīng)用依賴于分子標(biāo)記成本的降低[1]。相比其他遺傳標(biāo)記,單核苷酸多態(tài)性(Singlenucleotidepolymorphisms,SNP)標(biāo)記在基因組中含量豐富、穩(wěn)定性強(qiáng)、鑒定效率高3]。在玉米基因組中,每44~75bp就會出現(xiàn)一個SNP[35]。
此外,SNP一般為二等位基因標(biāo)記,易于估計群體中等位基因頻率。隨著分子生物學(xué)的發(fā)展,不同通量的SNP基因分型平臺得到了廣泛的應(yīng)用,對于少數(shù)NP,主要的技術(shù)平臺是競爭性等位基因特異性PCR(KompetitiveallelespecificPCR,KASP)和Taqman技術(shù),而高密度SNP標(biāo)記的鑒定主要通過全基因組重測序、簡化基因組測序(Genotypingbysequencing,GBS)、固相芯片和靶向測序基因型檢測(Genotypingbytargetsequencing,GBTS)(液相芯片)。
全基因組重測序或者簡化基因組測序可以獲得大量的NP,適合用于群體遺傳研究,但需要配備相應(yīng)的服務(wù)器并建立生物信息學(xué)分析平臺。固相芯片的理論基礎(chǔ)是雜交測序,具有特定的物理載體,目前的兩種主要平臺是AffymetrixAxiom和IlluminaInfinium,分別使用顯微光蝕刻和微珠技術(shù)。
利用固相芯片已經(jīng)在水稻[6]、小麥[78]、大豆[9]等作物上開發(fā)了一系列芯片。液相芯片因具有靈活性、廣適性、高效性等特點,在動植物中已經(jīng)開發(fā)了余套標(biāo)記集10]。目前,玉米中已經(jīng)開發(fā)了多款芯片[1113],在種質(zhì)資源鑒定和分子標(biāo)記輔助選擇(Markerassistedselection,MAS)中發(fā)揮了一定的作用。
然而,高密度的芯片在育種中往往存在標(biāo)記冗余、價格高、目標(biāo)性不強(qiáng)等問題,是分子育種走向常規(guī)化、規(guī)模化的主要限制因素之一,開發(fā)低密度的育種芯片,不但可以降低成本,還可以提高檢測效率。因此,我們根據(jù)遺傳多樣性豐富的份玉米自交系的基因組重測序數(shù)據(jù),并結(jié)合5K芯片中的優(yōu)良NP標(biāo)記,開發(fā)了一款高質(zhì)量、高性價比,適合在育種中應(yīng)用的低密度育種芯片,并利用該育種芯片對國內(nèi)外常見的玉米自交系進(jìn)行了評價。
1材料與方法
1.1實驗材料
實驗材料共包括兩部分,第一部分材料包含份自交系,進(jìn)行0X重測序,用于芯片的標(biāo)記開發(fā),材料名稱見附表;第二部分材料,包含個自然群體、個雙單倍體(DoubledHaploid,DH)群體和個多親本重組自交系(Multiparentdvancedgenerationintercross,MAGIC)群體,用于芯片的驗證。其中自然群體包含了226份玉米自交系,國內(nèi)常用自交系46份,包括常用自交系73、鐵922、丹98等,國外引進(jìn)自交系份,其中份ML自交系來自于國際小麥玉米改良中心(TheInternationalMaizeandWheatImprovementCenter,IMMYT),其他為ML衍生系。
DH群體包含了171份自交系,親本分別為B73和CXS161,其中XS161是掖78與旱的回交改良系,系譜為(掖78×旱);MAGIC群體是16份親本(其中份熱帶材料,分別為ML290、ML411、ML426、ML43、ML496、R0401、R0505和TMA238,份溫帶材料,分別為Mo17、Lx9801、旱、吉19、鐵922、81565、鄭和昌)通過兩兩雜交,再經(jīng)過自交產(chǎn)生的,目前已經(jīng)自交了代,共包含297份自交系,編號分別為~M297,加上親本共13份。群體的親本73和X161在不同批次中進(jìn)行了兩次生物學(xué)重復(fù)。
1.2芯片設(shè)計與開發(fā)
芯片原始設(shè)計6,056個SNP標(biāo)記,SNP標(biāo)記共有三個來源:(1)對37份玉米自交系進(jìn)行0X重測序,共獲得963.4的CleanReads,與B73RefGen_v4參考基因組比對后檢測到8.2的NP,過濾后的NP數(shù)為.8,根據(jù)最小等位基因頻率(Minorallelefrequency,MAF)和標(biāo)記的分布挑選了高質(zhì)量的NP共2,080個;(2)根據(jù)已有盤共,072個樣品的55K芯片數(shù)據(jù),從中挑選缺失率(Missingrate)5.0%、AF0.35、ConversionType為PolyHighResolution的標(biāo)記,考慮性狀相關(guān)標(biāo)記和標(biāo)記在染色體上的均勻分布,共挑選了3,390個標(biāo)記,其中包含與抗穗腐病、耐漬和耐低磷相關(guān)的標(biāo)記93個[1416];(3)最后從apMap3中挑選586個標(biāo)記,用于填補前兩個步驟中標(biāo)記間隔比較大的區(qū)間。
標(biāo)記的檢測采用GBTS技術(shù),在中玉金標(biāo)記生物(北京)技術(shù)股份有限公司進(jìn)行檢測。BTS主要包括以下五個步驟[1]:(1)利用超聲波將基因組DNA進(jìn)行片段化并加上測序接頭;(2)將帶有生物素標(biāo)記的RNA探針與已經(jīng)帶有接頭序列的DNA片段結(jié)合;(3)鏈霉親和素包裹的磁珠與上一步的雙鏈復(fù)合物相結(jié)合(探針過量);(4)清洗得到目標(biāo)區(qū)域的DNA,目的是去除非特異性雜交,提高捕獲效率;(5)對洗脫下來的DNA產(chǎn)物進(jìn)行PCR擴(kuò)增,構(gòu)建Illumina測序文庫; 測序數(shù)據(jù)下機(jī)后使用ATK的模型進(jìn)行變異檢測,用vcftools進(jìn)行標(biāo)記過濾。
2結(jié)果與分析
2.1標(biāo)記統(tǒng)計分析
將226個玉米自交系構(gòu)成的自然群體和71個系的靶向測序數(shù)據(jù)分別比對到玉米B73RefGen_v4參考基因組上,使用ATK進(jìn)行變異檢測。自交系群體比對獲得NP標(biāo)記58,135個,過濾后剩余83343個,以個體Q10miss0.2maf0.05過濾后獲得NP標(biāo)記5,589個,其中2,217個NPs在設(shè)計目標(biāo)位點上或者上下游00bp內(nèi);以個體Q20miss0.1maf0.05過濾獲得521個NPs,標(biāo)記均在目標(biāo)位點或上下游50bp內(nèi),其中原始設(shè)計位點4,773個,從NP在基因組中的分布情況看,外顯子中NP分布最多,其次為基因上游;每個目標(biāo)區(qū)段平均檢測到.1個NP。DH群體使用相同的軟件及參數(shù)進(jìn)行分析,在個體符合Q10miss0.2的過濾條件下,上述4,521個SNP在家系中有2,192個被檢測到,比例為0.5。
對AGIC群體及親本的13份份材料目標(biāo)區(qū)域測序后進(jìn)行比對,ATK檢測獲得NP標(biāo)記99,154個,過濾后剩余45646個,以GQ10miss0.2maf0.05過濾后獲得586個NPs,其中5,967個NPs是最初設(shè)計的原始標(biāo)記,以GQ10miss0.1maf0.05過濾后獲得50130個NPs,其中5,767個NPs是最初設(shè)計的原始位點。其中,自然群體和DH群體檢測的NP與AGIC群體檢測的NP相比,共同檢測到的原始設(shè)計位點數(shù)為,560個。兩個材料73和XS161生物學(xué)重復(fù)的一致性均為9.2,不考慮缺失基因型時一致性均為9.9。
2.2類群劃分
主成分分析結(jié)果顯示,當(dāng)C=2時,自然群體可以明顯地劃分為兩個類群,分別是熱帶類群和溫帶類群,熱帶類群不同自交系的前兩個主成分比較聚集,而溫帶類群則比較分散。PGMA聚類分析可以將226個自交系分為個類群,依據(jù)骨干自交系,這個類群分別是熱帶、瑞德、蘭卡斯特、四平頭和旅大紅骨。熱帶材料共有份,包括份ML自交系以及ML衍生的自交系,一些含有熱帶血緣的自交系如N165也被劃分為熱帶類群;瑞德類群包含了份自交系,骨干自交系73、84、黃及先玉335的母本系H6WC都被劃分為瑞德類群。
本次類群劃分與之前我們用5K芯片和0K系列芯片劃分的類群略有不同[112],區(qū)別是將、Iodent類群統(tǒng)一為瑞德,如鐵922、遼053、遼114等傳統(tǒng)上屬于群,由于群與瑞德的關(guān)系較近,本次我們將其歸為瑞德類群;蘭卡斯特、四平頭和旅大紅骨則分別包含了 和份自交系,與之前的劃分結(jié)果一致[112],總體上,對226份種質(zhì)資源的評價結(jié)果與已知的我國玉米材料類群劃分是一致的[1920]。用tructure軟件將值設(shè)置為~10,與Lu等[19]的研究結(jié)果一樣,沒有出現(xiàn)最佳值。
3討論
利用育種芯片進(jìn)行選擇,一般能夠縮短世代間隔,提高選擇的準(zhǔn)確度,加快遺傳進(jìn)展。我國育種芯片研究始于997~1998年,盡管起步晚,但是發(fā)展很快,在玉米、水稻、小麥、大豆等主要農(nóng)作物上開發(fā)了不同密度的育種芯片或者微陣列。由于玉米基因組大、結(jié)構(gòu)復(fù)雜、重組率高、材料類型豐富,開發(fā)高質(zhì)量、高密度SNP陣列的存在很多障礙[21]。
目前,玉米中開發(fā)的芯片包括基于Affymetrix平臺的00K芯片[11]、5K芯片[12]和~0K芯片[13],基于Illumina平臺的0K芯片[22]和芯片[23],基于GoldenGate平臺的36微陣列[24]和3072微陣列[25],基于GenoBaits的0K系列液相芯片[1]等。這些芯片的開發(fā)為玉米遺傳研究提供了重要的支撐。傳統(tǒng)的固相芯片的理論基礎(chǔ)是NA雙螺旋的互補配對。雖然固相芯片鑒定的準(zhǔn)確度比較高,但存在的問題是價格高、鑒定周期受樣品量的限制。以我們開發(fā)的5K芯片為例,定制規(guī)格為384×55K,個樣本的生物學(xué)重復(fù)一致率在7.1~98.9,缺失率平均值為.83[12],雖然略低于目前開發(fā)的低密度育種芯片,但相比其他芯片已經(jīng)具有較高的質(zhì)量。
然而,在實際應(yīng)用的時候,往往需要幾個科研機(jī)構(gòu)或者育種公司湊足84個樣本才能上機(jī),基因型鑒定的周期從天延長到平均兩個月甚至更長,大大限制了其在分子標(biāo)記輔助選擇中的應(yīng)用。我們開發(fā)的0K系列液相芯片解決了5K芯片的上述限制[1],0K系列液相芯片適合用于種質(zhì)資源鑒定、遺傳圖譜構(gòu)建和全基因組選擇等。利用0K系列液相芯片進(jìn)行種質(zhì)資源鑒定和類群劃分時,我們發(fā)現(xiàn)0K與10K、標(biāo)記的劃分結(jié)果完全一致,說明玉米育種中類群的劃分使用更低密度的芯片即可,而降低密度可以進(jìn)一步降低成本。
例如,當(dāng)標(biāo)記密度降低到原來的一半時,成本降低為原來的三分之二,而當(dāng)標(biāo)記密度降低為原來的四分之一時,成本約為原來的一半[1],因此,有必要開發(fā)精準(zhǔn)高效的低密度育種芯片。我們利用新開發(fā)的低密度育種芯片對國內(nèi)外常用的自交系進(jìn)行群體結(jié)構(gòu)和雜種優(yōu)勢群的劃分,當(dāng)C=2時,首先將26份自交系劃分為溫帶與熱帶兩個類群,其中來自于IMMYT的自交系大多屬于熱帶材料,部分含有熱帶血緣的材料如N165和WM(中糯父)也被劃分為熱帶類群,這與前人的研究結(jié)果和育種實際相一致[1226]。
玉米種植論文: 常見的玉米病蟲害及其防治技術(shù)分析
進(jìn)一步利用PGMA聚類分析將26份自交系劃分為個類群,除熱帶類群外,溫帶類群包括瑞德、蘭卡斯特、四平頭和旅大紅骨個亞群,這與我國玉米主要類群相一致[2731],與應(yīng)用高密度芯片相比,低密度育種芯片能夠簡化類群劃分,如應(yīng)用55K芯片將S602劃分為Iodent類群,將53、J005和A156等劃分為類群[1215],此次統(tǒng)一劃分為瑞德類群。因此,新開發(fā)的低密度育種芯片能夠在降低成本的同時優(yōu)化玉米類群劃分。
參考文獻(xiàn)
[1]GuoZ,WangH,TaoJ,RenY,XuC,WuK,ZouC,ZhangJ,XuY.DevelopmentofmultipleSNPmarkerpanelsaffordabletobreedersthroughgenotypingbytargetsequencing(GBTS)inmaize.MolecularBreeding,2019,39:37.[2]BrumfieldRT,BeerliP,NickersonDA,EdwardsSV.Theutilityofsinglenucleotidepolymorphismsininferencesofpopulationhistory.TrendsinEcology&Evolution,2003,18:249256.
[3]BevanMW,UauyC.Genomicsrevealsnewlandscapesforcropimprovement.GenomeBiology,2013,14:111.
[4]GoreMA,ChiaJM,ElshireRJ,unQ,ErsozES,HurwitzBL,PeifferJA,McMullenMD,GrillsGS,RossIbarraJ,WareDH,BucklerES.Afirstgenerationhaplotypemapofmaize.Science,2009,326:1115–1117.
[5]VarshneyRK,NayakSN,MayGD,JacksonSA.Nextgenerationsequencingtechnologiesandtheirimplicationsforcropgeneticsandbreeding.TrendsinBiotechnology,2009,27:522530.
作者:郭子鋒,王山葒,劉蓓,李文學(xué),王紅武