浙江大学学报(农业与生命科学版), 2023, 49(1): 1-13 doi: 10.3785/j.issn.1008-9209.2022.05.161

综述

小麦族全基因组测序研究进展

邝刘辉,,, 李琪, 张国平,,

浙江大学农业与生物技术学院,浙江 杭州 310058

Advances on whole genome sequencing in Triticeae

KUANG Liuhui,,, LI Qi, ZHANG Guoping,,

College of Agriculture and Biotechnology, Zhejiang University, Hangzhou 310058, Zhejiang, China

通讯作者: 张国平(https://orcid.org/0000-0002-9042-2607),Tel:+86-571-88982115,E-mail:Zhanggp@zju.edu.cn张国平(https://orcid.org/0000-0002-9042-2607),Tel:+86-571-88982115,E-mail:Zhanggp@zju.edu.cn

收稿日期: 2022-05-16   接受日期: 2022-06-30  

基金资助: 浙江省重点研发计划项目.  2020C0202
浙江省重大科技专项.  2021C02064-3

Received: 2022-05-16   Accepted: 2022-06-30  

作者简介 About authors

邝刘辉(https://orcid.org/0000-0003-1504-739X),E-mail:kuangliuhui@zju.edu.cn , E-mail:kuangliuhui@zju.edu.cn

摘要

小麦族是禾本科植物中最重要的粮食作物来源之一,包括小麦、大麦、黑麦等麦类作物,全球年产量高达9亿t,约占全部谷类产量的30%。小麦族物种基因组庞大,重复序列比例高,且倍性水平多样,因此其从头测序和组装难度相对较大。近年来,随着三代长读长测序技术和针对复杂基因组的组装算法不断发展,以及测序成本显著下降,越来越多的小麦族物种的全基因组测序工作相继完成。本文综述了小麦族中小麦属、大麦属、黑麦属、偃麦草属和山羊草属共计17个物种(包括亚种)的全基因组研究进展,包括测序技术、拼装策略、组装质量、基因组和基因功能的主要分析内容等,旨在为更复杂的植物基因组测序和基因组学研究提供一定的理论与技术参考。

关键词: 小麦族 ; 基因组 ; 全基因组测序 ; 小麦属 ; 大麦属 ; 黑麦属 ; 偃麦草属 ; 山羊草属

Abstract

The Triticeae provides the important cereal crops, such as wheat, barley, and rye, which produces approximately 9×108 t annually, accounting for about 30% of the total global cereal production. However, Triticeae genomes are relatively difficult to be de novo sequenced and assembled due to their large genome size, a high proportion of repeat sequences, and different ploidy levels. With the rapid development of third-generation long read sequencing technologies and assembly algorithms designed for complex genomes, and also the falling cost of genome sequencing in recent years, more and more Triticeae species have been successfully sequenced. In this study, we reviewed the advances on the whole genome sequencing of 17 Triticeae species (including subspecies), including Triticum, Hordeum, Secale, Elytrigia, and Aegilops, in aspects of sequencing technology, assembly strategy and quality, and the major research contents associated with genomes and gene functions. This review may provide the references for sequencing strategies and genomic studies of other more complex plant genomes.

Keywords: Triticeae ; genome ; whole genome sequencing ; Triticum ; Hordeum ; Secale ; Elytrigia ; Aegilops

PDF (922KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

邝刘辉, 李琪, 张国平. 小麦族全基因组测序研究进展. 浙江大学学报(农业与生命科学版)[J]. 2023, 49(1): 1-13 doi:10.3785/j.issn.1008-9209.2022.05.161

KUANG Liuhui, LI Qi, ZHANG Guoping. Advances on whole genome sequencing in Triticeae. Journal of Zhejiang University (Agriculture & Life Sciences)[J]. 2023, 49(1): 1-13 doi:10.3785/j.issn.1008-9209.2022.05.161

进入21世纪以来,植物基因组测序范围快速扩大,公共基因组资源的数量和质量显著提升。自2000年12月拟南芥(Arabidopsis thaliana)基因组首次公布以来,随着高通量短读长测序技术(以瑞士Roche公司的454焦磷酸测序技术,美国Illumina公司的Solexa、HiSeq技术和美国ABI公司的Solid技术为标志的二代测序技术),高通量长读长测序技术[主要以美国PacBio公司的单分子实时测序(single molecule real-time, SMRT)技术和英国Oxford公司的纳米孔光学测序技术(Nanopore)为代表的三代测序技术],长距离连锁测序技术(10×Genomics),BioNano Genomics公司的基因组光学图谱技术,高通量染色体构象捕获(high-throughput chromosome conformation capture, Hi-C)技术,以及各种序列组装算法等不断发展,测序读长和组装质量不断提升,目前已完成近800个植物种及亚种的基因组测序[1]

小麦族(Triticeae)是禾本科(Poaceae)植物中最重要的粮食作物来源之一,包含目前广泛栽培的几种麦类作物,如小麦(Triticum aestivum)、大麦(Hordeum vulgare)、黑麦(Secale cereale)等[2]。小麦族作物的全球年产量高达9亿t,约占全部谷类产量的30%[3]。此外,小麦族不同种属内遗传变异类型丰富,蕴藏着许多发育、抗逆、抗病、环境适应性表现独特的野生种及优异基因。研究和挖掘主要栽培作物野生近缘种的遗传资源,如小麦属野生二粒小麦(T. turgidum var. dicoccoides[4]、大麦属钝稃野大麦(H. spontaneum[5-6]和偃麦草属长穗偃麦草(Elytrigia elongatum[7]等,对于丰富作物遗传资源、培育突破性作物新品种具有重要意义。

全基因组序列信息对于揭示小麦族系统分类、物种衍化关系等具有重要的指导作用。然而,小麦族物种基因组庞大,倍性水平多样,且重复序列比例较高(约为80%),其测序和组装难度相对较大[4,8-9]。三代测序具有读长长的优势,可跨越基因组中的高重复区域;Illumina二代测序数据准确性高,可用于纠正三代测序数据的错误,提高碱基的准确性。随着三代测序技术应用成本的显著下降,目前,大部分研究采用二代、三代组合测序策略对小麦族的复杂基因组进行从头组装。以色列NRGene公司开发的DeNovoMAGIC算法,对于复杂度高的基因组也能根据Illumina测序数据组装出具有超长支架(scaffold)且高准确度的完整基因组。此外,长距离连锁测序技术如10×Genomics获取的大片段DNA序列数据常用于构建scaffolds。而Hi-C技术、遗传图谱和BioNano光学图谱技术可最终用于scaffolds的染色体定位,从而组装出染色体水平的基因组。基于上述基因组测序及组装技术的飞速进步,近年来,越来越多的小麦族物种全基因组测序工作陆续完成和序列图谱公布。截至2022年5月,小麦族全基因组测序物种(包括亚种)已有17个(表1)。不过,从小麦族物种庞大的数量及其在人类社会中重要的地位来看,这一数目明显不足,亟待进一步推动与发展。

表1   小麦族全基因组已测序物种

Table 1  Whole genome sequenced species from Triticeae

物种/基因组

Species/genome

品种

Cultivar

组装大小

Assembly

size/Gb

染色体

序列大小

Chromosome

sequence size/

Gb

Contig

N50/kb

Scaffold

N50/kb

HC基因数量

HC gene

number

BUSCO

评估指数

BUSCO

assessment

index/%

测序方法

Sequencing strategy

发表年份

Year

published

文献

Reference

普通小麦/AABBDD

T. aestivum/AABBDD

中国春5.42NANANA

94 000~

96 000

NA全基因组鸟枪法/Roche 454测序2012[11]
中国春10.24NANA2.3124 20195.4分染色体测序、BAC测序、Illumina PE2014[12]
中国春13.43NA16.788.8104 091NA

Illumina PE/MP、链特异性RNA-Seq、

PacBio全长转录组

2017[13]
中国春15.34NA232.7NANA98.3Illumina PE、PacBio SMRT2017[14]
中国春14.5014.0751.822 800107 89199.0

BAC测序、Illumina PE/MP、

DeNovoMAGIC2、10×Genomics、

BioNano光学图谱、Hi-C、POPSEQ遗

传图谱

2018[10]
W79849.127.108.324.8NANA

全基因组鸟枪法/Illumina PE/MP、

POPSEQ遗传图谱

2015[16]
Fielder15.0014.70NA20 700116 48097.1

PacBio循环共识测序(CCS)、Omni-C

染色体构象捕获

2021[17]
泛基因组14.3~14.913.9~14.2

48.9~

83.5

10 200~

49 700

118 734~

120 967

97.6~98.4

Illumina PE/MP、DeNovoMAGIC3、10×

Genomics、Nanopore、Hi-C、POPSEQ遗传图谱

2020[18]

西藏半野生小麦/AABBDD

T. aestivum ssp. tibetanum/

AABBDD

藏181714.7114.0566.337 600118 07899.5

Illumina PE/MP、DeNovoMAGIC3、10×

Genomics、借助‘中国春’参考基因组

(2018)进行染色体挂载

2020[19]

乌拉尔图小麦/AA

T. urartu/AA

G18124.66NA3.463.734 87986.3全基因组鸟枪法/Illumina PE2013[22]
G18124.864.67344.03 70037 516NA

BAC测序、PacBio SMRT、10×

Genomics、BioNano光学图谱

2018[23]

粗山羊草/DD

A. tauschii/DD

AL8/784.231.724.557.634 498NA

全基因组鸟枪法/Illumina PE、Roche

454测序、遗传图谱

2013[24]
AL8/784.794.03NANA17 093NA全基因组鸟枪法、BAC测序、遗传图谱2013[25]
AL8/784.34NA486.8521.7NANAMaSuRCA混合拼装(Illumina PE/MP、PacBio SMRT)2017[26]
AL8/784.313.99112.612 10042 82897.0

Illumina PE/MP、DeNovoMAGIC2、

PacBio SMRT、高密度SNP遗传图谱

2017[27]
AL8/784.234.0393.131 70039 62297.8

BAC测序、全基因组鸟枪法、PacBio

SMRT、BioNano光学图谱

2017[28]

野生二粒小麦/AABB

T. turgidum var.

dicoccoides/AABB

Zavitan10.5010.1057.47 00065 01298.4

Illumina PE、DeNovoMAGIC2、

Hi-C、遗传图谱

2017[4]

硬粒小麦/AABB

T. turgidum var. durum/

AABB

Svevo10.459.9656.26 00066 55998.1

Illumina PE/MP、DeNovoMAGIC2、

Hi-C、高密度SNP遗传图谱

2019[29]

大麦/HH

H. vulgare/HH

Morex1.87NA1.4NA26 159NA

全基因组鸟枪法/Illumina PE/MP、

Roche 454测序、RNA-Seq

2012[30]
Morex4.794.54/4.6379.01 90039 73492.5

BAC测序、Illumina PE/MP、Roche

454测序、BioNano光学图谱,Hi-C、POPSEQ遗传图谱

2017[31]
Morex4.654.34NA40 20032 78798.9

TRITEX(Illumina PE/MP、10×

Genomics、Hi-C)

2019[32]
Morex4.504.2069 600118 90035 82798.6

TRITEX(IIllumina PE/MP、10×

Genomics、Hi-C)、PacBio SMRT、

PacBio CCS、Nanopore

2021[33]
Haruna Nijo2.00NANA3.530 60680.2Illumina PE、Roche 454测序2016[34]
Haruna Nijo4.284.13NA18 90049 52496.0

TRITEX(Illumina PE/MP、10×

Genomics、Hi-C)

2022[35]
AAC Synergy4.854.1440.02 30046 84593.9

TRITEX(Illumina PE/MP、10×

Genomics、Hi-C)、PacBio SMRT

2021[36]
Golden Promise4.134.1322.44 10045 15495.2

Illumina PE/MP、Dovetail Chicago、

Hi-C

2020[37]
泛基因组3.8~4.53.8~4.5NA

5 000~

42 700

35 859~

40 044

NAMinia+SOAPdenovo+TRITEX(Illumina PE/MP、10×Genomics、Hi-C)、DeNovoMAGIC3、POPSEQ遗传图谱2020[38]

青稞/HH

H. vulgare var. coeleste/HH

拉萨钩芒3.893.4818.1242.036 151NA

全基因组鸟枪法/Illumina PE、Morex

基因组(2012)和遗传图谱进行染色体

挂载

2015[39]
藏青320

3.73/

4.84

4.595.9171.146 787NA

Illumina PE/MP、PacBio SMRT、Morex

V1基因组(2017)进行染色体挂载

2018[40]
拉萨钩芒4.00NA1 6004 00040 45795.7Illumina MP、PacBio SMRT、遗传图谱2020[41]

钝稃野大麦/HH

H. spontaneum/HH

AWCS276/WB14.28NA35.4724.936 39595.3全基因组鸟枪法/Illumina PE2020[5]
OUH6024.504.32NA11 30043 37597.1

TRITEX(Illumina PE/MP、10×

Genomics、Hi-C)

2021[6]

海大麦/XaXa

H. marinum/XaXa

H5593.823.696 830524 47041 04598.4

Illumina PE、PacBio SMRT、10×

Genomics、Hi-C

2022[46]

黑麦/RR

S. cereale/RR

Lo72.80NA1.79.527 78489.0Illumina PE/MP2017[48]
威宁黑麦7.747.25480.41 000 00045 59696.7

TRITEX(Illumina PE/MP、10×

Genomics、Hi-C)、PacBio SMRT、遗传

图谱、BioNano光学图谱

2021[47]

长穗偃麦草/EE

E. elongatum/EE

NA4.634.542 20073 20044 47497.6

Illumina PE/MP、DeNovoMAGIC3、

PacBio SMRT、10×Genomics、

BioNano光学图谱、Hi-C

2020[7]

二角山羊草/S*S*

A. bicornis/S*S*

TB015.645.388 700NA40 22295.1Nanopore、Hi-C、Illumina短读长测序2022[21]

高大山羊草/S*S*

A. longissima/S*S*

TL055.805.231 100NA37 20194.0Nanopore、Hi-C、Illumina短读长测序2022[21]
AEG-6782-26.705.928.73 80031 18397.5

TRITEX(Illumina PE/MP、10×

Genomics、Hi-C)

2022[49]

西尔斯山羊草/S*S*

A. searsii/S*S*

searsii5.344.66600NA37 99592.9Nanopore、Hi-C、Illumina短读长测序2022[21]

沙融山羊草/S*S*

A. sharonensis/S*S*

TH025.895.141 000NA38 44093.2Nanopore、Hi-C、Illumina短读长测序2022[21]
AS_16446.706.30NA12 30030 62696.5

全基因组鸟枪法/Illumina MP、10×

Genomics、Hi-C

2022[50]

拟斯卑尔脱山羊草/SS

A. speltoides/SS

TS014.113.761 800NA37 60793.8Nanopore、Hi-C、Illumina短读长测序2022[21]
AEG-9674-15.144.0215.63 10036 92896.4

TRITEX(Illumina PE/MP、10×

Genomics、Hi-C)

2022[49]

NA表示没有统计数据。

NA indicates no statistical data.

新窗口打开| 下载CSV


1 小麦属全基因组测序

1.1 普通小麦全基因组测序

普通(面包)小麦(2n=6x=42,AABBDD)富含蛋白质和碳水化合物,是世界上种植面积最大的栽培小麦种,为人类提供了19%的食物能量[10]。由于普通小麦是异源六倍体,基因组庞大(总碱基数约为17 Gb,相当于水稻基因组大小的40倍、人类基因组大小的5.5倍),且3套亚基因组间序列十分相近,全基因测序和组装难度极高[8-9],因此,小麦功能基因组学研究远远落后于水稻和玉米,从而制约其重要农艺性状相关基因克隆和分子设计育种技术发展[11]。据联合国粮食及农业组织(Food and Agriculture Organization of the United Nations, FAO)估计,到2050年,小麦产量必须增长50%以上才能满足不断增长的全球需求。高质量小麦参考基因组序列图谱是小麦分子设计育种研究取得突破性成果的关键。自2005年以来,国内外的研究人员应用不同的测序技术和组装策略,获得了较完整的普通小麦全基因组序列[9]。普通小麦是第一个被全基因组测序的小麦族物种[11]

‘中国春’(Chinese Spring, CS42)染色体突变资源丰富,是小麦分子育种和遗传学研究的理想材料,目前普遍被用作普通小麦基因组测序的研究对象。2012年11月,英国利物浦大学的研究小组[11]利用全基因组鸟枪法(Roche 454测序技术)绘制出首个‘中国春’小麦基因组草图。测序深度为5×,基因组组装大小为5.42 Gb,同时,通过将其与祖先二倍体全基因组相比较,预测得到9.4万~9.6万个基因,其中,约2/3的基因被定位到A、B和D亚基因组,并在3个亚基因组上鉴定出约13.2万个单核苷酸多态性(single nucleotide polymorphism, SNP)位点。2014年,国际小麦基因组测序联盟(International Wheat Genome Sequencing Consortium, IWGSC)采用精湛的流式细胞仪分离技术,将‘中国春’的21条染色体臂进行了分离(除染色体3B之外,其余染色体均分为长臂和短臂),并构建了相应的细菌人工染色体(bacterial artificial chromosome, BAC)文库,通过对每条染色体/臂分别测序、组装,利用二代Illumina双端测序(Illumina paired-end, Illumina PE)数据组装出10.24 Gb的基因组,注释获得124 201个基因位点,并将其中7.5万个基因定位至特定染色体上[12];2017年,英国厄勒姆研究所、约翰英纳斯中心等研究人员利用精准大小的配对(mate pair)文库和优化的组装算法,进一步提高了‘中国春’基因组的组装质量和完整性,组装大小为13.43 Gb,约占完整‘中国春’基因组的78%,scaffold N50值(包含至少50%组装长度scaffold集合中最短的scaffold长度)达88.8 kb;同时结合链特异性RNA测序(RNA-sequencing, RNA-Seq)和PacBio全长转录组测序技术,预测出104 091个高置信度(high confidence, HC)的蛋白编码基因和10 156个非编码RNA[13];2017年,美国约翰斯霍普金斯大学的研究小组利用二代测序(Illumina PE)和三代测序(PacBio SMRT)技术,通过深度测序组装出15.34 Gb的基因组图谱,约占‘中国春’全基因组的90%,contig N50值[包含至少50%组装长度重叠群(contig)集合中最短的contig长度]达232.7 kb;基因组组装和注释完整性评估分析显示,通用单拷贝同源基因基准(Benchmarking Universal Single-Copy Orthologs, BUSCO)评估指数(含至少1个完整拷贝)为98.3%[14];2018年,IWGSC在2014年发布的分染色体组装结果(BAC测序)的基础上,结合Illumina双端测序(PE/MP)和10×Genomics技术,利用NRGene公司DeNovoMAGIC2平台进行短片段组装,最后利用BioNano光学图谱技术、Hi-C技术和基于群体测序(population sequencing, POPSEQ)的高密度遗传图谱进行染色体挂载(mounting)[10]。该研究重新评估的普通小麦基因组大小为15.4~15.8 Gb(此前为15.9~17.3 Gb),这一版本的序列组装指标明显得到提升,组装的基因组大小由原先的10.24 Gb提升至14.50 Gb,其中97%的序列挂载到A、B、D 3套染色体上,scaffold N50值提升至22.8 Mb(表1)。整个基因组重复序列含量为84.7%,3套亚基因组之间无明显差异。在完整拼装的染色体序列基础上,注释并获得了107 891个高置信度基因,BUSCO评估指数高达99.0%,是迄今为止完整度最高、质量最好的普通小麦染色体级别参考基因组[10];美国加州大学戴维斯分校研究团队利用六倍体普通小麦的BioNano光学图谱技术和PacBio SMRT长读长测序组装结果[14],进一步纠正了上述1.0版本中覆盖10%基因组序列中的拼装错误,并将其更新至2.1版本[15]

除‘中国春’外,多个六倍体普通小麦基因组也陆续被测序和发布。‘W7984’是由小麦近缘物种节节麦(DD)与硬粒小麦(T. turgidum var. durum,AABB)杂交并经人工培育获得的可育六倍体小麦品系。CHAPMAN等[16]利用二代Illumina双端测序技术从头组装获得了9.12 Gb的‘W7984’基因组,并利用超高密度的POPSEQ遗传图谱将其中7.10 Gb定位到染色体上,contig N50和scaffold N50值分别为8.3 kb和24.8 kb;‘Fielder’由美国爱达荷大学于20世纪70年代育成,是现有小麦品种中最容易实现遗传转化的品种,高质量基因组序列信息对于提高‘Fielder’小麦基因组编辑效率具有重要意义。2021年,日本冈山大学植物科学与资源研究所SATO领导的研究团队结合最新的PacBio循环共识测序(circular consensus sequencing, CCS)技术和基于核酸内切酶的Omni-C染色体构象捕获测序技术,组装了染色体级别的‘Fielder’小麦基因组[17]。组装基因组大小为15.00 Gb,其中98%的序列挂载到染色体上,scaffold N50值为20.7 Mb,共注释得到116 480个高置信度基因,BUSCO评估指数为97.1%(表1)。

泛基因组是近年来被普遍关注与迅速发展的一个研究方向,其内容为通过对不同品种基因组进行测序与组装,然后将组装好的基因序列进行整合注释,进而获取这个物种的全部遗传信息,并且对每种个体间遗传变异信息进行解析。2020年,加拿大萨斯喀彻温大学的研究团队[18]结合Illumina双端测序(PE/MP)、10×Genomics,DeNovoMAGIC3组装技术、Nanopore长读长测序技术、Hi-C技术和POPSEQ遗传图谱数据,完成了15个六倍体小麦品种的基因组组装,其中有10个达到染色体水平参考基因组的质量,组装大小为14.3~14.9 Gb,scaffold N50值为10.2~49.7 Mb,BUSCO评估指数为97.6%~98.4%,另外5个为scaffold水平基因组(表1);同时,该研究通过比较基因组学分析揭示了多个小麦品种基因组的结构和变异以及对当代小麦育种的影响。小麦基因组图谱为全面阐明其生长、发育、抗病、抗逆和高产的分子机制及相关规律奠定了基础,可极大推动相关遗传育种研究。

1.2 西藏半野生小麦全基因组测序

西藏半野生小麦(T. aestivum ssp. tibetanum)是我国特有的小麦种质资源,主要分布在澜沧江流域、雅鲁藏布江流域和隆子河流域,混生在普通小麦和青稞田中,成熟时自然断穗。长期以来,关于西藏半野生小麦的分类地位和起源演化一直存在争议。2020年,中国农业大学小麦研究中心[19]首先对西藏半野生小麦材料‘藏1817’进行了深度测序(Illumina PE/MP),并利用DeNovoMAGIC3分析平台和10×Genomics,以及借助‘中国春’基因组数据[10]进行染色体挂载,获得了第一个高质量的西藏半野生小麦参考基因组,这也是世界上第二个已发表的六倍体小麦的参考基因组。该基因组组装大小为14.71 Gb,scaffold N50值为37.6 Mb,重复序列比例为82.7%,注释了118 078个高置信度蛋白编码基因,BUSCO评估指数为99.5%(表1)。通过对74份西藏半野生小麦和35份西藏地方种进行重测序,揭示了西藏半野生小麦脱驯化于西藏地方种,其基因组存在丰富的变异,并发现了控制脱驯化性状的关键位点。这一研究解析了西藏地区小麦的高原适应性分化的遗传基础,为进一步发掘西藏半野生小麦优异的等位基因提供了基因组信息[19]

1.3 普通小麦亚基因组供体物种全基因组测序

普通小麦是异源六倍体,其形成涉及3个原始祖先物种和3次天然杂交。现有研究已证实,普通小麦A亚基因组的供体是乌拉尔图小麦(T. urartu),D亚基因组的供体是粗山羊草(Aegilops tauschii[20],而B亚基因组的供体可能是一个已经灭绝的、不同于所有现存山羊草属Sitopsis组的二倍体物种,其分化自现存的拟斯卑尔脱山羊草(A. speltoides)和无芒山羊草(A. mutica)的祖先物种[21]。大概距今650万年前,小麦属(AA)与山羊草属(BB)分离,约距今550万年前野生一粒小麦(乌拉尔图小麦,AA)与山羊草杂交形成节节麦(粗山羊草,DD),这2个物种在距今80万年前杂交形成了二粒小麦(AABB),最后在距今40万年内,粗山羊草与二粒小麦杂交形成了现在的栽培物种普通小麦(AABBDD)[20]

A基因组也是圆锥小麦(T. turgidum)、茹科夫斯基小麦(T. zhukovskyii)和提莫菲维小麦(T. timopheevii)的基础基因组,在小麦进化、驯化和改良中具有核心作用。2013年,中国科学院遗传与发育生物学研究所联合深圳华大基因科技有限公司等单位绘制了首张普通小麦A基因组图谱,利用二代测序(Illumina PE)数据组装出大小为4.66 Gb的乌拉尔图小麦‘G1812’基因组草图,约覆盖整个基因组的94%,contig N50值为3.4 kb,scaffold N50值为63.7 kb,预测到34 879个基因,鉴定出一些重要农艺性状基因和分子标记。比较基因组学研究发现,在进化过程中由于大量长末端重复(long terminal repeat, LTR)序列在基因间的插入,小麦A亚基因组剧烈扩增[22];2018年,该研究团队在上述绘制出的A基因组草图基础上,利用BAC文库、三代测序(PacBio SMRT)、BioNano光学图谱、10×Genomics等技术更新了乌拉尔图小麦的基因组,组装后基因组大小为4.86 Gb,覆盖整个基因组的98.4%,contig N50和scaffold N50值分别为344.0 kb和3.7 Mb,共注释了37 516个高置信度基因,新组装的基因组较之前版本更为完整[23]

D基因组来自粗山羊草,含有丰富的抗病、抗虫、耐寒、品质优等有益基因。JIA等[24]利用全基因组鸟枪法(Illumina PE和Roche 454测序)对粗山羊草‘AL8/78’基因组进行组装,组装大小为4.23 Gb,其中1.72 Gb可经遗传图谱锚定到特定染色体上,scaffold N50值为57.6 kb,共鉴定出34 498个高置信度基因;LUO等[25]结合全基因组鸟枪法和BAC测序方法,组装了大小为4.79 Gb的‘AL8/78’基因组,其中4.03 Gb可通过遗传图谱锚定到具体染色体上,共鉴定到17 093个基因和基因片段。ZIMIN等[26]采用PacBio SMRT三代测序提升了‘AL8/78’基因组质量,通过结合Illumina PE/MP短读长和PacBio SMRT长读长数据,建立了一套混合拼接组装流程(MaSuRCA),contig N50值达486.8 kb,scaffold N50值达521.7 kb;ZHAO等[27]采用二代测序(Illumina PE/MP)结合三代测序(PacBio SMRT)和NRGene公司的DeNovoMAGIC2组装技术,更新了‘AL8/78’基因组,共组装出大小为4.31 Gb的基因组图谱,占完整基因组大小的95.8%,其中3.99 Gb由高密度SNP遗传图谱挂载至特定染色体,contig N50值为112.6 kb,scaffold N50值为12.1 Mb,完整性较之前(2013年版本)提升了210倍;LUO等[28]利用经典的全基因组鸟枪法和BAC测序,并结合PacBio SMRT长读长测序技术和BioNano光学图谱技术,获得了粗山羊草‘AL8/78’染色体级别的参考基因组,组装大小为4.23 Gb,其中4.03 Gb被锚定到具体染色体上,scaffold N50值为31.7 Mb,注释获得39 622个高置信度基因,BUSCO评估指数为97.8%(表1)。

野生二粒小麦(AABB)是包括四倍体栽培小麦和六倍体普通小麦在内的多倍体小麦的原始形态,含有丰富的优异等位基因,是小麦遗传改良的基因供体。以色列特拉维夫大学、澳大利亚悉尼大学等利用Illumina测序平台(Illumina PE250)和PCR-free建库方法,获得相对较长的二代测序数据,再利用NRGene公司的DeNovoMAGIC2平台进行组装,并结合遗传图谱和Hi-C技术,绘制了首个野生二粒小麦‘Zavitan’的基因组图谱。基因组组装大小为10.50 Gb,占完整野生二粒小麦基因组的87.5%,其中10.10 Gb被锚定到具体染色体上,scaffold N50值为7.0 Mb,82.2%的序列被注释为重复序列,共鉴定出65 012个高置信度基因,BUSCO评估指数为98.4%。通过这个组装质量良好的四倍体小麦基因组,鉴定出控制落粒性这一重要驯化性状的主效基因TtBtr1的关键功能位点[4]。硬粒小麦(AABB)是圆锥小麦的变种之一,由野生二粒小麦驯化而来。硬粒小麦籽粒蛋白质和面筋含量较高,常用于制作通心粉和面条,口感独特。MACCAFERRI等[29]采用Illumina双端测序(PE/MP)和DeNovoMAGIC2组装平台对硬粒小麦栽培品种‘Svevo’的基因组进行了测序,组装出10.45 Gb大小的基因组,其scaffold N50值为6.0 Mb,重复序列比例为82.2%。同时采用Hi-C技术和高密度SNP遗传图谱将95.3%(约9.96 Gb)的基因组序列挂载到14条染色体上,并对其中90%的序列进行了定位,另外,全基因组序列共注释得到了66 559个高置信度基因,BUSCO评估指数为98.1%(表1)。与野生二粒小麦‘Zavitan’相比,‘Svevo’高置信度基因的变异和丢失主要发生于染色体的远端区域,同时,串联基因复制被认为是变异发生的主要原因。

2 大麦属全基因组测序

2.1 栽培大麦全基因组测序

大麦(2n=2x=14,HH)是一种重要的谷类作物,栽培历史悠久,抗逆性强、适应性广、用途多样。大麦基因组大小为5.1 Gb,相当于人类或玉米基因组的2倍,且重复序列比例高达84%,因此全基因组测序和组装的难度较大[30]。六棱皮大麦‘Morex’是美国标准啤酒大麦品种之一,也是栽培大麦基因组测序最常用的研究材料。2012年,国际大麦测序联盟(International Barley Genome Sequencing Consortium, IBSC)利用全基因组鸟枪法(Illumina PE/MP和Roche 454测序平台),同时结合深度RNA测序(RNA-Seq)数据,构建了1.87 Gb大小的大麦‘Morex’基因组草图(contig序列),contig N50值仅为1.4 kb,注释获得26 159个高置信度基因[30];几年后,MASCHER等[31]综合运用BAC测序、Illumina PE/MP、Roche 454测序和BioNano光学图谱技术,组装获得了一个包含4.79 Gb的‘Morex’高质量参考基因组(Morex V1),最终利用Hi-C技术和POPSEQ遗传图谱分别将94.8%和96.7%的序列挂载到染色体上,并鉴定到39 734个高置信度基因。其组装质量与2012年大麦基因组草图相比有很大提升,但contig N50值只有79.0 kb,scaffold N50值也仅有1.9 Mb,仍会导致许多基因无法被预测,这将给后续基因组的功能解读与研究带来困难。2019年,MONAT等[32]利用最新开发的复杂基因组组装工具TRITEX(Illumina PE/MP、10×Genomics、Hi-C技术)获得了4.65 Gb的大麦参考基因组(Morex V2),scaffold N50值提高至40.2 Mb,注释获得32 787个高置信度基因,BUSCO评估指数提升至98.9%(Morex V1中为92.5%);2021年,MASCHER等[33]在TRITEX策略基础上结合了三代测序技术(PacBio SMRT长读长测序、PacBio循环共识测序和Nanopore长读长测序),组装了大小为4.50 Gb的大麦参考基因组(Morex V3),scaffold N50值跃升至118.9 Mb,注释得到35 827个高置信度基因(表1)。

‘Haruna Nijo’是日本优质啤用大麦品种,其突出优势是麦芽浸出率高。SATO等[34]利用二代测序技术(Illumina PE和Roche 454测序)组装获得了2.00 Gb的‘Haruna Nijo’基因组草图,scaffold N50值仅为3.5 kb,BUSCO评估指数为80.2%;SAKKOUR等[35]运用TRITEX工具组装获得4.28 Gb的高质量‘Haruna Nijo’参考基因组,其中4.13 Gb序列能够精确定位到Hi-C图谱上,scaffold N50值为18.9 Mb,注释获得49 524个高置信度基因,BUSCO评估指数为96.0%。另外,XU等[36]采用TRITEX策略结合PacBio SMRT长读长测序技术获得了加拿大二棱啤用大麦品种‘AAC Synergy’的参考基因组,组装基因组大小为4.85 Gb,其中4.14 Gb序列被准确定位到特定染色体上,scaffold N50值为2.3 Mb,并鉴定出46 845个高置信度基因。‘Golden Promise’(黄金希望)是来自英国的二棱春大麦中的一个品种,因其优异的遗传转化效率被广泛应用于基因功能研究。高质量的‘Golden Promise’基因组将大大提升大麦基因编辑效率,从而助力相关功能基因组学研究。SCHREIBER等[37]利用Illumina双端测序(PE/MP)、体外Dovetail Chicago文库和Hi-C技术组装获得了4.13 Gb大小的‘Golden Promise’染色体级别参考基因组,scaffold N50值为4.1 Mb,注释获得45 154个高置信度基因,BUSCO评估指数为95.2%(表1)。

大麦泛基因组研究进展几乎与小麦泛基因组研究同步。JAYAKODI等[38]在德国国家基因库超过22 000个大麦种质中选取了20个(包括1个野生种、8个栽培种和11个地方种)具有代表性的品种,其中16个种质使用Minia+SOAPdenovo+TRITEX方法组装,3个种质使用DeNovoMAGIC3平台组装,1个种质使用DeNovoMAGIC3平台和10×Genomics测序组装,并利用Hi-C和POPSEQ遗传图谱数据进行染色体挂载,最终共获得了20个染色体水平的基因组,组装大小为3.8~4.5 Gb,scaffold N50值为5.0~42.7 Mb,共注释了35 859~40 044个高置信度基因。通过组装比较和单拷贝序列聚类2种方法共鉴定出1 586 262个大片段获得/缺失变异(presence/absence variation, PAV)和丰富的大片段倒位多态性(>5 Mb),并详细分析了其中2个频繁出现在优质大麦种质资源中的倒位,一个可能是由突变育种产生的,而另外一个则是参与大麦地理范围扩张相关的位点连锁。

2.2 大麦变种全基因组测序

青稞(H. vulgare var. coeleste)即青藏高原种植的裸大麦,为大麦的一个变种,在藏语中被称为“乃”,是青藏高原农牧民的主要食粮和牲畜饲料。在青藏高原长期的自然选择和人工驯化下,青稞形成了对高原复杂地理、极端气候环境的独特适应性,是作物改良的重要遗传资源。ZENG等[39]利用全基因组鸟枪法(Illumina PE),对青稞地方品种‘拉萨钩芒’进行了深度测序,发现该品种基因组大小约为4.48 Gb,其中80%以上为重复序列。组装获得约3.89 Gb大小的基因组序列,占整个基因组的87%,scaffold N50值为242.0 kb。共预测出36 151高置信度基因,并利用‘Morex’基因组(2012)和遗传图谱将其中近94%的基因锚定到7条染色体上。进一步对来自青藏高原的5份野生大麦和5份栽培品种进行重测序,发现了大量SNP位点和PAV突变。通过与已报道的非高原大麦基因组序列对比发现,青藏高原野生大麦与该地区栽培品种的亲缘关系更近,进一步证实西藏地区是栽培大麦的驯化中心之一。此外,青稞基因组中植物激素信号转导、植物与病原物互作、次生代谢物合成等大量与环境胁迫适应性相关的基因受到显著正向选择,这可能是青稞适应高原环境的重要原因。‘藏青320’是西藏地区迄今推广面积最广的青稞品种。DAI等[40]结合二代测序(Illumina PE/MP)和PacBio SMRT长读长测序技术,从头组装了3.73 Gb的scaffold序列,scaffold N50值为171.1 kb,并借助2017年发表的Morex V1基因组获得了‘藏青320’染色体级别的参考基因组(大小为4.84 Gb,染色体挂载率为94.8%)。全基因组序列注释得到46 787个高置信度基因,其中31 564个基因通过39个野生和栽培大麦的转录组数据得到验证;ZENG等[41]利用二代(Illumina MP)和三代(PacBio SMRT)测序技术相结合的策略和遗传图谱更新了‘拉萨钩芒’的基因组。该参考基因组大小为4.0 Gb,contig N50和scaffold N50值分别为1.6 Mb和4.0 Mb,通过注释获得了40 457个高置信度基因,BUSCO评估指数为95.7%,组装质量和完整度均得到大幅提升(表1)。

2.3 大麦属野生物种全基因组测序

野生大麦是栽培大麦的祖先种,含有大量与抗病和抗逆等性状相关的有益基因,在大麦进化研究与遗传育种上具有重要价值。LIU等[5]选取一份来自伊朗的野生大麦‘AWCS276/WB1’为实验材料,利用全基因组鸟枪法进行深度测序(Illumina PE,150×),流式细胞仪分析表明该野生大麦的基因组大小约为4.60 Gb,组装基因组大小为4.28 Gb,占整个基因组的93%,其中77.8%为重复序列,scaffold N50值为724.9 kb。利用基因组和转录组数据共预测出36 395个高置信度基因,BUSCO评估表明该基因组的组装完整度为95.3%。通过LTR插入时间分析发现,野生大麦和栽培大麦在大约100万年前开始分化。与栽培大麦基因组相比,野生大麦的基因组中包含更多与生物和非生物胁迫抗性相关的基因;SATO等[6]选取来自中亚的野生大麦‘OUH602’为实验材料,采用TRITEX测序流程,组装获得约4.50 Gb大小的基因组,其中4.32 Gb被挂载至特定染色体上,scaffold N50值为11.3 Mb,BUSCO评估指数为97.1%。海大麦(H. marinum)是大麦、小麦的野生近缘种,携带独特的Xa基因组,其因突出的耐盐性和耐渍性受到广泛关注[42-43]。海大麦的marinum亚种能够与栽培种六倍体小麦杂交,其后代对盐(NaCl)和渍水胁迫的耐性得到显著提高,因此被视为小麦耐盐性改良的潜在遗传供体[44-45]。KUANG等[46]采用Illumina PE、PacBio SMRT、10×Genomics和Hi-C 4种技术相结合的策略对marinum亚种材料‘H559’进行基因组测序和从头组装,组装基因组大小为3.82 Gb,contig N50和scaffold N50值分别为6.83 Mb和524.47 Mb,3.69 Gb(96.8%)的序列被定位到7条染色体上,在全基因组序列中注释得到41 045个高置信度基因,BUSCO评估指数为98.4%,重复序列长度为3.14 Gb(82.2%),LTR组装指数(LTR assembly index, LAI)为12.7,属于参考基因组级别(表1)。在组装基因组的基础上,还构建了海大麦的高效转化体系和基因编辑体系,并揭示了HmSOS1基因调控海大麦耐盐性的重要作用机制。海大麦参考基因组信息及其高效基因编辑体系对小麦族作物抗逆机制研究及育种改良均具有重要参考价值。

3 黑麦属全基因组测序

黑麦(S. cereale,2n=2x=14,RR)属于小麦族黑麦属,与普通小麦和大麦有一定的亲缘关系,具有独特的农艺性状和基因组特性。黑麦1RS染色体臂携带的抗病基因通过远缘杂交转入小麦基因组后,显著提高了小麦的白粉病和条锈病抗性[47]。黑麦基因组含有7对较长的染色体,基因组大小约7.9 Gb,重复序列比例超过90%,是所有小麦族二倍体物种中基因组最大、最复杂的物种[47-48]。BAUER等[48]利用Illumina双端测序(PE/MP),对冬黑麦自交系‘Lo7’进行全基因组鸟枪法测序,从头组装获得2.80 Gb大小的基因组,鉴定到27 784个高置信度基因,又通过对10个黑麦自交系和野生瓦维洛夫黑麦进行重测序,发现了超过9 000万个SNPs和InDels位点。LI等[47]结合TRITEX工具、PacBio SMRT长读长测序、遗传图谱、BioNano光学图谱技术等,对我国优良黑麦品种‘威宁黑麦’自交系进行全基因组测序,最终组装出7.74 Gb大小的基因组(占预估基因组大小的98.47%),scaffold N50值为1.0 Gb,并将93.67%的序列挂载至7条染色体上,重复序列占总基因组的90.31%,注释获得了45 596个高置信度蛋白编码基因,BUSCO评估指数为96.7%(表1)。有分析发现,长末端重复序列(LTR)中的Gypsy转座子是‘威宁黑麦’基因组扩张的主要原因之一,并基于高质量基因组揭示了全基因组基因复制的原因及其对淀粉生物合成基因的影响,解析了复杂储存蛋白基因位点、早抽穗性状基因表达特征以及黑麦中与驯化相关的染色体区域和基因座。‘威宁黑麦’基因组组装对于破解黑麦基因组生物学难题、开展谷类比较基因组学研究,以及加速黑麦及相关谷类作物的遗传改良具有重要价值。

4 偃麦草属全基因组测序

长穗偃麦草(E. elongatum,2n=2x=14,EE)曾在小麦育种中发挥重要作用,其携带的持久抗叶锈基因Lr19和抗赤霉病主效基因Fhb7是极其珍贵的基因资源。WANG等[7]结合Illumina双端测序(PE/MP)、DeNovoMAGIC3组装技术、PacBio SMRT长读长测序、10×Genomics测序,以及利用BioNano光学图谱技术和Hi-C技术进行染色体挂载,获得了长穗偃麦草的参考基因组。组装基因组大小为4.63 Gb,约占完整基因组大小的96.9%,其中4.54 Gb被挂载至具体染色体上,contig N50和scaffold N50值分别为2.2 Mb和73.2 Mb,通过注释获得了44 474个高置信度基因,BUSCO评估指数为97.6%(表1)。根据参考基因组开发分子标记,利用小麦-长穗偃麦草异代换系(7D/7E)构建的作图群体,完成了Fhb7基因的精细定位,并获得了唯一表达的候选基因(功能注释为谷胱甘肽S转移酶)。长穗偃麦草基因组组装工作的完成,为进一步克隆并有效利用长穗偃麦草E基因组中的优异基因提供了重要的信息资源。

5 山羊草属全基因组测序

山羊草属丰富了小麦改良的遗传多样性资源库,是小麦远缘杂交抗病育种的重要材料。该属中的Sitopsis组成员蕴藏着抗病和抗逆等优异性状,在小麦遗传改良上潜力巨大。然而,由于Sitopsis组中具有S和S*基因组的物种与小麦杂交困难,迄今为止,只有少数基因能从Sitopsis物种转移到小麦中[50]。更好的基因组工具,特别是高质量的S基因组序列,可加深对这些物种与小麦种的基因组关系的了解,并为更多有益优异基因的鉴定和分离创造条件。LI等[21]利用Nanopore长读长测序、Hi-C技术和Illumina短读长测序组装了Sitopsis组所有5个物种的染色体水平基因组,即二角山羊草(A. bicornis,S*S*)、高大山羊草(A. longissima,S*S*)、西尔斯山羊草(A. searsii,S*S*)、沙融山羊草(A. sharonensis,S*S*)和拟斯卑尔脱山羊草(A. speltoides,SS),这5个物种的基因组在大小上存在差异,从4.11 Gb到5.89 Gb不等,都具有高水平(86.0%~88.1%)的重复序列,染色体锚定率为87.3%~95.4%,contig N50值为0.6~8.7 Mb,注释得到37 201~40 222个高置信度基因,BUSCO评估指数为92.9%~95.1%(表1)。系统发育分析结果表明,普通小麦中的B亚基因组的供体是一个不同于所有现存山羊草属Sitopsis组物种的二倍体物种。AVNI等[49]则利用TRITEX测序流程组装了高大山羊草和拟斯卑尔脱山羊草基因组,并将其与近期组装的沙融山羊草基因组[50]进行对比,通过基因注释和直系同源物分析发现,拟斯卑尔脱山羊草与普通小麦B亚基因组亲缘关系最为相近,而高大山羊草和沙融山羊草与粗山羊草和普通小麦D亚基因组最为相近。

6 展望

一个连续且注释良好的基因组序列是进行基因/性状发现、基因组动力学、系统发育和进化等研究的基础。小麦族物种基因组大而复杂,倍性水平多样,全基因组测序和组装难度较大。然而,新一代测序技术(如PacBio SMRT、Oxford公司的Nanopore光学测序技术、Dovetail Chicago染色质构象捕捉技术等)和新的计算工具(如针对复杂度高基因组的NRGene公司DeNovoMAGIC组装方案)的出现,为小麦族物种的全基因组解码铺平了道路。随着小麦和大麦泛基因组研究的开展和深入,可以预见,作物个体基因组时代即将来临,基因组大数据将广泛应用于麦类作物遗传改良。可以预期,随着测序效率的进一步提高和测序成本的进一步下降,重要作物品种、品系和育种材料的重测序将日益增多,并用于育种选择和评价。平均读长更长的测序技术以及优化的组装算法和泛基因组分析工具等,将是未来小麦族物种复杂基因组测序的重点突破方向。

小麦族栽培作物(如小麦和大麦)作为驯化产物,在长期的选择育种过程中,在部分突出优良基因被选择的同时,一些未被挖掘利用的基因被淘汰或丢失,致使其遗传背景逐渐变窄。作物育种取得重大进展和突破与遗传资源的发现、开拓及有效利用紧密相关,充分利用小麦族丰富的遗传资源是拓宽小麦遗传基础的根本途径。小麦野生近缘种属中已有多个优良外源性状/基因被导入栽培作物,以培育出特定性状取得突破性改良的新品种。澳大利亚研究人员从小麦野生近缘种一粒小麦(T. monococcum)中克隆到一个阻控Na+从根部往地上部转运的膜蛋白TmHKT1;5-A,通过杂交将该蛋白的基因导入硬粒小麦品种‘Tamaroi’,使其在盐土上的种植产量提高了近25%[51];SUBBARAO等[52]将小麦野生近缘种大赖草(Leymus racemosus)的3Nsb染色体短臂转移到优良小麦品种中,表现为生物硝化抑制作用增强,从而改善土壤铵水平,显著提高了小麦对低氮条件的适应性,而其他农艺性状并未受影响。WANG等[7]发现,小麦近缘植物长穗偃麦草7E染色体长臂末端携带抗赤霉病主效基因,并将其命名为Fhb7,将该基因转移至小麦栽培品种后,显著提高了小麦对赤霉病的稳定抗性。总之,不断发掘小麦族野生资源中的优良基因,进而对这些基因的功能及分子机制进行深入研究并应用于育种,将促进作物育种取得突破性成果,而高质量的基因组序列和基因注释可为候选基因位点的鉴定与分离提供有力的技术支撑。

参考文献

SUN Y Q, SHANG L G, ZHU Q H, et al.

Twenty years of plant genome sequencing: achievements and challenges

[J]. Trends in Plant Science, 2022, 27(4): 391-401. DOI: 10.1016/j.tplants.2021.10.006

[本文引用: 1]

FEUILLET C, SALSE J.

Comparative genomics in the Triticeae

[M]//FEUILLET C, MUEHLBAUER G J. Genetics and Genomics of the Triticeae. Plant Genetics and Genomics: Crops and Models. Vol. 7. YorkNew, USA: Springer, 2009: 451-477. DOI: 10.1007/978-0-387-77489-3

[本文引用: 1]

Food and Agriculture Organization of the United Nations.

FAOSTAT

[EB/OL]. [2022-01-03].

URL     [本文引用: 1]

AVNI R, NAVE M, BARAD O, et al.

Wild emmer genome architecture and diversity elucidate wheat evolution and domestication

[J]. Science, 2017, 357(6346): 93-96. DOI: 10.1126/science.aan0032

[本文引用: 4]

LIU M, LI Y, MA Y L, et al.

The draft genome of a wild barley genotype reveals its enrichment in genes related to biotic and abiotic stresses compared to cultivated barley

[J]. Plant Biotechnology Journal, 2020, 18(2): 443-456. DOI: 10.1111/pbi.13210

[本文引用: 3]

SATO K, MASCHER M, HIMMELBACH A, et al.

Chromosome-scale assembly of wild barley accession “OUH602

”[J]. G3: Genes Genomes Genetics, 2021, 11(10): jkab244. DOI: 10.1093/g3journal/jkab244

[本文引用: 3]

WANG H W, SUN S L, GE W Y, et al.

Horizontal gene transfer of Fhb7 from fungus underlies Fusarium head blight resistance in wheat

[J]. Science, 2020, 368(6493): eaba5435. DOI: 10.1126/science.aba5435

[本文引用: 4]

傅向东,刘倩,李振声,.

小麦基因组研究现状与展望

[J].中国科学院院刊,2018,33(9):909-914. DOI:10.16418/j.issn.1000-3045.2018.09.003

[本文引用: 2]

FU X D, LIU Q, LI Z S, et al.

Research achievement and prospect development on wheat genome

[J]. Bulletin of Chinese Academy of Sciences, 2018, 33(9): 909-914. (in Chinese with English abstract)

DOI:10.16418/j.issn.1000-3045.2018.09.003      [本文引用: 2]

SHI X L, LING H Q.

Current advances in genome sequencing of common wheat and its ancestral species

[J]. Crop Journal, 2018, 6(1): 15-21. DOI: 10.1016/j.cj.2017.11.001

[本文引用: 3]

International Wheat Genome Sequencing Consortium.

Shifting the limits in wheat research and breeding using a fully annotated reference genome

[J]. Science, 2018, 361(6403): eaar7191. DOI: 10.1126/science.aar7191

[本文引用: 5]

BRENCHLEY R, SPANNAGL M, PFEIFER M, et al.

Analysis of the bread wheat genome using whole-genome shotgun sequencing

[J]. Nature, 2012, 491(7426): 705-710. DOI: 10.1038/nature11650

[本文引用: 4]

International Wheat Genome Sequencing Consortium.

A chromosome-based draft sequence of the hexaploid bread wheat (Triticum aestivum) genome

[J]. Science, 2014, 345(6194): 1251788. DOI: 10.1126/science.1251788

[本文引用: 2]

CLAVIJO B J, VENTURINI L, SCHUDOMA C, et al.

An improved assembly and annotation of the allohexaploid wheat genome identifies complete families of agronomic genes and provides genomic evidence for chromosomal translocations

[J]. Genome Research, 2017, 27(5): 885-896. DOI: 10.1101/gr.217117.116

[本文引用: 2]

ZIMIN A V, PUIU D, HALL R, et al.

The first near-complete assembly of the hexaploid bread wheat genome, Triticum aestivum

[J]. GigaScience, 2017, 6(11): gix097. DOI: 10.1093/gigascience/gix097

[本文引用: 3]

ZHU T T, WANG L, RIMBERT H, et al.

Optical maps refine the bread wheat Triticum aestivum cv. Chinese Spring genome assembly

[J]. The Plant Journal, 2021, 107(1): 303-314. DOI: 10.1111/tpj.15289

[本文引用: 1]

CHAPMAN J A, MASCHER M, BULUC A, et al.

A whole-genome shotgun approach for assembling and anchoring the hexaploid bread wheat genome

[J]. Genome Biology, 2015, 16: 26. DOI: 10.1186/s13059-015-0582-8

[本文引用: 2]

SATO K, ABE F, MASCHER M, et al.

Chromosome-scale genome assembly of the transformation-amenable common wheat cultivar ‘Fielder’

[J]. DNA Research, 2021, 28(3): dsab008. DOI: 10.1093/dnares/dsab008

[本文引用: 2]

WALKOWIAK S, GAO L L, MONAT C, et al.

Multiple wheat genomes reveal global variation in modern breeding

[J]. Nature, 2020, 588(7837): 277-283. DOI: 10.1038/s41586-020-2961-x

[本文引用: 2]

GUO W L, XIN M M, WANG Z H, et al.

Origin and adaptation to high altitude of Tibetan semi-wild wheat

[J]. Nature Communications, 2020, 11: 5085. DOI: 10.1038/s41467-020-18738-5

[本文引用: 3]

MARCUSSEN T, SANDVE S R, HEIER L, et al.

Ancient hybridizations among the ancestral genomes of bread wheat

[J]. Science, 2014, 345(6194): 1250092. DOI: 10.1126/science.1250092

[本文引用: 2]

LI L F, ZHANG Z B, WANG Z H, et al.

Genome sequences of five Sitopsis species of Aegilops and the origin of polyploid wheat B subgenome

[J]. Molecular Plant, 2022, 15(3): 488-503. DOI: 10.1016/j.molp.2021.12.019

[本文引用: 7]

LING H Q, ZHAO S C, LIU D C, et al.

Draft genome of the wheat A-genome progenitor Triticum urartu

[J]. Nature, 2013, 496(7443): 87-90. DOI: 10.1038/nature11997

[本文引用: 2]

LING H Q, MA B, SHI X L, et al.

Genome sequence of the progenitor of wheat A subgenome Triticum urartu

[J]. Nature, 2018, 557(7705): 424-428. DOI: 10.1038/s41586-018-0108-0

[本文引用: 2]

JIA J Z, ZHAO S C, KONG X Y, et al.

Aegilops tauschii draft genome sequence reveals a gene repertoire for wheat adaptation

[J]. Nature, 2013, 496(7443): 91-95. DOI: 10.1038/nature12028

[本文引用: 2]

LUO M C, GU Y Q, YOU F M, et al.

A 4-gigabase physical map unlocks the structure and evolution of the complex genome of Aegilops tauschii, the wheat D-genome progenitor

[J]. PNAS, 2013, 110(19): 7940-7945. DOI: 10.1073/pnas.1219082110

[本文引用: 2]

ZIMIN A V, PUIU D, LUO M C, et al.

Hybrid assembly of the large and highly repetitive genome of Aegilops tauschii, a progenitor of bread wheat, with the MaSuRCA mega-reads algorithm

[J]. Genome Research, 2017, 27(5): 787-792. DOI: 10.1101/gr.213405.116

[本文引用: 2]

ZHAO G Y, ZOU C, LI K, et al.

The Aegilops tauschii genome reveals multiple impacts of transposons

[J]. Nature Plants, 2017, 3(12): 946-955. DOI: 10.1038/s41477-017-0067-8

[本文引用: 2]

LUO M C, GU Y Q, PUIU D, et al.

Genome sequence of the progenitor of the wheat D genome Aegilops tauschii

[J]. Nature, 2017, 551(7681): 498-502. DOI: 10.1038/nature24486

[本文引用: 2]

MACCAFERRI M, HARRIS N S, TWARDZIOK S O, et al.

Durum wheat genome highlights past domestication signatures and future improvement targets

[J]. Nature Genetics, 2019, 51(5): 885-895. DOI: 10.1038/s41588-019-0381-3

[本文引用: 2]

International Barley Genome Sequencing Consortium.

A physical, genetic and functional sequence assembly of the barley genome

[J]. Nature, 2012, 491(7426): 711-716. DOI: 10.1038/nature11543

[本文引用: 3]

MASCHER M, GUNDLACH H, HIMMELBACH A, et al.

A chromosome conformation capture ordered sequence of the barley genome

[J]. Nature, 2017, 544(7651): 427-433. DOI: 10.1038/nature22043

[本文引用: 2]

MONAT C, PADMARASU S, LUX T, et al.

TRITEX: chromosome-scale sequence assembly of Triticeae genomes with open-source tools

[J]. Genome Biology, 2019, 20: 284. DOI: 10.1186/s13059-019-1899-5

[本文引用: 2]

MASCHER M, WICKER T, JENKINS J, et al.

Long-read sequence assembly: a technical evaluation in barley

[J]. The Plant Cell, 2021, 33(6): 1888-1906. DOI: 10.1093/plcell/koab077

[本文引用: 2]

SATO K, TANAKA T, SHIGENOBU S, et al.

Improvement of barley genome annotations by deciphering the Haruna Nijo genome

[J]. DNA Research, 2016, 23(1): 21-28. DOI: 10.1093/dnares/dsv033

[本文引用: 2]

SAKKOUR A, MASCHER M, HIMMELBACH A, et al.

Chromosome-scale assembly of barley cv. ‘Haruna Nijo’ as a resource for barley genetics

[J]. DNA research, 2022, 29(1): dsac001. DOI: 10.1093/dnares/dsac001

[本文引用: 2]

XU W, TUCKER J R, BEKELE W A, et al.

Genome assembly of the Canadian two-row malting barley cultivar AAC Synergy

[J]. G3: Genes Genomes Genetics, 2021, 11(4): jkab031. DOI: 10.1093/g3journal/jkab031

[本文引用: 2]

SCHREIBER M, MASCHER M, WRIGHT J, et al.

A genome assembly of the barley ‘transformation reference’ cultivar Golden Promise

[J]. G3: Genes Genomes Genetics, 2020, 10(6): 1823-1827. DOI: 10.1534/g3.119.401010

[本文引用: 2]

JAYAKODI M, PADMARASU S, HABERER G, et al.

The barley pan-genome reveals the hidden legacy of mutation breeding

[J]. Nature, 2020, 588(7837): 284-289. DOI: 10.1038/s41586-020-2947-8

[本文引用: 2]

ZENG X Q, LONG H, WANG Z, et al.

The draft genome of Tibetan hulless barley reveals adaptive patterns to the high stressful Tibetan Plateau

[J]. PNAS, 2015, 112(4): 1095-1100. DOI: 10.1073/pnas.1423628112

[本文引用: 2]

DAI F, WANG X L, ZHANG X Q, et al.

Assembly and analysis of a qingke reference genome demonstrate its close genetic relation to modern cultivated barley

[J]. Plant Biotech-nology Journal, 2018, 16(3): 760-770. DOI: 10.1111/pbi.12826

[本文引用: 2]

ZENG X Q, XU T, LING Z H, et al.

An improved high-quality genome assembly and annotation of Tibetan hulless barley

[J]. Scientific Data, 2020, 7: 139. DOI: 10.1038/s41597-020-0480-0

[本文引用: 2]

GARTHWAITE A J, STEUDLE E, COLMER T D.

Water uptake by roots of Hordeum marinum: formation of a barrier to radial O2 loss does not affect root hydraulic conductivity

[J]. Journal of Experimental Botany, 2006, 57(3): 655-664. DOI: 10.1093/jxb/erj055

[本文引用: 1]

GARTHWAITE A J, VON BOTHMER R, COLMER T D.

Salt tolerance in wild Hordeum species is associated with restricted entry of Na+ and Cl into the shoots

[J]. Journal of Experimental Botany, 2005, 56(419): 2365-2378. DOI: 10.1093/jxb/eri229

[本文引用: 1]

ALAMRI S A, BARRETT-LENNARD E G, TEAKLE N L, et al.

Improvement of salt and waterlogging tolerance in wheat: comparative physiology of Hordeum marinum-Triticum aestivum amphiploids with their H. marinum and wheat parents

[J]. Functional Plant Biology, 2013, 40(11): 1168-1178. DOI: 10.1071/fp12385

[本文引用: 1]

ISLAM S, MALIK A I, ISLAM A K M R, et al.

Salt tolerance in a Hordeum marinum-Triticum aestivum amphiploid, and its parents

[J]. Journal of Experimental Botany, 2007, 58(5): 1219-1229. DOI: 10.1093/jxb/erl293

[本文引用: 1]

KUANG L H, SHEN Q F, CHEN L Y, et al.

The genome and gene editing system of sea barleygrass provide a novel platform for cereal domestication and stress tolerance studies

[J]. Plant Communications, 2022, 3(5): 100333. DOI: 10.1016/j.xplc.2022.100333

[本文引用: 2]

LI G W, WANG L J, YANG J P, et al.

A high-quality genome assembly highlights rye genomic characteristics and agrono-mically important genes

[J]. Nature Genetics, 2021, 53(4): 574-584. DOI: 10.1038/s41588-021-00808-z

[本文引用: 4]

BAUER E, SCHMUTZER T, BARILAR I, et al.

Towards a whole-genome sequence for rye (Secale cereale L.)

[J]. The Plant Journal, 2017, 89(5): 853-869. DOI: 10.1111/tpj.13436

[本文引用: 3]

AVNI R, LUX T, MINZ-DUB A, et al.

Genome sequences of three Aegilops species of the section Sitopsis reveal phylogenetic relationships and provide resources for wheat improvement

[J]. The Plant Journal, 2022, 110(1): 179-192. DOI: 10.1111/tpj.15664

[本文引用: 3]

YU G T, MATNY O, CHAMPOURET N, et al.

Aegilops sharonensis genome-assisted identification of stem rust resistance gene Sr62

[J]. Nature Communications, 2022, 13: 1607. DOI: 10.1038/s41467-022-29132-8

[本文引用: 3]

MUNNS R, JAMES R A, XU B, et al.

Wheat grain yield on saline soils is improved by an ancestral Na+ transporter gene

[J]. Nature Biotechnology, 2012, 30(4): 360-364. DOI: 10.1038/nbt.2120

[本文引用: 1]

SUBBARAO G V, KISHII M, BOZAL-LEORRI A, et al.

Enlisting wild grass genes to combat nitrification in wheat farming: a nature-based solution

[J]. PNAS, 2021, 118(35): e2106595118. DOI: 10.1073/pnas.2106595118

[本文引用: 1]

/