葡萄EST-SNP位点的信息与特征
为了从不同基因型葡萄组织的表达序列标签(EST)中得到候选单核苷酸多态性(SNP)位点,从NCBI的dbEST数据库中下载来源于9个不同葡萄基因型的不同组织EST序列42493条,利用CAP3软件拼接得到6126个重叠群(contig),将拼接结果导入QualitySNP进行SNP筛选;同时,为提高候选SNP位点的可靠度,降低小规格contig开发SNP的假阳性率和大规格contig开发SNP的假阴性率,设置候选SNP位点的次要等位基因频率至少为30%,SNP侧翼序列保守度至少为5 bp。结果表明:仅在1195个contig中存在候选SNP位点,共5032个,其中包括1800个颠换类型,2896个转换类型,336个单碱基的插入与缺失(indel),SNP的平均出现频率为4.2 SNP·contig-1。利用CAPS(酶切扩增多态序列)分子标记和重测序方法对其中几个候选SNP位点进行验证表明,符合人工筛选原则且来自于小规格contig的候选SNP位点检测结果较好,可靠度最高。