2024-04-30 19:56

新的tARC-seq方法提高了追踪SARS-CoV-2突变的精度

在最近发表在《自然微生物学》杂志上的一项研究中,研究人员开发了一种靶向准确核糖核酸(RNA)共识测序(tARC-seq)方法,以精确确定细胞培养和临床样本中的严重急性呼吸综合征冠状病毒2 (SARS-CoV-2)突变频率和类型。

背景

SARS-CoV-2通过RNA依赖性RNA聚合酶(RdRp)进行复制,这很容易出错。监测复制错误对于了解病毒的发展至关重要,但是现有的方法不足以识别罕见的从头核糖核酸改变。

在2019冠状病毒病(COVID-19)大流行期间,每个细胞每个碱基的SARS-CoV-2突变率为10−6至10−4。外切酶校对活性提高突变率,导致每个基因组平均每月发生两次突变。

一个关于这项研究

在本研究中,研究人员创建了tARC-seq来研究复制错误影响SARS-CoV-2分化的机制。

tARC-seq方法将ARC-seq特征与混合捕获技术相结合,以增强目标,允许对这些样品进行深入的变异询问。

研究人员使用tARC-seq技术发现了原始SARS-CoV-2野生型(WT)菌株、SARS-CoV-2 α和Omicron变体以及临床和Omicron样本中的RNA变异。

研究人员在4.0个感染周期后对SARS-CoV-2野生型RNA进行了测序,产生了9.0 × 105个SARS-CoV-2 RNA斑块形成单位(pfu)。他们加入大肠杆菌信使RNA (mRNA)作为酶载体制备文库。混合捕获在基因文库中检测到大肠杆菌RNA,研究人员对其进行了单独检查,并将其用作内部控制。

为了进一步研究tARC测序数据中的选择,研究人员绘制了tARC测序在非结构蛋白12 (nsp12)上鉴定的非义型、同义和非同义变异频率,nsp12是编码SARS-CoV-2 RdRp的关键基因。

他们确定了在SARS-CoV-2 spike (S)和nsp12中发现的无义型和非同义单核苷酸多态性(snp)的进化作用(EA)评分和变异频率。他们还计算了野生型病毒中开放阅读框(orf)的平均突变频率,按突变类型和碱基改变进行了分解。

研究人员利用基于位置的估计和核苷酸同一性分析,研究了RNA变异在SARS-CoV-2基因组中的随机分布。他们还对两个临床样本使用了tARC-seq来寻找自发性感染引起的新生突变。

他们将10个最常见的C>TT和G>AA突变与野生型病毒中已知的A3A编辑位点相匹配。研究人员检查了WT、Alpha和Omicron下游供体和受体位点之间互补性≥2个核苷酸的所有SID事件。他们研究了WT-Vero细胞中TC>TT突变的全基因组患病率。

结果

研究人员发现,在SARS-CoV-2病毒中,每个周期有2.7 × 10−5(平均)次新生错误,C>T偏差主要不是由于载脂蛋白B mrna编辑酶、催化多肽(APOBEC)编辑。

他们根据GC浓度的高低确定了基因组中的冷热区域,并强调了转录调控区域是更容易出错的位点。tARC-seq方法可以检测模板切换,如删除、插入和复杂的更改。

WT病毒每个碱基有1.1 × 10−4个RNA变异,其中碱基置换占多数(8.4 × 10−5),其次是插入(2.5 × 10−6)和缺失(2.1 × 10−5)。G > A和C > T转变主导了病毒突变格局,分别占所有突变的9.0%和44%。

野生型SARS-CoV-2脱靶reads的突变谱和频率与大肠杆菌不同,表明这些突变事件是真正的病毒改变,而不是文库制备的伪产物。

所有三种nsp12突变类型的随机分布和可比性表明,tARC测序发现的大多数RNA变异是新生型复制错误。研究人员发现,在碱基取代范围内,具有低进化作用分数(估计中性影响)和具有高EA值(估计有害影响)的snp之间的变异频率没有差异,这表明选择的影响有限。

不同位置的变异率差异很大,WT病毒重复的643个位点显示出相当高的碱基替换频率,80个位点在两个WT重复中重复出现。

研究人员发现,野生型病毒中频率最高的tARC测序C>TT热点和A3A编辑区域之间没有重叠。A3A编辑区的tARC序列C>TT频率比最高频率tARC序列C>TT热点的C>TT频率低1 ~ 2个数量级。

该研究强调了tARC-seq,这是一种专门的测序方法,用于研究影响SARS-CoV-2分化的复制错误。这种方法选择性地读取特定的RNA分子以产生一致的序列,使研究人员能够检测和评估病毒复制过程中的微小差异和错误。

它还可以检测到由细胞培养感染引起的SARS-CoV-2的新生插入和缺失,从而证实了全球大流行测序结果。

该研究还发现,SARS-CoV-2具有外切酶校对能力,这可能有助于理解外显子的关键功能。