News
新闻动态
骆驼传统抗体重链和轻链的分析
近年来因为驼源动物体内的重链抗体,驼源的重链抗体及其产生机制被广泛的研究。除此之外驼源动物体内也有由两条重链和两条轻链组成的传统抗体;在骆驼体内这些传统抗体占的循环抗体的25%。
此文献研究了骆驼抗体的可变区和恒定区,包括57条重链序列、18条轻链kappa和35条轻链lambda。介绍了全长kappa和lambda链、重链可变区、重链IgG1a和IgG1b的CH1结构域以及IgG1a的CH2和CH3。大部分的IgG1可变区与人IgHV3家族(clan III)同源性较高,信号肽以MELG开始;其余的序列与人IgHV4(clan II)同源行较高,信号肽以MRLL开始。二者之间的CDR长度也有所不同,例如CDR1的长度为5个或者7个氨基酸,CDR3的长度为17或者16个氨基酸;IgHV4的CDR3长度与重链抗体的CDR3长度接近,长于IgHV3的CDR3长度(3-18个氨基酸)。
## 结果
### IgG1亚型的鉴定
使用CH2的反向引物对单峰驼和双峰驼来源的cDNA进行5‘RACE以扩增抗体的VH基因。通过测序两个物种获得了超过50种不同的IgG1序列(单峰驼30个,双峰驼27个)。获得的序列高度相似,通过铰链区将抗体划分成23个IgG1a和34个IgG1b。这些IgG1抗体具有典型的抗体序列组成包括可变区、CH1和铰链区。除了D75,其余抗体序列都缺失了与重链抗体框架区2相关的特征性突变(Val37Phe/Tyr, Gly44Glu, Leu45Arg, Trp47Gly/Leu)(kabat)。
### 抗体可变区序列
从获得的IgG1序列中一共观察到两条信号肽,这两条信号肽在骆驼VH和VHH中都是通用的MELGLSWVVLAALLQGVQA (MELG) 和MRLLGLLLCLVAGPQGVLS (MRLL),而且这两条信号肽在单峰驼和双峰驼的IgG1a和IgG1b都被观察到。通过基因组学分析发现,MELG信号肽后面的可变区基本都属于人IgHV3家族(clan III)而MRLL信号肽后面的可变区基本都属于人IgHV4(clan II)。因为信号肽部分的序列一般很少会发生超突变,因此通过分析抗体信号肽的使用频率可以获得V-gene使用的频率。单峰骆驼的基因组分析发现重链可变区基因总共129个其中VH为88个,VHH有41个,这篇文献显示至少有20%的基因在单峰驼中被使用。Jirimutu et al. 报道双峰驼有17个重链可变区基因,因此在这个种属中基因使用的频率更高一些。
根据信号肽的不同将不同种属的可变区中的框架区进行了比对,(其中单峰驼 (D)双峰驼(B)),不考虑种属以及恒定区亚型,当只通过信号肽来区分抗体时,不同分组的框架区序列相似度最高:MELG信号肽,IgHV3家族的相似度能达到93%;MRLL信号肽,IgHV4家族的相似度能达到92%,这说明不同种属间V-基因相对保守,相反IgHV3和IgHV4之间的相似度仅有60~62%。
Vu et al.报道过大羊驼跟人重链可变区基因相似度较高,本文中也做了跟人以及骆驼的框架区序列比对,发现骆驼的VH3框架区与大羊驼的框架区相似度为100%,骆驼与人的VH3框架区相似度为94%,与人框架区上只有4个保守位点的差异49,74,83 和 84(kabat);骆驼HV4框架区的相似的仅有86%。不同哺乳动物抗体框架区的系统发生树分析,显示单峰驼和双峰驼VH3序列与人 clan III亲缘性较高,VH4与 clan II亲缘性较高这其中包括人VH2和小鼠VH2&3。
所有种属的VH4基本都与大羊驼的VH4有较高的相似度,然而大羊驼的VH4在79位更倾向T。有学者解释称,在骆驼和大羊驼中VH4、D基因和J基因可能会同时跟传统抗体和重链抗体恒定区进行组合产生有功能的抗体。在这篇文献中VH4的传统抗体占比达到了40%以上。
抗体基因在经过重排后会通过超突变提高亲和力,这个过程也会增加抗体的多样性,突变的位点大部分位于抗体的CDR也有位于FR部分。下图总结了框架区的变异性,FR1和FR3相比FR2更容易发生突变;VH3相比VH4也更容易在框架区发生突变,这也反映出不同V基因的使用方式以及偏好会有所差异。IgG1b和IgG1a相比框架区有更多的突变,这可能暗示抗体isotype switch在免疫反应中也扮演一定角色。
### 重链CDR长度
CDR的长度也有所差异,所有34个VH3的CDR1长度都为5个氨基酸,VH4的CDR长度大部分为7个氨基酸只有一个为6个氨基酸。所有23个VH4的CDR2长度为16个氨基酸,VH3的CDR2长度从16到22个不等。与预期相同,CDR3的多样性最高,VH3的CDR3长度较短大部分为12-13个氨基酸(3到18个不等),VH4的CDR3长度从11到20个氨基酸不等,大部分VH4的CDR3长度为14和17个氨基酸。这些数据跟其他文献的报道基本一致,基于此将驼源的VH4归类到人类VH4上观察到的结构。
许多文献报道较长的CDR3是重链抗体的主要特征,因此这篇文献比较了重链抗体的CDR3和传统抗体的CDR3。VH4的CDR3基本与VHH的CDR3重合,只有少部分大于20个氨基酸的VHH CDR3,羊驼VH3的CDR3长度分布与小鼠类似。结构学分析发现重链抗体可以通过长CDR3结合到蛋白表面的缝隙。这是否提示VH4来源的抗体相比VH3来源的抗体能结合到不同的表位?
### 重链恒定区
IgG1a和IgG1b的CH1部分的组内的相似度较高分别为94%和96%。单峰驼基因组数据显示只有一个CH gamma 1a基因,双峰驼基因组有6个CH1基因。同种亚型间的对比确定了CH1区域的七个氨基酸差异。骆驼同种亚型的CH1之间的差异与人类似而小于小鼠。羊驼CH1与人跟小鼠的相似度分别为65%和63%。IgG1a的铰链区长度为19个氨基酸,IgG1b的铰链区长度为12个氨基酸,铰链区的C端都有保守的C(X)CPKCP基序,与人源的铰链区类似。人抗体铰链区的C与重轻链间的二硫键相关。
前面提到的D75这个抗体,虽然FR部分的突变与重链抗体类似,但是依旧有CH1序列和IgG1b铰链区。其他文献也有报道过相反的案例,传统抗体的VH序列缺失了CH1外显子。这些发现说明VH基因与IgG1恒定区的重组或者VHH基因与IgG2/3恒定区的重组并不是特异的。所以,尽管两种不同的可变区基因跟相同的D基因及J基因组合,但是其中的原因并不是很清楚。
两种骆驼的IgG1a亚型的Fc区域都被克隆出来,两个种属的Fc序列都比较保守,与骆驼VHH恒定区(IgG2/3)的相似度分别为95%和98%。
骆驼IgG1a的序列与人和小鼠的IgG1的相似度分别为74%和58%。
骆驼抗体重链恒定区之间高度保守,这也证实重链抗体的出现发生在从偶蹄目进化到胼足亚目之后,而且时从IgG1演变而来,同样人源抗体与驼源clan III可变区基因的保守程度也同样证明了这点。
与效应功能相关的氨基酸在人源抗体以及驼源抗体高度保守,C1q结合位点、糖基化位点、FcRn的结合位点、FcγRI结合位点、其他Fcγ受体结合位点基本都完全一致,因此这些恒定区可能在两个种属之间有相同的功能。当然其中也有一些细微的差异主要集中在与FcγRII和FcγRIII的结合位点。
### 轻链序列
之前的报道主要集中在抗体重链,鲜少有轻链的报道,因此这篇文章也研究了驼源抗体的轻链,通过RACE分别克隆出18条全长kappa和35条lambda的全长序列。kappa和lambda之间的相似度为58%。
获得的kappa和lambda序列信号肽相似度都比较高,kappa只获得4条而lambda只获得3条,根据单峰驼基因组数据库的信息总共有53种VK和33种LV,因此骆驼的轻链基因利用度比较低分别大约为8%和9%。与重链相反kappa和lambda可变区的FR2部分可变性较高。FR1和FR2的氨基酸突变基本都是单碱基突变,因此V基因利用度低的原因可能是高突变高的原因。kappa可变区的CDR保守程度高于lambda,CDR3由于V-J的重排显示较高的多样性。
系统发生树分析发现骆驼kappa的框架区与人IGKV2即小鼠IGKV1序列在同一簇为clan II,lambda可变区与人IGLV1/2在同一簇为clanI。人与骆驼之间,kappa的相似度为77%,lambda的相似度为85%,稍微低于重链可变区之间的差异。kappa的CDR1长度为17个氨基酸,lamda的CDR1长度大部分为14个氨基酸;
所有的18条kappa轻链恒定区都一样,因为骆驼只有一条Ck基因。相反35条lambda轻链有10条不一样的恒定区,这与之前文献报道的4条或者5条不一致,可能时因为同型变异导致。单峰驼的kappa以及lambda恒定域与人以及小鼠的差异分别为52%、57%、~80%以及~65%。
### 重链和轻链的引物
这篇文章提供了扩增抗体序列使用的引物,使用这些引物扩增重链可变区需要两轮,扩增轻链可变区需要三轮。
### 结论
这篇文章分析了骆驼传统抗体的序列,单峰驼和双峰驼的抗体可变区和恒定区序列高度保守。从序列分析的结果来看骆驼抗体V-D-J重排以及恒定区转化的模式与人类类似。重链可变区的序列可以通过信号肽分为VH4类型和VH3类型,这两类可变区的序列CDR3的长度所有区别,VH4的CDR3更长。
系统发生树分析发现驼源的抗体与人源的相似度较高,使用驼源的抗体制成药物需要改造的位点较少,重链可变区最少只需要修改4个氨基酸,lambda可变区需要突变12个氨基酸。
因为驼源抗体可变区以及恒定区基因数较少,因此可以通过少量的引物将抗体的可变区扩增出来。
## 参考文献
Analysis of heavy and light chain sequences of conventional camelid antibodies from Camelus dromedarius and Camelus bactrianus species
转载自大分子研究员