當談及免疫系統如何識別並對抗病原體時,T細胞和B細胞扮演着關鍵角色,它們通過識別特異性表位來激活免疫反應。T細胞和B細胞表位的預測對於理解免疫反應和設計疫苗至關重要。今天,拉斯维加斯9888將深入探討B細胞結合表位和T細胞結合表位的結構特點,以及三種先進的表位預測工具——EpitopeVec、MHCflurry和DeepSeqPanII,以及如何應用三種工具實現疫苗設計。
T細胞表位結構特點
T細胞靶點預測的核心在於識別抗原中能激活CD4或CD8 T細胞的最小肽段,這一激活特性即為免疫反應性。在抗原分子中存在大量的肽片段,而T細胞靶點預測技術的目標正是篩選出那些具備激發免疫反應能力的特定肽。
作為高等脊椎動物體內最具多態性的蛋白之一,主要組織相容性複合體(MHC)擁有極其豐富的變體,IMGT/HLA數據庫中記錄的一類與二類MHC分子等位基因就超過了6000種。鑒於當前實驗技術難以全面解析如此龐大的等位基因群體對肽的結合偏好,生物信息學預測手段成為了不可或缺的研究工具。時至今日,基於數據的分析方式已被證明是最有效的T細胞靶點預測途徑。
圖 | MHC分子結合溝(molecule binding groove)。該圖描繪了代表性MHC I和II分子的TCR所見的分子表面。MHC I分子的結合溝是閉合的,而MHC II的結合溝是打開的。結果,MHC I分子結合短肽(8-11個氨基酸),而MHC II分子結合更長的肽(9-22個氨基酸)
圖片來源:
http://qinqianshan.com/biology/antibody/t-cell-b-cell-epitope-prediction/
MHC I與MHC II分子展現出近似的三維構型,但在細節上亦存顯著區別。MHC I的結合槽內深藏有特定的結合口袋,僅能接納長度介於9至11個氨基酸之間的較短肽鏈。大部分MHC I肽配體含有9個氨基酸,因此預測時傾向於聚焦此長度的肽。MHC II分子的肽結合槽呈現開放狀態,肽段的長度可大幅變動(一般9-22個氨基酸)。
MHC-I類結合活性預測:
MHCflurry 2.0的泛等位基因模型
主要組織相容性複合體(MHC)I類分子負責在細胞表面展示內源性蛋白片段給CD8+ T細胞,是細胞介導免疫反應的重要組成部分。準確預測MHC-I類分子與其結合的多肽對於理解T細胞識別機制至關重要。MHCflurry 2.0通過整合新的MHC-I類結合模型和抗原處理模型,顯著提升了預測性能。該模型利用大規模質譜識別的MHC配體數據訓練抗原處理預測器,能夠區分出已觀察到的MHC配體和未觀察到的肽段。與先前的方法如NetMHCpan 4.0和MixMHCpred 2.0相比,MHCflurry 2.0在保留數據上的表現更為出色,其綜合模型優於單獨組件。這種集成方法不僅改進了預測準確性,也為新抗原發現和疫苗設計提供了便捷工具。
MHC-II類結合活性預測:
DeepSeqPanII的可解釋性遞歸神經網絡
相比之下,MHC-II類分子的肽段結合預測更為複雜,因為這類分子通常識別更長且來源多樣化的外源性抗原肽。DeepSeqPanII是一種針對MHC-II類肽段結合的新穎序列模型,它採用了一種帶注意力機制的遞歸神經網絡結構。與之前的方法不同,DeepSeqPanII無需對輸入樣本進行預處理或後處理,且通過注意力機制不僅能提供高精度的結合親和力預測,還能揭示肽段與MHC序列間結合機制的生物學洞見。該模型通過跨等位基因的留一等位基因交叉驗證和基準測試,展示了卓越的預測性能,同時,其訓練數據集包括大量質譜數據和親和力測量數據,確保了模型的廣泛適用性和泛化能力。DeepSeqPanII的出現為解析HLA-II類分子的肽段結合提供了有力工具,對設計針對特定HLA-II等位基因的疫苗和免疫療法具有重要意義。
B細胞表位的預測
B細胞表位的預測的目的在於替代完整抗原以刺激抗體生成。理論上,抗原上所有暴露於溶劑的部位均具備被抗體偵測的潛能。B細胞表位可分為兩大類:線性和構象表位。線性表位由一連串未間斷的氨基酸序列構成,形同肽鏈;而構象表位則由非連續、但均顯露於溶劑中的原子群落組合而成。而且能夠鎖定線性表位的抗體對變性抗原有良好的辨識力,相比之下,抗原一旦變性,則會顯著削弱抗體對構象表位的識別效能。
圖 | 線性和構象B細胞表位。線性B細胞表位(a)由連續/連續殘基組成,而構象B細胞表位(b)沿序列包含分散/不連續殘基。
圖片來源: http://qinqianshan.com/biology/antibody/t-cell-b-cell-epitope-prediction/
B細胞表位的預測:
EpitopeVec的深度學習方法
B細胞表位(BCEs)是位於抗原表面、能直接與B細胞受體結合的線性或構象性氨基酸序列,是激活B細胞免疫應答的關鍵。傳統的BCEs預測方法依賴於實驗數據和經驗模型,但這些方法往往泛化能力有限,預測準確率僅在51%-53%之間。為克服這一限制,研究人員開發了EpitopeVec,這是一種基於深度蛋白質序列嵌入的線性BCE預測方法。EpitopeVec整合了殘基屬性、修改後的抗原性尺度以及基於蛋白質語言模型的表示(即蛋白質向量),並在多個大小數據集上進行了廣泛驗證。結果顯示,EpitopeVec相較於其他前沿方法具有更高的預測性能,提高了BCE識別的準確性和可靠性,有助於快速鑑定疫苗候選物和診斷靶點。
應用案例
SARS-CoV-2疫苗設
第一步:B細胞表位預測
首先,通過B細胞表位預測工具,識別SARS-CoV-2病毒刺突蛋白(S蛋白)上的潛在線性表位。這些表位通常是病毒表面蛋白上的連續氨基酸序列,能夠被B細胞受體識別,引發體液免疫反應,產生中和抗體。
圖 | B細胞表位預測工作流
第二步:T細胞表位預測
接下來,使用T細胞表位預測工具,來識別S蛋白上的T細胞表位。T細胞表位的識別對於引發細胞介導的免疫反應至關重要,包括細胞毒性T細胞的激活和輔助T細胞的輔助功能。
圖片| MHC結合活性預測工作流
第三步:多肽-蛋白對接
在確定了潛在的B細胞和T細胞表位之後,使用多肽-蛋白對接工具AutoDock CrankPepK,來模擬這些表位肽與MHC分子的結合情況。對接模擬提供肽與MHC複合物的3D結構,評估結合的穩定性和親和力,這一步驟對於驗證表位的免疫原性和優化肽序列至關重要。
圖片| 多肽-蛋白對接工作流
第四步:分子動力學模擬及結合自由能計算
經過前面幾步極大縮小新抗原序列範圍後,使用了分子動力學模擬手段對新抗原與MHC的結合能力進行細篩。通過模擬肽-MHC複合物在生理條件下的動態行為,可以獲得關於復合物穩定性的信息,包括氫鍵形成、疏水作用和范德華力等。這有助於評估表位的免疫原性,即它們在真實條件下與免疫細胞受體結合的能力。
通過分子力學Poisson-Boltzmann表面面積(MM-PBSA)方法計算肽與MHC複合物的結合自由能。結合自由能計算可以量化肽與MHC分子結合的熱力學穩定性,幫助篩選出最有可能引發免疫反應的表位。
圖片| 多肽-蛋白複合物動力學模擬工作流
在這個全球關注健康的特殊時期,拉斯维加斯9888正站在疫苗設計與免疫學研究的前沿。你是否曾好奇過,拉斯维加斯9888的身體是如何精確地識別並擊退入侵的病原體?是什麼讓某些疫苗如此有效,而另一些卻收效甚微?
7月30日下午14點,拉斯维加斯9888科技直播間將圍繞此內容展開專題講座,為大家更深入、更直接的講解和演示。