碳水化合物是自然界中最丰富的有机物质,是生命所必需的物质。碳水化合物与多种蛋白质家族相互作用,调节各种生物过程,包括免疫反应、细胞分化和神经发育。
了解碳水化合物如何在生理和病理过程中调节蛋白质,为解决关键的生物学问题和开发新疗法提供了机会。然而,碳水化合物的多样性和复杂性对通过实验确定碳水化合物与蛋白质结合并作用的位点提出了挑战。
因此,开发可靠的碳水化合物结合位点预测器对于揭示碳水化合物-蛋白质相互作用至关重要。
在《自然通讯》发表的一项研究中,中国科学院上海药物研究所程曦和温柳青领导的研究团队,以及临港实验室的王定彦及其合作者介绍了一种新的碳水化合物结合位点预测器DeepGlycanSite。该预测器的性能优于以前的最先进方法,可以有效预测各种碳水化合物的结合位点。
DeepGlycanSite将蛋白质的几何和进化特征融入具有变压器架构的深度等变图神经网络中,能够准确预测给定蛋白质结构上的碳水化合物结合位点。
研究人员在涉及 100 多种独特碳水化合物结合蛋白的独立测试集上将 DeepGlycanSite 与最先进的结合位点预测器进行了比较。DeepGlycanSite 的平均马修斯相关系数 (MCC) 和精度超过 0.62,而所有替代方法的平均 MCC 都很小,精度低于 0.35。
对于单糖或二糖结合位点预测,DeepGlycanSite 的平均 MCC 和精度是替代方法的两倍多。对于寡糖或核苷酸结合位点预测,DeepGlycanSite 的平均 MCC 和精度仍然超过 0.60。总的来说,DeepGlycanSite 在各种碳水化合物结合位点预测中表现出色,凸显了其普遍适用性。
此外,DeepGlycanSite 可以预测查询碳水化合物的特定结合位点。
研究人员建立了一个网络模型 DeepGlycanSite +Ligand来处理查询碳水化合物的蛋白质结构和二维化学结构,并增加了处理配体部分的模块。DeepGlycanSite +Ligand可以区分属于不同类别的查询碳水化合物的特定结合位点,而以前的先进方法在区分单糖、双糖或寡糖结合位点方面表现出无效性。
为了举例说明其应用,研究人员使用 DeepGlycanSite +Ligand来识别功能重要的 G蛋白偶联受体 P2Y 嘌呤受体 14 (P2Y14)上的特定碳水化合物结合位点。P2Y14 调节免疫反应并与哮喘、肾损伤和肺部炎症有关。
在钙动员试验中,发现鸟苷 5'-二磷酸岩藻糖 (GDP-Fuc) 可激活人类 P2Y14。作为哺乳动物的必需糖核苷酸,GDP-Fuc 在各种癌症的肿瘤生长和转移中发挥着重要作用。GDP-Fuc 诱导的 P2Y14 激活此前尚未见报道。因此,GDP-Fuc 如何作用于该受体尚不清楚。
研究人员利用DeepGlycanSite技术鉴定出G80、D81和N90构成了P2Y14的鸟苷-5'-二磷酸糖识别位点,并在诱变研究中验证了这一发现。
DeepGlycanSite 不仅有助于阐明碳水化合物和碳水化合物结合蛋白的生物学功能,而且还为碳水化合物药物的开发提供有力的工具。