卡内基梅隆大学计算机科学学院的研究人员在了解人类基因组在单个细胞内如何组织方面取得了重大进展。这些知识对于分析 DNA 结构如何影响基因表达和疾病过程至关重要。
在《自然方法》杂志上发表的一篇论文中,计算生物学教授 Ray 和 Stephanie Lane 教授马健和前博士生。学生 Kyle Xiong 和 Ruochi Zhu 介绍了 scGHOST,这是一种机器学习方法,可以检测子区室(细胞核中的一种特定类型的 3D 基因组特征)并将它们与基因表达模式联系起来。
在人类细胞中,染色体不是线性排列的,而是折叠成 3D 结构。研究人员对 3D 基因组亚区室特别感兴趣,因为它们揭示了染色体在细胞核内的空间位置。
“单细胞生物学的最终目标之一是阐明各种生物环境中细胞结构和功能之间的联系,”马说。 “在这种情况下,我们正在探索细胞核内的染色体组织如何与基因表达相关。”
虽然新技术允许在单细胞水平上研究这些结构,但糟糕的数据质量可能会阻碍精确的理解。 scGHOST 通过使用基于图的机器学习来增强数据来解决这个问题,从而更容易查明和识别染色体的空间组织方式。 scGHOST 建立在Ma 的研究小组先前开发的Higashi 方法的基础上。
scGHOST 能够准确识别 3D 基因组子区室,为科学家用来描绘复杂组织(例如大脑中的组织)的复杂分子景观的单细胞分析工具不断增加。 Ma 预计 scGHOST 可以为理解健康和疾病中的基因调控开辟新途径。