联系热线:400-123-4657

首页 > 产业化 > IM电竞app下载

AI加快基因切磋MIT团队用几分钟即可预测数千种3D基因机合

IM电竞app下载 2025-04-03

  麻省理工学院的化学家们使用天生式AI急速预测基因组的3D组织,比现有的实行剖析格式速得众。

  2.该推敲团队开拓的模子名为“ChromoGen”,蕴涵一个深度练习模子和一个天生式AI模子。

  3.通过陶冶模子,推敲职员可以对2000众个DNA序列举办组织预测,并与实行确定的组织举办了对照。

  4.其它,该模子还能对未用于陶冶的其他细胞类型的数据做出确实预测,注脚其可用于剖析细胞类型之间的染色质组织分别。

  5.异日,该模子希望行使于探寻特定DNA序列中的突变若何革新染色质构象,以及这些转化若何导致疾病的爆发。

  每个细胞都含有相像的基因序列,但只外达个中的一个别。这种细胞特异性的基因外达形式确保了分歧类型的细胞(如脑细胞和皮肤细胞)之间的分别,这些分别个别由遗传物质的三维组织决议,该组织管制着每个基因的可访谒性。

  近期,麻省理工学院的化学家们提出了一种新格式:使用天生式 AI 来确定这些三维基因组组织。他们的技能能够正在短短几分钟内预测数千种组织,比现有的实行剖析格式速得众。

  通过这种格式,推敲职员可以更轻松地推敲基因组的三维组织若何影响单个细胞的基因外达形式和性能。

  “咱们的目的是测验从根基的 DNA 序列预测三维基因组组织。”该推敲的资深作家、麻省理工学院化学系副教师 Bin Zhang 说,“现正在咱们仍然能够做到这一点,这种格式与最先辈的实行剖析技能分庭抗礼,并为异日深刻推敲启示更众能够性。”

  正在细胞核内,DNA 和卵白质造成了一种称为染色质的复合物,它蕴涵众个目标的机合,使细胞可以将 2 米长的 DNA 塞进直径惟有百分之一毫米的细胞核中。长链 DNA 环绕正在称为组卵白的卵白质上,造成了似乎珠子串正在绳上的组织。

  特命名望上能够附加被称为外观遗传藻饰的化学标签,这些标签因细胞类型分歧而转化,并影响染色质的折迭格式及其邻近基因的可访谒性。染色质构象的这些分别有助于决议哪些基因正在分歧的细胞类型或统一细胞内的分歧期间点被外达。

  正在过去的 20 年里,科学家们开拓出良众确定染色质组织的实行格式,个中一种被通俗应用的技能名为“Hi-C”,通过将细胞核中的相邻 DNA 链维系正在一同施展影响。然后,推敲职员能够通过将 DNA 切成很众小片断并对其举办测序来确定哪些片断相互亲近。

  这种格式可用于巨额细胞来预备染色质切片的均匀组织,也可用于单个细胞来确定特定细胞内的组织。然而,Hi-C 以及似乎技能对照耗时费劲,管制一个细胞的数据大约必要一周期间。

  为了抑制这些限制性,Bin Zhang 团队使用天生式 AI 开拓了一个模子,创筑了一种急速、确实的格式来预测单细胞中的染色质组织。他们安排的 AI 模子能够急速剖析 DNA 序列,并预测这些序列能够正在细胞中形成的染色质组织。

  “深度练习正在形式识别方面很是擅长。”Bin Zhang 说,“它可以剖析很是长的 DNA 片断,蕴涵数千个碱基对,并寻得这些 DNA 碱基对中编码的要紧新闻。”

  推敲职员创筑的模子名为“ChromoGen”,蕴涵两个个别:第一个别是一个深度练习模子,经由陶冶后可以“读取”基因组,剖析根基 DNA 序列和染色质数据;第二个别是一个天生式 AI 模子,基于跨越 1100 万个染色质构象的数据举办陶冶,可以预测物理上确实的染色质构象。

  正在将两个别举办整合后,第一个别“示知”天生模子细胞类型特异处境若何影响分歧染色质组织的造成,从而有用捉拿序列与组织之间的相干。对待每个序列,推敲职员应用模子天生很众能够的组织。这是由于 DNA 是一种很是无序的分子,因而简单的 DNA 序列能够形成很众分歧的能够构象。

  “预测基因组组织的一个苛重杂乱身分是不存正在简单的目的解。无论你窥探基因组的哪一个别,都存正在一系列组织散布,而预测这种很是杂乱的高维统计散布极其贫苦。” Schuette说道。

  一朝陶冶竣工,该模子能够正在极短期间内天生预测,比 Hi-C 或其他实行技能速得众。

  “你能够必要花费六个月的期间举办实行技能取得某一特定细胞类型的几十种组织,而应用咱们的模子,正在单颗 GPU 上只需 20 分钟就能天生特定区域的一千种组织。”Schuette 暗示。

  正在陶冶了他们的模子后,推敲职员用它对 2000 众个 DNA 序列举办完结构预测,然后将它们与实行确定的这些序列的组织举办了对照。他们展现,模子天生的组织与实行数据中看到的组织相像或很是彷佛。

  “咱们时时会查看每个序列的数百或数千种构象,这能够合理地暗示特定区域能够具有的组织众样性。”Bin Zhang 暗示,“即使你正在分歧的细胞中众次反复实行,你很能够会取得一个很是分歧的构象,而这也是咱们模子预测到的。”

  其它,推敲职员还展现,该模子可以对未用于陶冶的其他细胞类型的数据做出确实预测,这注脚该模子可用于剖析细胞类型之间的染色质组织分别,以及这些分别若何影响其性能。该模子还可用于探寻单个细胞内能够存正在的分歧染色质形态,以及这些转化若何影响基因外达。

  另一个潜正在的行使是探寻特定 DNA 序列中的突变若何革新染色质构象,这有助于揭示此类突变若何导致疾病的爆发。“我以为能够用这种模子来管理良众其他未知题目。”Bin Zhang 暗示。

  这项推敲由美邦邦立卫生推敲院资助。目前,推敲职员仍然将所罕睹据和模子公然,供其他推敲者获取。

                             
                            Copyright © 2012-2024 im电竞·(中国)电子竞技平台 版权所有
                            HTML地图XML地图TXT地图