星期日,2023年6月4日

人工智能系统预测基因修改的后果

斯顿研究院研究员,广泛的研究所麻省理工学院哈佛大学,丹纳-法伯癌症研究中心的研究转向人工智能(AI)来帮助他们了解大型网络相互连接的人类基因控制细胞的功能,以及如何在这些网络中断导致疾病。

大型语言模型,也称为基础模型,是人工智能系统,从大量的通用数据学习基础知识,然后应用这些知识来完成新的“学习过程称为转移。这些系统最近获得了主流关注ChatGPT的释放,从OpenAI聊天机器人建立在一个模型。

在新的工作中,发表在《自然,格拉德斯通助理研究员克里斯蒂娜Theodoris医学博士,博士,建立了一个基础模型为理解基因是如何交互的。新模型,被称为Geneformer,可以从大量的基因数据交互从一个广泛的人体组织和转移这些知识对如何进行预测疾病可能出错。

Theodoris和她的团队使用Geneformer阐明如何在心脏病心脏细胞出错。然而,这种方法可以解决许多其他细胞类型和疾病。

“Geneformer在生物学的许多领域拥有丰富的应用程序,包括发现可能的疾病,药物靶点”Theodoris说,他也是一个儿科助理教授在加州大学旧金山。“这种方法将极大地促进我们的设计能力network-correcting疗法在疾病进展的有限的数据。”

Theodoris设计Geneformer博士后奖学金期间X。雪莉刘博士,前中心主任功能癌症表观遗传学丹纳-法伯癌症研究中心的研究,和帕特里克Ellinor医学博士,博士,心血管疾病倡议主任广泛Institute-both这项新研究的作者。

网络视图

许多基因,当活跃,引发级联触发其他基因的分子活动拨他们的活动。其中的一些基因,进而影响其他基因或循环刹住第一个基因。所以,当一个科学家草图几十个相关基因之间的联系,由此产生的网络地图通常看起来像一个纠结的蜘蛛网。

如果映射只有少数基因的方法是凌乱,试图理解所有20000个基因在人类基因组之间的联系是一个艰巨的挑战。但这样一个大规模的网络地图将提供人员了解整个网络的基因变化与疾病,以及如何逆转这些变化。

“如果一个药物靶点的基因内外围网络,它可能有一个小的影响细胞功能或只管理疾病的症状,”Theodoris说。“但通过恢复正常水平的基因网络中发挥核心作用,可以治疗潜在疾病过程和产生更大的影响。”

人工智能“转移学习”

通常,绘制基因网络,研究人员依靠庞大的数据集,包括许多类似的细胞。他们用人工智能系统的一个子集,称为机器学习平台,数据内的模式。例如,机器学习算法可以在大量的训练样本,没有心脏病患者,然后学习健康的基因网络模式区分病变样本。

然而,生物学中标准的机器学习模型训练只完成一个任务。为了使模型完成不同的任务,他们必须从头开始重新训练新数据。如果第一个例子的研究人员现在要确定病变的肾、肺、或者大脑细胞健康的同行,他们需要重新开始和训练数据从这些组织的新算法。

问题是,对于一些疾病,没有足够的现有数据来训练这些机器学习模型。

在新的研究中,Theodoris Ellinor,和他们的同事解决这个问题通过利用机器学习技术称为“转移学习”培训Geneformer作为基础模型的核心知识可以被转移到新的任务。

首先,他们“pretrained Geneformer有基本的认识基因如何喂养它的数据交互活动水平在大约3000万个细胞的基因从一个广泛的人体组织。

证明学习方法是转移工作,科学家们然后调整Geneformer预测基因之间的联系,或减少某些基因的水平是否会引起疾病。Geneformer能够让这些预测精度远高于替代方法因为pretraining过程中获得的基本知识。

此外,Geneformer能够准确的预测即使只显示少量相关数据的例子。

“这意味着Geneformer可以应用在疾病进行预测,研究进展缓慢,因为我们无法获得足够大的数据集,如罕见疾病和那些困难的影响组织样本在诊所,“Theodoris说。

心脏病的经验教训

Theodoris的团队接下来着手使用学习转移到预先发现心脏病。他们首先要求Geneformer预测哪些基因会有不利影响心肌细胞的发展,心脏肌肉细胞。

前基因确定的模型,很多已经与心脏病有关。

“事实上,我们已经知道的模型预测基因很重要的心脏病给了我们额外的信心,能够做出准确的预测,“Theodoris说。

然而,其他潜在的重要基因被Geneformer之前没有与心脏疾病有关,如基因TEAD4。当研究人员把TEAD4从心肌细胞在实验室里,细胞不再能够打败强劲如健康细胞。

因此,Geneformer使用学习转移到新建一个结论:即使它没有美联储的任何信息在细胞缺乏TEAD4,它正确地预测TEAD4在心肌细胞功能的重要作用。

最后,集团要求Geneformer预测哪些基因应该针对使病变的心肌细胞类似于健康细胞在基因网络水平。当研究人员测试两个建议的目标细胞受到心肌病(一种心脏肌肉的疾病),他们确实发现移除预测基因使用CRISPR基因编辑技术恢复了跳动病变心肌细胞的能力。

“在学习正常基因网络是什么样子和病变的基因网络是什么样子,Geneformer能够找出特性可以有针对性的健康和患病的状态之间进行切换,“Theodoris说。“转移学习方法允许我们克服的挑战有限的病人数据有效地识别可能的蛋白质药物靶向病变细胞。”

“使用Geneformer的一个好处是能够预测哪些基因可以帮助细胞健康和疾病状态之间切换,“Ellinor说。“我们能够验证这些预测在心肌细胞在我们实验室Broad研究所。”

研究人员正计划扩大细胞的数量和类型Geneformer分析了为了保持提高其分析基因网络的能力。他们还做了模型开源,这样其他科学家可以使用它。

“用标准的方法,你必须为每一个新应用程序从头重新训练模型,“Theodoris说。“真正令人兴奋的事情对我们的态度是,Geneformer基本知识的基因网络现在可以被转移到回答许多生物学问题,我们期待别人做什么。”

关于这项研究

这篇论文“转移网络生物学的学习使预测”发表在《华尔街日报》吗自然2023年5月31日

其他作者凌小,马克·查尔,Zeina阿尔赛义德,马修·希尔海琳MantineoBroad研究所;Anant乔普拉伊丽莎白Brydon表示美国拜耳有限责任公司;和Zexian曾庆红的丹娜-法伯癌症研究所。

支持的工作是由美国国立卫生研究院(1 ro1hl092577 1 r01hl157635 5 r01hl139731, T32GM007748),美国心脏协会(18 sfrn34110082 20 cda35260081)、欧盟(MAESTRIA 965286),和海伦干草惠特尼基金会博士后奖学金。

约格莱斯顿学院

格莱斯顿学院是一个独立的、非营利的生命科学研究机构,使用有远见的科学和技术来克服疾病。成立于1979年,位于震中的生物医学和技术创新,在使命湾附近旧金山。格莱斯顿创造了一个研究模型,扰乱了科学是怎么做的,基金大思想,吸引最聪明的头脑。

Broad研究所的麻省理工学院哈佛大学

广泛的研究所麻省理工学院哈佛大学于2004年推出,旨在使这一代创造性的科学家将药。Broad研究所旨在描述生命的分子元件及其连接;发现重大人类疾病的分子基础;开发有效的诊断和治疗的新方法;和传播的发现、工具、方法和数据公开整个科学界。

麻省理工学院,哈佛大学,哈佛大学附属医院,有远见的人洛杉矶慈善家伊菜,埃德斯- l .广泛,Broad研究所包括教师、专业人员和学生麻省理工学院哈佛大学生物医学研究社区和超越,与协作横跨超过一百私人和公共机构在全球40多个国家。

关于丹娜-法伯癌症研究所

丹娜-法伯癌症研究所是世界上领先的癌症研究中心和治疗。丹娜-法伯的使命是通过科学探究减少癌症的负担,临床护理、教育、社区参与和宣传。丹娜-法伯是一个联邦政府指定的综合癌症中心和教学的附属哈佛医学院

我们为成人提供的最新治疗癌症法波布里格姆癌症中心和儿童波士顿丹娜-法伯/儿童癌症和血液疾病中心。法波是唯一医院全国前5名美国新闻与世界报道最好的肿瘤医院排名在成人和儿科护理。

作为全球领先的肿瘤,dana - farber致力于一个独特的和等于癌症研究和保健之间的平衡,将发现的结果转化为新的治疗患者在本地和世界各地,提供超过1100个临床试验。

必威betway西汉姆联app手机版 //www.prdhamaka.com
我们致力于为我们的读者带来最新出版医疗设备的消息。我们自豪地夸耀,用户包括医学专家、设备行业高管,投资者和其他盟军的健康专业人士,以及病人研究各种医疗设备很感兴趣。我们希望你能找到价值易读的出版物,其总体目标和目标!必威betway西汉姆联app手机版医疗器械新闻杂志是多功能天车医疗市场营销的一个部门,Inc .波林·t·梅尔是总编辑。

订阅

spot_img

通过使用这个网站您同意接受医疗设备新闻杂志必威betway西汉姆联app手机版betwayapp苹果版下载

Baidu
map