导读:今天首席CTO笔记来给各位分享关于人工智能如何辅助药物研发的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
本文目录一览:
1、人工智能药物设计2、人工智能技术特点有哪些,为什么大湾生物要利用人工智能来赋能药物开发?3、AI要取代药物化学家了?助研发新药,46天干完八年的活4、人工智能在药物研发中的应用(上):AI与制药场景如何相互“适配”?人工智能药物设计
人工智能(AI)正越来越多地被应用于药物研发过程中。一些观点认为人工智能可以极大地促进药物研发,而另外一些则仍然持保守态度,在观望AI技术的影响。现实中大多数人的态度可能处于此两者之间,但是很明确的一点是AI技术给科学家以及生物制药行业都带来了极大地影响。本文就小分子药物研发中AI技术的应用,对众多国际专家的观点进行了归纳和总结。
除了技术问题外, 人工智能在药物研发中的成功应用的最大挑战还在于培养相关人员的适当思维方式以及相对应的文化氛围,以使他们愿意应用这些计算模型并使用其结果。 在药物设计领域中,利益相关者包括来自各个学科的研究人员以及商人,各方对机器学习的认知程度并不相同。要做到这一点,首先要认识到各个利益相关者的不同经历,然后发展通用的术语和规范。在大学层面上要促进这种趋势则需要教育和指导学生进行批判性思维,使其变得自我反省,包容其他的思维方式,学生就可以向同事(包括其他研究领域的人员)或者广为广阔的受众来解释AI可以在哪些领域进行扩大以及支持相关的发展(而不是进行替代)。
制药公司已经开始应用AI相关技术以及各种机器学习方法,但是并没有将全部的赌注都压在AI上面,这是可以理解的。考虑到药物研发的复杂性和受监管的特性,建议采取一种好奇而谨慎的态度进行尝试。在药物设计中开发AI应用程序时需要长期的时间,但AI可以提高所涉及的各个研究过程的效率,并减少研究文化之间的壁垒。
分子描述符和分子指纹
1.1 分子描述符和分子指纹概念
1.2 分子描述符类别和特点
1.3 分子指纹的类别和特点
2. 分子描述符/指纹计算软件
2.1 分子表示方法和格式
2.1.1 SMILES,SMARTS,SDF, MOL, MOL2, PDB
2.1.2 JEM Editor, Chemdoodle, ChemAxon, ChemDraw, DrugBank
2.2 RDKit简介及环境部署
2.3 RDKit中如何操作分子
2.4 RDKit中描述符的计算以及存储
2.5 OpenBabel简介及环境部署
2.6 OpenBabel操作分子和格式转换
2.7 OpenBabel中的分子描述符和指纹
2.8 ChemDes计算分子描述符和
2.9 ChemDes计算分子指纹
2.10 ChemDes中的格式转换
2.11 ChemDes中的分子优化
2.12 PyBioMed 简介环境部署
2.13 PyBioMed 获取分子
2.14 PyBioMed 计算分子描述符
2.15 PyBioMed 计算分子指纹
2.16 PyBioMed 计算蛋白质描述符
2.17PyBioMed 计算核酸描述符
2.18 PyBioMed 计算相互作用描述符
结构预处理和数据预处理
3.1 PyBioMed结构预处理
3.2 ChemSAR结构预处理
3.3 KNIME 结构预处理
3.4 Excel数据预处理及注意的问题
3.5 KNIME数据预处理
3.6 Pandas环境配置以及基本操作
3.6 sklearn数据预处理
3.7 归一化与空值处理
算法简单介绍和分类
4.1 药物设计中人工智能常用算法简介
4.2 常用算法实现软件或工具介绍
5. KNIME软件介绍
5.1 KNIME软件特色和界面
5.2 KNIME软件构建基本计算任务
5.3 KNIME软件社区支持
5.4 KNIME软件定制化插件
5.5 KNIME软件第三方支持
特征选择
6.1 基于sklearn的特征选择
6.1.1 相关性分析,相关性绘图
6.1.2 单变量特征选择及选择K个特征
6.1.3 递归式特征删除
6.2 基于KNIME流程的特征选择
6.2.1 相关性分析,相关性绘图
6.2.2 单变量特征选择
6.2.3 递归式特征删除
7. 模型的评价与解释
7.1 回归模型和分类模型的评价指标
7.2 应用域的评估
7.3 基于树的模型的解释
ADMET介绍
8.1 ADMET概念以及意义
8.2 基于人工智能的ADMET虚拟评价方法的进展
8.3 ADMET计算资源(ADMETlab、ADMETsar等)
9. KNIME软件构建ADMET模型
9.1 KNIME软件配置相关插件
9.2 caco-2细胞渗透性数据概览
9.3 结构预处理
9.4 描述符和指纹计算
9.5 SVM模型构建以及参数调整
9.6 RF模型构架及参数调整
9.7 RNN模型构建以及简单超参数调整
10. ADMET计算软件和实操
10.1 ADMETlab(v1.0 与v2.0)计算平台使用
10.2 admetSAR计算平台使用
10.3 本地模型调用以及预测
噪声过滤和相似性搜索
11.1 FAFDrugs4过滤
11.2 指纹和相似性度量计算
11.3 Swiss-Similarity相似性搜索
12. 机器学习模型构建和预测
12.1 收集GRK2化合物(讲解过程)
12.2 计算合适的分子表征
12.3 算法和特征选择
12.4 模型构建和评价
12.5 应用模型筛选化合物库
13. 分子对接
13.1 蛋白质预处理
13.2 小分子预处理
13.3 可应用Swiss-Dock对接
14. ADMET评估
14.1 ADMETlab计算并评估
14.2 确定相关性质的参考范围
14.3 评估并确定Hits.
人工智能技术特点有哪些,为什么大湾生物要利用人工智能来赋能药物开发?
人工智能发展从被动、单一、随机变成主动、全面、精准,其特点共有三类:
1.从被动的人工知识储存与表达到人机协同和融合,主动分析处理;
2.从单一的点、线、面学习,到整个体系、整体环境进行系统全面学习;
3.从聚焦个体智能到基于互联网和大数据的群体智能。
大湾生物将人工智能技术融入到新药研发,打破药物研发饱受“高投入、高风险、长周期”诟病的局面,在新药研发阶段,大湾生物可以大幅度缩短研发时间,平衡研发成本,显著降低新药上市风险。
AI要取代药物化学家了?助研发新药,46天干完八年的活
新药研发一直是耗时又耗钱的复杂工程,但现在,科学家们似乎找到了破解之道——引进人工智能技术。
据《麻省理工 科技 评论》杂志9月3日报道,在一次引入AI技术的新药研发中,人工智能制药初创公司Insilicon Medicine的一个团队与多伦多大学的科学家合作,从开始研发新的靶向药,到完成初步的生物学验证,仅仅花了46天时间。这项研究结果已发表在本周的《自然生物技术》杂志上。
这一里程碑式的研究证实,AI 技术可以帮助加速药物开发,这意味着,专利保护期限的延长,从而提高了药物开发的经济性。如果这种方法可以推广,它将被制药行业广泛采用。
AI协助将8年药物研发时间缩短到46天
基于两种流行的人工智能技术,生成对抗网络和强化学习,该团队在这次药物开发中引进了一个新的AI系统——生成张力强化学习(GENTRL)。
研究人员选择将DDR1激酶(一种在上皮细胞中表达的酪氨酸激酶)作为靶点,这是一种与组织纤维化疾病密切相关的蛋白质。确定目标后,GENTRL系统用21天时间设计出了3万个不同的分子结构,然后通过查阅此前研究和专利中对药物靶标起作用的已知分子,优先筛选出了可以在实验室合成的新分子结构。
以《深度学习能够快速识别有效的DDR1激酶抑制剂》为题的研发结果已发表在《自然生物技术》杂志上。截图自《自然生物技术》杂志
在GENTRL设计合成的6种候选DDR1 抑制剂化合物中,有4 种化合物在生化分析中具有活性。而在下一阶段的体外细胞实验中,4种具有活性的化合物,有2 种展现了预期的 DDR1 抑制能力,且能有效降低与纤维化进程有关的标志物含量。通过对比,最具潜力的1种化合物又进一步在小鼠体内实验中得到成功验证。
从最初的靶点确定、潜在新药分子结构筛选、合成到临床前的生物学验证,GENTRL系统将传统药物研发方法需要至少8年完成的工作,缩短到了仅需46天。
2013 年诺贝尔化学奖得主、斯坦福大学结构生物学教授 Michael Levitt 评价道,“这篇论文无疑是一个令人印象深刻的进步,很可能适用于药物设计中的许多其他问题。基于最先进的强化学习,我也对这项研究的广度印象深刻,因为它涉及到分子建模、亲和度测量和动物研究。”
AI取代药物化学家角色正成为主流
《麻省理工 科技 评论》杂志指出,这项里程碑式的研究或将改变新药研发面临的“费钱费时又费劲儿”的困境。
这项里程碑式的研究或将改变新药研发面临的困境。图据《麻省理工 科技 评论》杂志
“人工智能将对制药行业产生革命性的影响,我们需要更多的实验验证结果来加速这一进展,”人工智能领域众多核心技术和初始概念发明者、瑞士人工智能研究所教授Jürgen Schmidhuber表示。
众所周知,将一种新药推向市场需要花费高昂的金钱和时间成本,根据塔夫茨药物开发研究中心(Tufts Center for the Study of drug Development)的数据,一种新药从开始研发到最终上市可能需要10年时间,耗资高达26亿美元,且绝大多数候选药物在测试阶段就会以失败告终。
因此,减少研发周期和经济成本,对制药领域药物研发活动的成功至关重要。据《福布斯》杂志报道,使用Insilicon Medicine的方法,此次药物的研发成本仅仅为15万美元。
Insilicon Medicine希望,能在将AI深度学习带入药物研发过程中。图据《福布斯》杂志
美国能源部人类基因组计划首席科学家、波士顿大学教授Charles Cantor 表示,关于人工智能 AI 在改善医疗保健和开发新医疗工具方面的前景,存在着许多夸张的说法。然而,这项最近发表在《自然生物技术》杂志的成果的确具有重要意义。
它首先证明了,人工智能能够取代通常由药物化学家扮演的角色,而这个角色往往存在人手不足;其次,药物开发速度的加快意味着专利保护期限延长,从而提高了药物开发的经济性。“如果这种方法可以推广,它将成为制药工业中广泛采用的方法,” Cantor博士说道。
当然,对于全球的药物研发工作而言,这只是第一步。尽管这是一个里程碑,显示了人工智能具有识别候选药物的潜力,但在任何有潜力的药物被批准用于治疗之前,仍需要多年的临床试验和数百万美元的调研。
AI技术能够快速识别有效的DDR1激酶抑制剂。图据Insilicon Medicine
“这篇论文是我们在人工智能驱动药物研发路上的一个重要里程碑。我们从2015年开始从事AI合成化学的工作,但当Insilicon的理论论文在2016年发表时,所有人都对此持怀疑态度。而现在,这项技术正在成为主流,我们很高兴它正在动物实验中被验证。当这些模型被整合到全面的药物研发过程中时,它们适用于众多目标靶点。我们正与领先的生物技术公司合作,将进一步推动合成化学和合成生物学的极限,”论文第一作者、Insilico Medicine 创始人兼 CEO Alex Zhavoronkov 博士表示。
编辑 卢燕飞
人工智能在药物研发中的应用(上):AI与制药场景如何相互“适配”?
近年来,人工智能(AI)已经被广泛应用于多个行业,彻底改变了 社会 生活的许多领域。
在制药这一传统行业,AI也已经有了诸多应用。AI逐渐应用于药物发现的靶点发现,虚拟筛选,化合物设计与合成,ADME-T性质和理化性质预测,药物临床试验设计、管理、患者招募,药物警戒应用和真实世界证据生成等多个流程和环节。
那么,AI应用于制药的逻辑是什么?AI会如何改变药物研发?如何应对制药行业的效率挑战?本文分为上下篇,本篇重点介绍AI在制药行业多场景中展开及面临的挑战。
制药受困
从制药行业的困境说起。
在过去的数十年里,许多科学、技术和管理因素都取得了巨大进步,这有助于提高药物研发的生产率(RD)。然而,自1950年以来,每10亿美元研发投入获得批准的新药数量几乎每9年减少一半,该趋势在60年间非常稳定,被称为制药行业的反摩尔定律(Eroom’s Law)。新药的开发成本越来越高,药物研发面临着严重的生产力危机。
对于反摩尔定律主要有三种解释,即低垂果实假设(好摘的果子被摘走了)、监管障碍假设(新药申报的监管要求不断增高)、研发模式问题。前两种解释都是客观事实难以改变,那么,是否有更好的药物研发模式?这是制药行业一直在思考的问题。
制药行业在遭遇生产力困境的同时,也面临着数据困境。
随着全 社会 数字化信息化的快速推进、药物研发设备的升级和长期的积累,可用的药物研发数据越来越多,以至于在一定时间范围内无法使用常规方法和软件工具分析和处理所有数据。传统的统计学在浩瀚的大数据面前越来越力不从心。制药企业正在经历数字化转型,大量的数据产生。于是,日益增长的数据处理的需求,与现有数据分析能力之间的矛盾,推动制药行业寻求新出路。
AI的橄榄枝
2016年3月,AI程序AlphaGo大胜韩国著名棋手李世石,是AI发展 历史 上的里程碑事件。这一事件加快了AI在 社会 生活多个领域的 探索 和应用,也让制药行业看到了提高药物研发生产率的希望。2016年后,AI在制药行业的技术测试大量开展。实验科学不再是唯一选项,以数据为中心的药物发现逐渐走上舞台。
在随后的几年时间里,AI制药逐渐 "升温",概念验证研究持续不断、大量的资本涌入AI驱动的生物技术初创公司、制药公司与AI生物技术公司和AI技术供应商之间的合作越来越多。一些领先的制药公司的高管认为,AI不仅仅是一个先导化合物发现的工具,而且是一个促进生物学研究、发现新的生物靶点和开发新的疾病模型的更通用的工具。
AI在制药的多场景中展开
数年间,AI已经被尝试应用于药物研发的几乎所有流程和环节,主要有以下方面:
/ / 靶点确认
靶点确认是药物开发中的关键步骤,也是最复杂的步骤之一。目前已知的药物靶点绝大多数为蛋白质,通过机器学习的方法,从蛋白质原始信息中提取特征,构建准确稳定的模型进行功能的推断、预测和分类,已经成为靶点研究的重要手段。从患者的样本中、海量的生物医学资料中提取基因组学、蛋白质组学、代谢组学等多组学数据,借助深度学习来分析非疾病和疾病状态之间的差异,也可用来发现对疾病有影响的蛋白质。
/ / 基于表型的药物发现
在过去的三十多年里,基于靶点的药物发现都是药物发现的主要方法。近年来,基于表型的药物发现(直接使用生物系统进行新药筛选)受到关注。机器学习可以在表型筛选中将细胞表型与化合物作用方式联系起来,获得靶点、信号通路或遗传疾病关联的聚类。而AI强大的图像处理能力,能够将生物系统的所有形态特征整合,系统研究药物潜在的作用方式和信号通路,扩展对于疾病的生物学认识。
/ / 分子生成
机器学习方法可以产生新的小分子。AI可以通过对海量的化合物或者药物分子的学习,获得化合物分子结构和成药性方面的规律,进而根据这些规律生成很多自然界从未存在过的化合物作为候选药物分子,有效构建拥有一定规模且高质量的分子库。
/ / 化学反应设计
AI目前正在取得进展的化学领域之一是对化学反应和合成路线进行建模和预测。AI可以将分子结构映射为可以由机器学习算法处理的形式,根据已知化合物的结构,形成多条合成路线,并推荐最佳合成路线。反过来,在给定反应物的情况下,深度学习、迁移学习可以预测化学反应结果。AI还可用来 探索 新的化学反应。
/ / 化合物筛选
AI能够对化合物的化学结构与生物活性之间的关系进行建模,预测化合物的作用机制。一个典型的例子是MIT的研究人员基于深度学习发现了新的抗生素。研究人员训练了一个能够预测具有抗菌活性的分子的深层神经网络,在几天内筛选超过 1 亿个化合物,根据模型的预测分数对化合物进行排名,最终确定了8种与已知抗生素在结构上差别较大的抗生素。
/ / ADMET性质预测
药代动力学性质不够理想,是临床研究阶段药物研发失败的主要原因之一。深度学习可以自动识别化合物的相关特征,评估数据集中多个ADMET参数之间的隐藏的关系和趋势,预测化合物的细胞渗透性和溶解性等性质。
/ / 药物临床试验
新药开发中资金投入最多的阶段是临床试验阶段,AI在临床试验的设计、管理、患者招募方面皆有应用潜力。自然语言处理技术可从各种结构化和非结构化数据类型中提取信息,找到符合临床试验入组标准的受试者;也可用于关联各种大型数据集,找到变量之间的潜在关系,改进患者与试验的匹配情况。诺华已使用机器学习算法监控和管理所有的临床试验。
/ / 药物警戒
AI将对传统的药物警戒带来冲击。随着监管要求的严格和患者安全意识的提高,药物警戒的工作量和成本大大增加。AI可以将药物不良反应从接收到报告的整个流程实现自动化,优化药物警戒的工作并降低成本。基于AI系统还有可能通过预测能力展开药物风险评估。
/ / 真实世界研究
AI的进步提供了分析大型多维RWD(真实世界数据)的新策略。AI能够识别真实世界数据中的内在关联,生成新的假设,也能为临床试验提供新的信息。最新的一个案例是,AI通过分析真实世界数据,可以找出不会影响试验的总生存期的风险比的入组标准,从而扩大临床试验的人群范围。
AI在药物研发中的应用还包括 理化性质预测、药物重定向、制剂开发中的应用 等。
问题显现
AI在药物研发中的应用远非一帆风顺,归结起来,是AI如何与制药场景相互“适配”的问题。
对制药行业来说,走AI的路,就要穿AI的鞋。AI方法对于其适用对象的相关条件有诸多要求。如同传统药物研发需要配备必要的硬件设备和必要的环境设施(如科学仪器设备、实验室等),基于AI的药物研发需要配备数据、算法、算力,其中对数据的要求最为严格。
传统的药物研发以实验科学为主。数十年来,药物研发数据的记录、治理和储存都以实验为核心,根据实验的需求来调整,数据是实验的“附属”。而AI作为虚拟科学、计算科学和数据科学范畴内的方法,直接从数据入手,将数据放在第一位,对于数据的格式、标准、质量、数量都有内在的要求。在这样的情况下,AI直接使用传统药物研发模式的数据往往遇到困难。
对AI来说,进入制药的主场,就应当遵循制药的规律。比如,药物的开发是一个多维同步优化的过程,鉴于数据的规模和复杂性,基于AI的药物研发往往需要重写机器学习算法,而不是简单地调用。AI与制药这一传统行业的核心业务深度融合,需更深刻的行业理解力和更高的技术准确率。AI虽然已经可以从大量已知论文、实验数据中挖掘新的知识,改变了传统基于学术经验的研究方式,然而方法的准确性、可解释性、可重复性等还有待提高。
此外,传统的药物研发模式已有相对健全的监管政策、行业体系。作为一种新的模式,AI在制药行业的应用 探索 ,也需要相应的行业政策和体系来规范和引导。
文 智药邦 侯小龙
来源 中国食品药品网
结语:以上就是首席CTO笔记为大家介绍的关于人工智能如何辅助药物研发的全部内容了,希望对大家有所帮助,如果你还想了解更多这方面的信息,记得收藏关注本站。