注册

智研简报2022第5期

中国·济南
山东产业技术研究院智能计算研究院

2022

05 / 24

智研简报

智/能/计/算      计/算/未/

陈益强院长应邀作题为“数据驱动的认知
行为计算”的学术报告
智研院农业团队到淄博省级农高区调研

5 / 30

Nature子刊 | NUS、字节首次将AI元学习引入
脑成像领域
开启未来之窗:AI与药物研发的共舞

CONTENTS

目录

面向“政产学研金服用”,打造研究机构与企业间体系化、标杆化及标准化合作模式

01

智研快讯

技术前沿

《山东省科学技术奖定向奖励实施办法(试行)》

Nature子刊 | NUS、字节
首次将AI元学习引入脑成像领域

陈益强院长应邀作题为“数据驱动的认知行为计算”的学术报告

04

05

02

《济南市工程研究中心管理办法》
政策解读

陈益强院长应邀作题为
“数据驱动的认知行为计算”的学术报告

       5月12日下午,中国科学院计算技术研究所研究员、山东产业技术研究院智能计算研究院院长陈益强受邀为洛阳理工学院计算机与信息工程学院师生作题为《数据驱动的认知行为计算》的学术报告。报告会由计算机与信息工程学院院长石念峰主持,学院全体教师参加了本次报告会。

智研快讯

NEWSLETTERS

       报告从多个神经疾病辅诊的实际应用案例出发,介绍智能时代下一代认知行为计算的新型研究范式——OODA(“O”:感知、“O”:判断、“D”:决策、“A”:干预),进而针对数据驱动研究中面临的数据孤岛问题,提出一种基于联邦学习的医疗科研平台,在多方数据可用不可见的情况下,解决分布个性化和标签质控难等问题,从而实现多方数据的高效协同建模。
       报告会持续了近一个半小时。在报告会结束后,陈益强院长与学院领导和部分年轻教师代表就学院科研方向凝练、科研组织管理、学术研究方法等问题进行了交流与互动,带领大家了解到数据建模、分析和应用最新的研究范式,在多个医疗数据应用案例中感受计算机相关应用领域的前景和研究思路,对计算机相关行业的未来发展方向有了更加深刻的思考。

政策导读

06

开启未来之窗:AI与药物研发的共舞

智研院农业团队专家到淄博省级农高区调研

07

03

项目进展

面向异构边缘计算环境的联邦协作平台

行业资讯

高新技术产业示范区规划(2022-2035年)》,接下来,将不遗余力的开展创新发展,聚引技术与人才,积极策划产业布局和重点项目,尤其在农业智能装备方向和生态循环农业,开展数字化、智慧化农业研究与实践。
     

      山东省产业技术研究院为推进与淄博省级农高区技术合作,组织山东产业技术研究院智能计算研究院(简称智研院)农业团队专家,于5月25日前往淄博省级农高区调研交流。农高区党工委书记、管委会主任徐其录、党工委副书记宋爱国热情接待。
      智研院农业数据智能研究中心陈海华博士一行,在农高区管委会领导的带领下,先后参观考察了鲁供齐丰农业公司、禾丰种业无人农场、巧媳妇自动化生产线、思远农业、天天优鲜等品牌企业与设施蔬菜智能化示范场景。重点围绕开展智慧农机试验示范和建立“数智化”农业生产推广基地进行考察、座谈交流。
      徐其录主任介绍,淄博区有悠久的农耕文明和文化传承,高度重视农业发展,充分发挥地理优势和资源优势,委托农业农村部设计研究院编制了《淄博省级农业

智研快讯

NEWSLETTERS

智研院农业团队专家到淄博省级农高区调研

       陈海华博士表示,淄博省级农高区现代农业特色产业成效明显,农业基础良好,具有很好的科技创新环境和氛围。依据农业数据智能研究中心研发成果,未来将会有非常多的合作空间:在推行规模化管理经营、加快传统农机自动化智能化改造,开展智能化大型青储饲料机械研发、农业装备社会化服务和无人农场第三代智能农机示范等方面进行紧密的合作与交流。同时,将不断发挥自身科研优势,在创新农业管理等重点项目方面为地方赋能,为进一步推动淄博省级农高区跨越式发展贡献力量!

      项目主要的创新点:
      1.异构加速边缘终端。协同使用GPU、CPU、加速卡等计算设备,适配ARM、X86等多种CPU架构,实现边缘计算环境下联邦学习模型训练与边缘推理任务。
      2.FATE+架构。基于FATE开源架构底层进行升级,扩展自定义联邦学习算法,解决多联邦方网络连接、动态加入退出等问题。
      3.构建DMA服务中台。为联邦边缘计算提供计算、存储及网络的统一调度支持,为上层应用提供联邦MaaS能力支撑,提供联邦学习数据、任务、算法、模型的统一管理,并简化联邦平台使用流程。
      4.模型路由机制。训练完成的联邦模型可以在平台中进行迁移学习或增量学习,不断提高模型泛化能力。
      项目应用案例:
      以医疗行业入手,建成的联邦边缘计算平台以其平台化、能力化等特性可以最小成本迁移至诸多行业,可进一步扩展至智能制造、智能物流、智慧农业、智慧城市等不同类型、不同需求的产业,加速联邦学习和边缘计算系统的落地应用,加速人工智能进入传统领域的各个方面,提升各行业的服务水平,带来产业转型与升级,加速地方产业结构调整,具备极为广阔的市场前景。

      联邦学习作为机器学习新兴研究方向,融合了机器学习、分布式系统、密码学等多学科知识,能实现多地多联邦方的模型协同训练及优化。可以有效缓解数据安全问题,合理、高效地利用分散在各个企业内部的数据及硬件资源。
      面向异构边缘计算环境的联邦协作平台由中国科学院计算技术研究所陈益强研究员带领团队研发。基于联邦学习FATE开源框架,构建了对象化DMA服务中台,包括数据池(Data Pool)、任务池(Mission Pool)、算法池(Algorithms Pool),提供了用户进行便捷二次开发所需的接口定义与框架流程,可以实现模型训练及推理任务的智能化管理。另外,平台基于MaaS(Model as a Service)服务模式,支持模型在整个平台中智能路由。目前针对医疗科研领域,构建了联邦医疗科研平台“联智鹊华”,已在帕金森病辅助诊断、围术期并发症预测、数字眼科的协作科研和临床应用等多个场景进行了落地应用。 后期将在智慧电力、智慧城市、智慧农业、智慧通信等领域形成广泛支撑合作。
      团队在联邦学习、隐私计算等研究方面发表相关论文30余篇,申请相关专利8项,提出面向医疗领域的FedHealth联邦迁移学习框架,获得FL-IJCAI2019最佳应用论文奖,收录于联邦学习英文专著《Federated Learning》,并获得首个国家自然科学基金支持的联邦学习研究项目。团队牵头IEEE标准P2961“协同边缘计算基础架构与应用”的制定工作;参与IEEE P3652.1“联邦机器学习”(已发布)等三项标准制定工作。

项目进展

PROJECT PROGRESS

面向异构边缘计算环境的
联邦协作平台

政策导读
《山东省科学技术奖定向奖励实施办法(试行)》

      为充分发挥山东省科学技术奖励的激励导向作用,奖励真正作出创造性贡献的科学家和一线科技人员,加快树立以创新质量、绩效、贡献为核心的科技评价导向,推动产出更多高质量成果、营造良好创新生态,省科技厅研究制定了《山东省科学技术奖定向奖励实施办法(试行)》(以下简称《实施办法》)。

       一、出台背景
       近年来,我省持续深化科技奖励制度改革,2018年出台《山东省深化科技奖励制度改革实施方案》,2020年出台《山东省科学技术进步奖产业突出贡献类项目管理办法》,在全国率先开展科技奖励“悬赏制”改革,对市场份额高、引领行业发展成果按程序直接授予省科技进步一等奖。我省科技奖励改革得到社会各界特别是科技界充分肯定,2021年11月,科技部等十部门联合印发《关于组织开展科技成果评价改革试点工作的通知》,明确山东省作为全国唯一省份开展科技奖励改革试点。
       为扎实推进科技奖励改革,省科技厅在科技奖励“悬赏制”改革基础上,广泛深入座谈调研、大胆探索,研究提出了《实施办法》,征求了一线科研人员代表以及省直相关部门、地方科技主管部门、部分高校和科研院所意见建议,经多次讨论,对《实施办法》进行了修改完善。
       二、主要内容
       《实施办法》共二十条,主要内容如下:
       一是明确定向奖励功能定位。明确了定向奖励导向、适用范围、奖励重点以及授奖数量,提出定向奖励是对山东省科技奖励提名和评审方式的丰富和完善,是对完成重大科技任务、解决我省经济社会发展重大需求的科技人员和团队实行定向奖励的评审机制。
       二是提出定向奖励授奖条件。定向奖励人选和项目以使命激励、贡献激励为导向,聚焦国家和省重大科技计划、重大创新平台以及企业自主创新的人才和成果,分别提出最高奖和自然、发明、进步奖的定向奖励条件。
       三是完善定向奖励评审程序。定向奖励评审贯彻中央关于科技成果评价改革精神,按照基础研究、应用研究、技术开发与产业化等不同类型创新活动的人才和成果特点,实行分类评审机制。按照《山东省科学技术奖励办法》有关规定,定向奖励人选和项目由省科技厅提出,省奖励办公室组织考察、论证后,提交省奖励委员会审议,奖励建议并入当年度科学技术奖励决议,按程序报省政府常务会议研究。

       二是关于申报认定。工程研究中心认定原则上每年开展一次。由市发展改革委委托第三方机构,组织专家对申请材料进行综合评审,择优确定年度认定工程研究中心名单,正式公开发布。申报应具备的基本条件主要包括:申请单位在本领域技术创新中具有领先地位和竞争优势;依托单位或牵头单位应当是本市内注册的独立法人单位,参与单位与其在产学研用等方面具有密切协同性;申请单位应具有较强的综合实力;较高水平的创新团队和研发条件;申报单位信用状况良好等条件。明确规定:鼓励有条件的市工程研究中心采用独立法人形式组建运行,对于采取非法人形式组建的市工程研究中心,需要与依托单位在人、财、物的管理上保持清晰边界,评价指标数据能够独立核算、有据可查。
       三是关于运行评价和监督管理。市工程研究中心实行优胜劣汰、动态调整的运行评价制度。市发展改革委原则上每两年组织一次评价,主管部门每年组织一次自查。评价结果评价得分85分及以上为优秀;60分至85分(不含85分)为合格;低于60分为不合格。对运行评价不合格的、提供虚假材料和数据、发生重大质量事故或重大安全事故、存在司法或行政机关认定的严重违法失信行为的撤销市工程研究中心称号。

政策导读

POLICY INTERPRETATION

《济南市工程研究中心管理办法》
政策解读

       一、修改背景
       2020年12月份,山东省人民政府办公厅印发了《关于深化科技改革攻坚的若干措施的通知》(鲁政办发〔2020〕26号),《通知》按照党中央、国务院和国家部委关于国家科技创新基地平台建设发展改革有关部署要求,根据战略需求和不同类型科研功能定位,对现有省级基地平台进行分类梳理,分基础研究、技术创新与成果转化、创新创业与科技资源支撑服务三类对进行优化整合,明确说明:不再新建省工程实验室和省工程技术研究中心,并于2021年7月份修改并印发了《山东省工程研究中心管理办法》,删除了工程实验室相关内容,在组建方式、建设任务和认定条件上都做了明确的规定。为进一步加强和规范济南市工程研究中心管理,促进工程研究中心健康发展,充分发挥对全市新旧动能转换和高质量发展的重要支撑作用,需要修改2019年印发的《济南市工程实验室管理办法》,并与国家和省形成体系发展。
       二、主要法律、法规、规章和政策依据
       一是《山东省科技进步条例》第十九条规定,县级以上人民政府鼓励企业设立科学技术研究开发机构,对经认定的工程(技术)研究中心、重点实验室、工程实验室、企业技术中心等科学技术研究开发机构及其创新能力建设项目给予扶持;鼓励企业与高等学校、科学技术研究开发机构联合建立技术创新平台,构建产业技术创新战略联盟。
       二是《山东省工程研究中心管理办法》(鲁发改高技〔2021〕427号 )第七条第五款规定,优先支持拥有市级工程实验室或工程研究中心的单位牵头申报。
       三、主要内容说明
       《济南市工程研究中心管理办法》(征求意见稿)主要参照《山东省工程研究中心管理办法》,在参考外地经验基础上,结合济南市创新驱动发展实际,综合考虑各方面因素,经过深入研究讨论拟订形成的。共包含六章二十六条。主要包含总则、申报认定、运行评价、鼓励政策、监督管理、附则等内容。
       一是关于总则部分。说明了工程研究中心功能定位、建设宗旨和主要任务,明确了市发展改革委负责全市工程研究中心建设总体布局,组织开展工程研究中心的申报、认定、评价等工作。各区县发展改革部门、市政府派出机构规定承担此项工作的部门(单位)是市工程研究中心的主管部门的责任区分。

       近期,新加坡国立大学、字节跳动智能创作新加坡团队等机构合作的一项技术成果被全球顶级学术期刊Nature的子刊Nature Neuroscience收录。这项研究首次将人工智能领域的元学习方法引入到神经科学及医疗领域,能在有限的医疗数据上训练可靠的AI模型,提升基于脑成像的精准医疗效果。
       一、研究背景
       脑成像技术是神经科学发展的一个重要领域,能够直接观察大脑在信息处理和应对刺激时的神经化学变化、从而对疾病的诊断和治疗提供重要参照。理论上,基于脑成像的机器学习模型可应用于预测个人(individual)的一些非脑成像(non-brain-imaging)的表征特性(phenotypes) ,例如,流动智力 (fluid intelligence)、临床结果(clinical outcomes)等,从而促进针对个人的精准医疗( precision medicine)。

       一个现实的问题在于,虽然现在已经有英国生物银行(UK Biobank)这样的大规模人类神经科学数据集,在研究临床人群或解决重点神经科学的问题时,几十到上百人的小规模数据样本依旧是常态。在精确标注的医疗数据量有限的情况下,很难训练出一个可靠的机器学习模型来预测个人表征特性。
       论文提出一个新的思路来解决这一数据匮乏所带来的根本限制:在给定一个大规模(N>10,000)的带有多种表征特性标注的脑成像数据集,可以将在该数据集上训练的机器学习模型迁移到一个独立的小规模(N<200)的带有新的表征特性的数据集上,从而使得在新的数据集上训练的模型能够准确预测新的表征特性。
       二、研究方法
       研究者通过对先前的小样本数据分析发现,个体的认知、心理健康、人口统计学和其他健康属性等表征特性与大脑成像数据之间存在一种内在的相关性。这意味着,小数据集当中的某些独特表型可能与大规模数据集当中的某些预先存在的特定表型相关,利用这种相关性,研究者提出了一个新的基于元学习的元匹配方法建立了一种框架机制,可利用大规模脑成像数据集来促进对小数据集当中一些全新的、未知的表型的预测,从而训练出可靠的用于表征特性预测的机器学习模型。
       论文提出了一种新的元匹配(meta-matching)方法,来解决小规模数据集上的表征特性预测模型的训练问题。元匹配是一种高度灵活的学习框架,可以用于各种不同的机器学习方法。论文主要研究了将元匹配方法应用于核岭回归(kernel ridge regression, KRR)以及全连接的深度神经网络(DNN).

技术前沿

ADVANCED TECHNOLOGY

Nature子刊 | NUS、字节
首次将AI元学习引入脑成像领域

       三、实验设置
       论文在英国生物银行(UK Biobank)和人类连接组计划(Human Connectome Project)数据集上进行了测评。所有数据的使用均已经过了相关研究部门批准。其中 UK Biobank 包含36,848名参与者的结构MRI以及静息fMRI脑成像数据,以及被筛选出的67个非脑成像的表征特性。而HCP包含 1,019 名参与者的结构MRI以及静息fMRI数据,以及被筛选出的58个表征特性。所筛选的表征特性涵盖了意识(cognition)、情绪(emotion)以及个人特质(personality)。
       UK Biobank数据集被用作训练集,用于使用元匹配来训练预测模型。其被随机分为元训练集(26,848名参与者,33个表征特性)以及元测试集(10,000名参与者,34个表征特性)。而HCP数据集则被用作测试集、测试预测模型在新的表征特性上的预测准确率。其被随机分为K个参与者用于训练以及(1,019-K)个参与者用来测试。其中K取值为19,20,50,100和200。
△ 图. HCP表据集表形特性示例
       四、实验结论
       上述方法已经在英国生物银行(UK Biobank)的 36,848 名参与者和来自人类连接组计划(Human Connectome Project)的 1,019 名参与者的样本评估中显示出有效性。

       在元匹配的学习框架中,大规模的训练数据被分为元训练集 (training meta-set) 以及元测试集 (testing meta-set)。这两个数据集包含不同的个体和表征特性标注。元训练集被用来训练DNN预测模型,而元测试集则用来评估当前DNN模型在新的表征特性上的预测准确率(也即泛化性能)。特别的,随机挑选的K个(K<5)个体数据被选作测试样本。而在元测试集上表现最好的一个DNN输出节点(output node)将被保留,而其他节点被移除。之后在该K个测试个体数据,微调(fine-tune)该保留的节点以及DNN模型之前与该节点相连的隐藏层参数。注意与一般的元学习或者微调策略不同的是,这里只微调DNN模型中的一个子网络,而不是微调整个模型参数。该过程将被重复M次,直到DNN模型在元测试集上预测稳定为止。
       在完成上述的元训练过程以后,得到的DNN模型已具有了较强的在新的预测任务上的泛化能力。该模型可以直接迁移到新的表征特性数据集上,用少量的标注样本进行训练,即可有较好的预测性能。

       在BioBank测试集上性能超过经典的核岭回归(KRR)
       下图展示了在UK Biobank元测试集 基于Pearson’s相关系数的准确性比较。在所有的样本数量设置上(K值),所提出的元匹配方法在34个表征特性准确率大幅超过经典的KRR方法 (伪发现率FDR q<0.05). 例如在fMRI研究中常见的样本数量K=20 (20-shot),基本的DNN meta-matching 方法准确率超过KRR 100% (0.124 vs. 0.052). 而如果采用coefficient of determinant (COD)作为性能指标,DNN meta-matching方法则超过KRR 400% .
       
       在HCP小规模新数据集上显著超过KRR
       为了测试元匹配在全新的测试集上的表现,论文进一步测试了其在HCP数据集上的性能。发现同样的,所提出的元匹配方法准确率大幅超过经典的KRR方法。例如在K=20时,元匹配方法准确率超过KRR 100% (0.123 vs. 0.047). 而在K=100时,以COD为指标,元匹配方法准确率超过KRR 800%.
       五、讨论与总结
       考虑到所提出的元匹配方法是利用表征特性之间的相关性来辅助预测,其背后的预测机制有可能是非因果的。然后该研究的主要目标是提高预测准确率,并且即使是非因果预测,所得到的预测模型也有很多的应用场景。例如,抗抑郁药物至少要4周以上才会起效,而少于50%的病人会对第一次给药反应良好。因此,即使是非因果的预测,提高表征特性的预测能力在临床上仍具有巨大价值。

       论文所提出的元匹配方法,是基于机器学习领域中的元学习,多任务学习以及迁移学习等。例如在DNN模型上先训练再微调可认为是迁移学习的一种形式。但是,值得注意的是,实验表明最大的准确率提升是来自于论文提出的核心算法—元匹配。当然,更先进的机器学习算法有希望在这个方向上带来更大的预测准确率的提升。
       虽然最初的脑成像数据集来自于年轻健康的成年人,现在有越来越多的数据集侧重不同的人群,例如老年人、儿童、不同的疾病等。论文提出的方法在将来也可以用于其他人群数据集的表征特性预测,例如最近的ABCD数据集包含了精神健康症状。
       字节跳动智能创作团队是字节跳动音视频创新技术和业务中台,覆盖了机器学习、计算机视觉、图形学、语音、拍摄编辑、特效、客户端、服务端工程等技术领域,在部门内部实现了前沿算法—工程系统—产品全链路的闭环,旨在以多种形式向公司内部各业务线以及外部合作客户提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案。
       智能创作基础研究团队旨在探索前沿机器学习以及计算机视觉、自然语言处理技术,解决人工智能领域里的挑战性问题。
       Nature Neuroscience是神经生物学领域最顶级的刊物之一,该杂志发表的论文涉及神经科学的各个领域,包括分子、细胞、系统、行为、认知和计算研究。
摘自《量子位》

       在过去的几年里,制药行业的数据数字化有了很大的增长。然而,数字化带来的挑战是如何应用这些数据来解决复杂的临床问题。这激发了人工智能的使用,因为它可以通过增强的自动化处理大量数据。人工智能是一个以技术为基础的系统,包括各种先进的工具和网络,可以模仿人类的智能。同时,它不会威胁到完全取代人类的存在。人工智能利用能够解释和学习输入数据的系统和软件,为实现特定的目标做出独立的决定。人工智能在医药领域的应用正在不断扩大。
       一、人工智能
       人工智能涉及多个方法领域,如推理、知识表示、解决方案搜索,其中包括机器学习(ML)的基本范式。ML的一个子领域是深度学习(DL),它涉及人工神经网络(ANN)。它们包括一组相互关联的复杂计算元素,涉及类似于人类生物神经元的“感知”,模拟人类大脑中电脉冲的传输。神经网络涉及各种类型,包括多层感知器(MLP)网络、递归神经网络(RNNs)、和卷积神经网络(CNNs)。更复杂的形式包括Kohonen网络、RBF网络、LVQ网络、反向传播网络和ADALINE网络。下图总结了人工智能的方法域示例。

       二、人工智能助力药物筛选
       发现和开发一种化学药物的过程可能需要10年以上,平均花费28亿美元。即便如此,90%的治疗性分子未能通过II期临床试验和监管机构的批准。最近邻近算法、RF、极限学习、SVMs和深度神经网络(DNNs)等算法可用于基于合成可行性的虚拟筛选(VS),也可预测体内的活性和毒性。一些大型生物制药公司,如拜耳、罗氏和辉瑞,已经与IT公司开展合作开发人工智能平台,用于在肿瘤免疫学和心血管疾病等领域发现治疗方法。
       1、理化性质预测
       药物的物理化学性质,如溶解度、分配系数(logP)、电离度和内在通透性,都会间接影响药物的药代动力学特性和靶向受体,因此,在设计新药时必须加以考虑。不同的人工智能工具可以用来预测物理化学性质。例如,ML使用之前在复合优化过程中产生的大数据集来训练程序。药物设计的算法包括分子描述、势能测量、分子周围的电子密度和三维原子坐标,通过DNN生成可行的分子,从而预测其性质。
       2、生物活性预测
       药物分子的疗效取决于它们对靶蛋白或受体的亲和力。对靶蛋白没有任何相互作用或亲和力的药物分子将不能提供治疗反应。在某些情况下,开发出的药物分子可能与非预期的蛋白质或受体相互作用,导致毒性。因此,药物靶向结合亲和力(DTBA)是预测药物与靶点相互作用的关键。基于人工智能的方法可以通过考虑药物及其靶点的特性或相似性来测量药物的结合亲和力。基于特征的相互作用识别药物和靶点的化学成分以确定特征向量。相反,基于相似性的相互作用考虑了药物与靶点之间的相似性,并假设相似的药物将与相同的靶点相互作用。

行业资讯

INDUSTRY INFORMATION

开启未来之窗:AI与药物研发的共舞

       网络应用程序,如ChemMapper和相似集成方法(SEA)可用于预测药物与靶点的相互作用。许多涉及ML和DL的策略已被用于确定DTBA,如KronRLS、SimBoost、DeepDTA和PADME。基于ML的方法,如KronRLS,评估药物和蛋白质分子之间的相似性以确定DTBA。类似地,SimBoost使用回归树来预测DTBA,同时考虑基于特征和基于相似性的交互。
       3、毒性预测
       预测药物分子的毒性对于避免毒性作用至关重要。以细胞为基础的体外试验通常被用作初步研究,然后是动物研究来确定化合物的毒性,增加了药物发现的费用。一些基于网络的工具,如LimTox、pkCSM、admetSAR和Toxtree,可以帮助降低成本。先进的基于人工智能的方法寻找化合物之间的相似性或根据输入特征预测化合物的毒性。由美国国家卫生研究院、环境保护署(EPA)和美国食品和药物管理局(FDA)组织的Tox21数据挑战赛是一项倡议,旨在评估几种预测12707种环境化合物和药物毒性的计算技术。名为DeepTox的ML算法脱颖而出,它通过识别分子化学描述内的静态和动态特征,如分子量(MW)和范德华力,并可根据预定义的2500个毒性基团特征有效地预测分子的毒性。药物发现中使用的不同人工智能工具如下表所示。
       三、人工智能助力药物设计
       1、靶蛋白结构预测
       在开发化学药物的过程中,预测靶蛋白的结构对于设计药物分子至关重要。人工智能可以通过预测3D蛋白质结构来帮助基于结构的药物发现,因为设计要符合目标蛋白位点的化学环境,从而有助于在合成或生产前预测化合物对靶点的影响以及安全考量。以DNNs为基础的人工智能工具AlphaFold分析了相邻氨基酸之间的距离和肽键的对应角度,预测了靶点蛋白的三维结构,并在43个结构中正确预测了25个。

       2、药物-蛋白质相互作用预测
       药物与蛋白质的相互作用对治疗的成功起着至关重要的作用。预测药物与受体或蛋白质的相互作用对于理解药物的疗效和有效性、允许药物的再利用以及防止多药理学是至关重要的。各种人工智能方法在精确预测配体-蛋白质相互作用方面非常有用,确保了更好的治疗效果。
       人工智能预测药物-靶点相互作用的能力也被用来帮助改变现有药物的用途和避免多药理学。改变现有药物的用途可以直接用于第二阶段临床试验。这也减少了开支,因为与新开发的药品实体相比(4130万美元),重新启动现有药品的成本约为840万美元。“罪恶关联”方法可用于预测药物和疾病的创新关联,这是一个基于知识或计算驱动的网络。在计算驱动的网络中,ML方法被广泛应用,它利用了支持向量、神经网络、逻辑回归和DL等技术。
       药物-蛋白质的相互作用也可以预测多药理学的机会,这是药物分子与多个受体相互作用的趋势,产生非靶向不良反应。人工智能可以根据多药理学的基本原理设计一种新的分子,并帮助产生更安全的药物分子。像SOM这样的人工智能平台,加上现有的庞大数据库,可以用来将几种化合物与众多目标和非目标联系起来。贝叶斯分类器和SEA算法可用于建立药物药理特征与其可能靶点之间的联系。
       3、从头药物设计
       在过去的几年里,从头设计药物的方法被广泛应用于药物分子的设计。传统的从头设计方法正在被进化的DL方法所取代,前者存在合成路线复杂、难以预测新分子生物活性的缺点。Popova等人开发了用于从头药物合成的结构进化策略的强化学习,包括生成和预测DNN来开发新化合物。Merk等人同时利用生成性AI模型来设计维甲酸X和PPAR激动剂分子,在不需要复杂规则的情况下具有理想的治疗效果。作者成功地设计了五个分子,其中四个在细胞检测中表现出良好的调节活性。人工智能参与分子的从头设计对制药行业是有益的,因为它具有各种优势,例如提供在线学习和同时优化已经学习的数据,以及建议化合物的可能合成路线,从而实现快速的先导设计和开发。
      四、 人工智能助力制药制造
       随着制造过程的日益复杂,以及对效率和更好产品质量要求的不断提高,现代制造系统正试图将人类知识传授给机器,不断改变制造实践。人工智能在制造业中的应用可以证明是对制药行业的一个推动。流体动力学计算(CFD)等工具使用雷诺平均Navier-Stokes求解器技术,研究不同设备(如搅拌槽)中搅拌和应力水平的影响,使制药操作自动化。类似的系统,如直接数值模拟和大涡模拟,涉及到解决制药生产中复杂流动问题的先进方法。

       五、人工智能助力质量控制和质量保证
       从原材料生产所需产品包括各种参数的平衡。产品的质量控制测试以及批次间一致性的维护都需要人工干预。在多种情况下,这可能不是最好的方法,表明了现阶段人工智能实现的必要性。FDA修订了现行的良好生产规范(cGMP),引入了一种“按设计质量”的方法来理解控制药品最终质量的关键操作和具体标准。
       人工智能也可用于在线制造过程的监管,以达到产品的预期标准。采用了基于人工神经网络的冻干过程监测,结合了自适应进化算法和局部搜索和反向传播算法。这可用于预测特定操作条件下未来时间点(t+Δt)的温度和干燥滤饼厚度,最终有助于对最终产品质量进行检查。此外,全面质量管理专家系统中的数据挖掘和各种知识发现技术可作为制定复杂决策的有价值方法,为智能质量控制创造新技术。
       六、人工智能助力临床试验设计
       临床试验的目的是确定一种药物在人类特定疾病条件下的安全性和有效性,需要6-7年的时间和大量的资金支持。然而,进入临床试验的小分子十个里可能只有一个获得成功,过低的成功率对工业界来说是一个巨大的损失。这些失败可能是由于病人选择不当、技术要求不足和基础设施差造成的。然而,有了大量可用的数字医疗数据,这些故障可以通过人工智能的实施而减少。
       病人的登记需要临床试验时间的三分之一。临床试验的成功可以通过招募合适的患者来保证,否则会导致约86%的失败病例。AI可以通过使用患者特定基因组-暴露组分析,帮助选择特定的疾病人群,以便在临床试验的第二和第三阶段招募,这有助于早期预测所选患者的可用药物靶点。临床前发现分子以及在临床试验开始前通过使用人工智能的其他方面(如预测性ML和其他推理技术)预测先导化合物,有助于早期预测通过临床试验的先导分子,并考虑选定的患者群体。
       从临床试验中退出的病人占临床试验失败的30%,为完成试验创造了额外的招募要求,造成了时间和金钱的浪费。这可以通过密切监视患者并帮助他们遵循临床试验的预期方案来避免。AiCure开发的移动软件在第二阶段试验中监测精神分裂症患者的常规药物摄入,使患者的依从率提高了25%,确保了临床试验的成功完成。
       七、人工智能在制药工业的市场前景
       为了降低与医药开发相关的财务成本和失败几率,制药公司正转向人工智能。人工智能市场从2015年的2亿美元增加到2018年的7亿美元,预计到2024年将增至50亿美元。从2017年到2024年,预计增长40%,这表明人工智能可能会彻底改变制药和医疗行业。许多制药公司已经并正在继续投资于人工智能,并与人工智能公司合作开发必要的医疗保健工具。
不完全统计,国外领先的AI制药平台有: Exscientia、AbCellera Biologics、Recursion Pharmaceuticals、Atomwise、Benevolent 、 Insilico 、硅康医药、Insitro、Cyclica等等。

       国内利用AI从事药物研发领域相关开发的企业有:湃隆生物、望石智慧、晶泰科技、宇道生物、费米子、燧坤智能、未知君、METiS、星亢原生物、奥睿药业、水木未来、科辉智药、武汉智化科技、新合生物、云深智药、百图生科、阿尔脉生物、康迈迪森、英飞智药、亿药科技、智药科技、赛恪科技、南京双运生物、深度智耀、星药科技等。
       八、采用人工智能的持续挑战
       人工智能的整个成功取决于大量数据的可用性,因为这些数据用于为系统提供的后续训练。从不同的数据库提供商访问数据可能会给公司带来额外的成本,数据也应该是可靠的和高质量的,以确保准确的结果预测。阻碍人工智能在制药行业全面采用的其他挑战包括:缺乏操作基于人工智能平台的熟练人员、小型组织的预算有限、担心替换人类导致失业、对人工智能产生的数据持怀疑态度以及黑箱现象。
       尽管如此,人工智能已被多家制药公司采用,预计到2022年,制药行业通过基于人工智能的解决方案将创造21.99亿美元的收入。制药组织需要弄清楚人工智能技术在解决问题方面的潜力,并了解可以实现的合理目标。拥有熟练的数据科学家、对人工智能技术有充分了解的软件工程师,对公司的业务目标和研发目标有清晰的理解,才可以充分利用人工智能平台的潜力。
       九、展望
       人工智能的进步正不断地致力于减少制药公司面临的挑战,影响药物开发过程以及产品的整个生命周期,这表现在该行业初创企业数量的增加。当前的医疗保健部门正面临着一些复杂的挑战,例如药物和治疗费用的增加,而社会需要在这一领域进行具体的重大变革。随着人工智能在医药产品制造中的应用,可以根据患者个人的需要制造具有所需剂量、释放参数和其他所需方面的个性化药物。使用最新的基于人工智能的技术不仅可以加快产品上市所需的时间,而且还可以提高产品质量和生产过程的整体安全性,在提高成本效益的同时,更好地利用现有资源。
       对于这些技术的应用,最令人担忧的是随之而来的失业以及实施人工智能所需的严格法规。然而,这些系统只是为了使工作更简单,而不是完全取代人类。人工智能不仅有助于快速、无障碍地识别符合的化合物,而且有助于为这些分子的合成路线提供建议,以及对所需化学结构的预测,以及对药物-靶相互作用及其SAR的理解。
       人工智能还可以为进一步将开发的药物纳入其正确的剂型以及优化其做出重大贡献,此外,它还可以帮助快速决策,从而加快生产质量更好的产品,同时保证批次间的一致性。人工智能也有助于在临床试验中确定产品的安全性和有效性,并通过全面的市场分析和预测确保产品在市场上的适当定位和成本。虽然目前市场上还没有采用基于人工智能的方法开发的药物,而且在实施这项技术方面仍然存在一些具体的挑战,但人工智能很可能在不久的将来成为制药工业中一种无价的工具。

扫一扫关注我们

物端AI芯片  
边缘AI计算设备 高通量AI服务器认知智能与协作计算

Copyright © 2024 陕西妙网网络科技有限责任公司 All Rights Reserved

增值电信业务经营许可证:陕B2-20210327 | 陕ICP备13005001号 陕公网安备 61102302611033号