注册

智研简报2022第12期

中国·济南
山东产业技术研究院智能计算研究院

2022

05 / 24

智研简报

智/能/计/算      计/算/未/

智研院顺利通过ISO20000管理体系
年度监督审核
智研院开展产学研合作研制环境在线
监测仪表现场运维机器人

12 / 30

预测更准确,使用机器学习改进化学品的毒性评估
吴恩达:AI 在2022年创造了这些奇迹

       12月8日下午至9日,中标华信(北京)认证中心的评审专家对我院进行了为期1.5天的ISO20000管理体系年度监督审核,在院领导的大力支持和各部门的通力合作下,我院顺利通过了此次年度监督审核。
       本次审核采取线上访谈和文档审查相结合的方式开展,审核专家与联邦边缘计算中心马兴敏、行政部孟辉在研发项目管理和行政管理方面进行了线上访谈,并审查了我院体系文件及其在具体项目中的执行落实情况。审核覆盖项目工作规划、项目过程管理、验收交付和售后运维的全生命周期程序文件。
       ISO20000管理体系年度监督审核的顺利通过,标志着我院在IT服务领域管理的规范性和完备性上持续稳定提升,为研究院的发展提供有效支撑和坚强保障。

CONTENTS

目录

面向“政产学研金服用”,打造研究机构与企业间体系化、标杆化及标准化合作模式

01

智研快讯

《工业和信息化领域数据安全管理办法(试行)》重点问题回应

智研院顺利通过ISO20000管理体系年度监督审核

04

05

02

预测更准确,使用机器学习改进化学品的毒性评估

智研院顺利通过ISO20000
管理体系年度监督审核

智研快讯

NEWSLETTERS

政策导读

06

科学家使用机器学习获得前所未有的小分子视图

03

智研院产学研合作研制环境在线监测仪表现场运维机器人

行业资讯

技术前沿

吴恩达:AI 在2022年创造了这些奇迹

项目进展

       根据在线检测运维工作的特点,尤其是有重复性、高频性、职业危险性的部分,完全符合人工智能机器人替代人工作的方向;而且,使用智能机器人运维还可以避免人为的差错或者舞弊现象;机器人动作有"行为"均可做到永久保存、即时可见,使在线监测仪器现场不间断的环境监测工作更加可信赖,可以更好地辅助环保部门各项环境治理工作。
       通过本项目的实施,实现环境在线监测仪表现场运维的"四化":一是运维过程标准化。机器人完全遵循设定的程序运行,过程标准化,不会因疏忽造成工作上的损失。机器人运维过程完全数据化并记录,机器人运维的所有"动作"及内容能做到"可存、可复核、该见者可见"。二是数据可溯化。机器人严格依照操作规程进行设备维护,可以确保监测仪出于最佳状态,产生的数据也更加真实可靠并可追溯。三是运维高效化。机器人可以根据易损部件平均寿命,在部件损坏前提出更换请求,可以大大降低故障率;在大范围应用的情形下,机器人还可以通过大数据的分析,判断故障的原因,方便维修人员快速解决问题。水质在线分析仪在环保数据分析中极大的减少了人工的重复劳动,极大地降低了成本,提高了企业的竞争力。四是监管智能化。通过运维机器人,极大提高了在线监测仪器在环境监管和环境治理工作中的价值,使在线监测仪表成为环保部门监管及治理的有力工具。

       为了响应国家重视生态环境监测,将生态环境监测纳入生态文明改革的政策号召,发挥人工智能机器人在环境监测领域的优势,智研院与生态环境部南京环境科学研究院、苏州创造环保科技有限公司达成合作,发挥各自优势、整合研发资源,开展产学研合作,联合研制环境在线监测仪表现场运维机器人。
       生态环境监测是生态环境保护的基础,是生态文明建设的重要支撑。《国家生态环境监测"十四五"科技发展规划》明确提出:“加大应用技术领域的新成果在环境监测中的应用和转化力度,促进环境监测技术“天空地一体化”,力争为生态环境治理能力与治理体系现代化提供完整的科技支撑”。
       随着集成电路的出现,工业自动化技术和光电检测技术的发展,在线监测仪器的快速发展和成熟,在线监测仪器基本取代了人工取样、手工分析的模式,现有的固定污染源基本完成了在线监测仪器的全覆盖。为了确保在线监测仪器的正常运行和数据的准确有效性,产生了新的行业需求:在线监测仪器的运行维护,由专业的运行维护技术人员定期对在线监测仪执行状态检测、数据校准、更换耗材等日常运行维护工作。通常包含的工作内容有:检查对比核实监测仪器数据记录、仪器状况检查、仪器日常保养、台账日志记录、故障排除及零部件更换、重要参数检查,拍照留档备案等。

项目进展

PROJECT PROGRESS

智研院开展产学研合作研制
环境在线监测仪表现场运维机器人

政策导读
《工业和信息化领域数据安全管理办法(试行)》重点问题回应

       当前,数据已成为数字经济时代最为活跃的新型生产要素。与此同时,数据安全风险日益突出,成为关系个人权益、公共利益和国家安全的重要因素。2021年9月1日,《中华人民共和国数据安全法》正式实施,为开展数据安全监管和保护工作提供了法律依据和根本遵循,其中明确工业和信息化部承担工业、电信行业数据安全监管职责,并对数据处理者的安全保护义务提出了相关要求。近日,工业和信息化部印发《工业和信息化领域数据安全管理办法》(工信部网安〔2022〕166号),(以下简称《管理办法》)。现就《管理办法》重点问题进行回应。

       一、《管理办法》出台的背景和目的是什么?
       工业和信息化领域是数字经济发展的主阵地和先导区,是推进数字经济做强做优做大的主力军。为贯彻落实《数据安全法》,加快推动工业和信息化领域数据安全管理工作制度化、规范化,我部研究起草了《管理办法》,一是在工业和信息化领域对国家数据安全管理制度要求进行细化,明确开展数据分类分级保护、重要数据管理等工作的具体要求,细化数据全生命周期安全义务,为行业数据安全监管提供制度保障。二是构建工业和信息化领域数据安全监管体系,明确工业和信息化部、地方行业监管部门的职责范围,建立权责一致的工作机制。三是根据工业、电信、无线电领域的实际情况,明确数据全生命周期保护要求,指导数据处理者健全数据安全管理和技术保护措施,履行安全保护主体责任。
       二、《管理办法》的定位和主要内容是什么?
       《管理办法》作为工业和信息化领域数据安全管理顶层制度文件,共八章四十二条,重点解决工业和信息化领域数据安全“谁来管、管什么、怎么管”的问题。主要内容包括七个方面:一是界定工业和信息化领域数据和数据处理者概念,明确监管范围和监管职责。二是确定数据分类分级管理、重要数据识别与备案相关要求。三是针对不同级别的数据,围绕数据收集、存储、加工、传输、提供、公开、销毁、出境、转移、委托处理等环节,提出相应安全管理和保护要求。四是建立数据安全监测预警、风险信息报送和共享、应急处置、投诉举报受理等工作机制。五是明确开展数据安全监测、认证、评估的相关要求。六是规定监督检查等工作要求。七是明确相关违法违规行为的法律责任和惩罚措施。
       三、《管理办法》明确的监管范围是什么?
       《管理办法》对工业和信息化领域数据处理活动进行安全监管,具体可以从处理对象、处理主体、处理活动三方面进行认识:从处理主体看,工业和信息化领域数据处理者是指能够在工业和信息化领域数据处理活动中自主决定处理目的、处理方式的各类主体,主要包括工业数据处理者、电信数据处理者以及无线电数据处理者。从处理对象看,工业和信息化领域数据主要包括工业数据、电信数据和无线电数据等。从处理活动看,数据收集、存储、使用、加工、传输、提供、公开等活动都属于监管范围。
       四、《管理办法》明确了怎样的监管职责分工?
       《管理办法》构建了“工业和信息化部、地方行业监管部门”两级监管机制。工业和信息化部统筹工业和电信领域数据安全监管工作,包括组织制定行业数据安全管理政策制度和标准规范,编制行业重要数据和核心数据目录,建立重要数据目录备案、监测预警、风险信息报送和共享、应急处置等工作机制,指导地方行业监管部门开展属地监管,督促全行业数据处理者加强数据安全保护工作。地方行业监管部门,包括各省、自治区、直辖市及计划单列市、新疆生产建设兵团工业和信息化主管部门,各省、自治区、直辖市通信管

理局和无线电管理机构,分别负责对本地区工业、电信、无线电领域数据处理者进行监督管理,包括审核重要数据目录备案,编制重要数据和核心数据具体目录,开展监测预警、风险信息报送和共享、应急处置、风险评估、投诉举报受理等工作,并可结合工作实际,建立更加细化完善的工作机制。
       五、《管理办法》对数据分级保护的要求是什么?
       《管理办法》以数据分级保护为总体原则,要求一般数据加强全生命周期安全管理,重要数据在一般数据保护的基础上进行重点保护,核心数据在重要数据保护的基础上实施更加严格保护。对于不同级别数据同时被处理且难以分别采取保护措施的,采取“就高”原则,按照其中级别最高的要求实施保护。
       六、《管理办法》要求重要数据处理者履行哪些数据安全保护义务?
       《管理办法》依据国家数据分类分级保护制度要求,规定重要数据处理者在履行一般数据处理者数据安全保护义务的基础上,还应承担以下保护义务:一是开展数据识别备案,按照相关标准规范识别重要数据,形成本单位具体目录并进行备案;二是加强内部管理,建立数据安全工作体系,明确数据安全负责人,加强数据处理关键岗位管理,构建重要数据处理登记审批机制,强化数据全生命周期安全保护措施;三是组织常态化监测预警与应急处置,涉及重要数据和核心数据安全事件的应第一时间进行上报;四是定期实施风险评估,及时发现整改风险问题,并按照要求上报风险评估报告。
       七、企业如何按照《管理办法》开展重要数据识别和目录备案工作?
       工业和信息化部结合国家数据安全保护要求和行业实际,组织制定工业和信息化领域重要数据和核心数据识别认定标准规范,明确识别规则和方法。数据处理者应当定期梳理本单位数据资源,按照所属行业标准规范识别重要数据后,向本地区行业监管部门备案重要数据目录。当备案内容发生重大变化后,数据处理者应当及时履行备案变更手续,保证目录备案的时效性、准确性与真实性。
       八、《管理办法》对保障数据全生命周期提了哪些要求?
       《管理办法》围绕数据收集、存储、使用、加工、传输、提供、公开等全生命周期关键环节,分别针对一般数据、重要数据、核心数据细化明确了安全保护要求,主要包括明确细化了协议约束、安全评估、审批等管理要求,以及校验与密码技术使用、数据访问控制等技术保护要求。
       九、《管理办法》要求在哪些情形下需要开展数据安全风险评估?
       《管理办法》明确重要数据和核心数据处理者每年至少完成一次数据安全风险评估,可以自行或委托第三方评估机构开展,及时整改风险问题,并向本地区行业监管部门报告。评估内容包括合规评估和风险研判:合规评估是指对标对表法律法规和政策文件,评估是否满足相关要求,风险研判是指通过分析数据处理者的安全保障能力、面临的威胁情况和发生安全事件后的影响程度等,评估数据处理活动的安全风险等级。

       十、《管理办法》要求如何开展数据出境安全评估?
       《管理办法》明确工业和信息化领域数据处理者在中华人民共和国境内收集和产生的重要数据和核心数据,法律、行政法规有境内存储要求的,应当在境内存储,确需向境外提供的,应当依照《数据安全法》《数据出境安全评估办法》等法律法规进行安全评估。
       十一、如何按照《管理办法》开展数据安全风险监测预警工作?
       监测预警是有效发现和防范数据安全突出风险的重要工作。《管理办法》明确了“部-省-企业”三级联动协同的数据安全风险监测预警工作机制:一是工业和信息化部统筹指导行业数据安全监测预警工作,建设行业数据安全风险监测预警技术手段,统一汇集、研判、通报数据安全风险信息。二是地方行业监管部门负责建立本地区本领域数据安全监测预警机制,组织管辖范围内的数据处理者开展数据安全风险监测和信息报送。三是数据处理者做好本单位数据安全风险监测,按照行业监管部门要求开展风险监测排查,及时防范化解风险隐患。
       十二、企业如何按照《管理办法》开展数据安全应急处置工作?
       《管理办法》明确建立工业和信息化领域数据安全应急处置工作机制,细化不同主体的责任与义务:一是工业和信息化部统筹行业数据安全应急处置管理工作,制定数据安全事件应急预案,组织协调行业重要数据和核心数据安全事件应急处置工作;二是地方行业监管部门负责组织开展本地区数据安全事件应急处置工作,及时上报涉及重要数据和核心数据的安全事件;三是数据处理者制定本单位数据安全事件应急预案并定期开展应急演练,在发生数据安全事件后及时进行处置,并按要求及时向行业监管部门报告。
       十三、《管理办法》对中央企业提出了哪些要求?
       中央企业是国民经济的重要支柱和骨干力量,产生、汇聚了大量关系国计民生的重要数据。中央企业所属公司业务既受地方行业监管部门管理,也受集团公司管理。因此,《管理办法》对中央企业提出两项工作要求:一是督促所属公司按照属地行业监管部门要求,履行重要数据目录备案、风险信息上报等要求。二是做好集团本部数据安全保护工作,全面梳理汇总集团本部、所属公司相关情况,及时向工业和信息化部报送。
       十四、下一步如何推进相关工作?
       《管理办法》发布后,工业和信息化部将从政策宣贯、细则制定、正向引导、监督执法等方面抓好落实:一是加强宣贯培训。对《管理办法》的主要内容进行全面、系统解读,指导行业数据处理者准确理解、全面把握、认真落实相关要求,提升数据安全保护意识和能力。二是制定配套规范标准。重点推进监测预警、应急处置、安全评估等制度机制的实施细则,为企业进一步提供深入细致、操作性强的工作指引。三是加强正向引导。通过行业自律、贯标达标,典型案例遴选等形式,加强示范引领,引导企业自动对标管理要求,自觉提升数据安全保护能力。四是加强监督执法。通过专项行动、监督检查等工作,及时发现违法违规行为,并依法进行处罚。

技术前沿

ADVABCED TECHNONLGY

预测更准确,使用机器学习
改进化学品的毒性评估

       从命运和毒性的角度来看,人类暴露的化学空间随着化学物质的多样性而不断扩大。欧洲和美国的化学品机构列出了大约 80 万种化学品。对于这些化学品中的大多数,人们对其环境归宿或毒性知之甚少。
       通过实验填补这些数据空白是不可能的,因此计算机方法和预测至关重要。然而,许多现有模型受到假设和小训练集的限制。
       近日,来自阿姆斯特丹大学、昆士兰大学和挪威水研究所的研究团队,开发了一个基于随机森林的直接分类模型,该模型将分子描述符与毒性联系起来。该模型是通过实验定义的 907 种有机化学品的急性鱼类毒性 96 小时 LC50 值数据集开发、验证和测试的。该分类模型解释了数据中约 90% 的训练集方差和约 80% 的测试集方差。与基于定量构效关系 (QSAR) 建模的传统「计算机模拟」评估相比,该策略使错误分类的频率降低了 5 倍。与 QSAR 方法相比,提出的直接分类模型具有更好的性能,使该方法成为评估化学品危害和风险的可行工具。
       该研究以「From Molecular Descriptors to Intrinsic Fish Toxicity of Chemicals: An Alternative Approach to Chemical Prioritization」为题,于 12 月 8 日发布在《Environmental Science & Technology》上。
       据研究人员称,无论是在新化学品的安全设计开发中,还是在现有化学品的评估中,机器学习的使用都可以极大地改善分子的危险评估。后者的重要性体现在以下事实:欧洲和美国的化学机构列出了多年来开发的大约 800,000 种化学品,但对这些化学品的环境归宿或毒性知之甚少。
       由于化学归宿和毒性的实验评估需要大量时间、精力和资源,因此建模方法已被用于预测危险指标。特别是经常应用 QSAR 建模,将分子特征(原子排列和 3D 结构)与物理化学性质和生物活性联系起来。
       根据建模结果(或可用的测量数据),专家将分子分类为全球化学品统一分类和标签系统 (GHS) 中定义的类别。对于特定类别的分子,将进行更多的研究,更积极的监测,最终立法。 然而,这个过程有固有的缺点,其中大部分可以追溯到 QSAR 模型的局限性。它们通常基于非常同质的训练集,并假设线性构效关系以进行外推。因此,现有的 QSAR 模型无法很好地代表许多化学品,使用这些模型可能会导致大量的预测误差和化学品的错误分类。

       跳过 QSAR 预测
       在这里,Saer Samanipour 博士及其合著者提出了一种完全跳过 QSAR 预测步骤的替代评估策略。
       研究人员合作开发了一种基于机器学习的策略,用于根据分子描述符对化学品的急性水生毒性进行直接分类。该模型是通过 907 项实验获得的鱼类急性毒性数据(96h LC50 值)开发和测试的。新模型跳过了对每种化学品的毒性值 (96h LC50) 的明确预测,而是直接将每种化学品分类为多个预定义的毒性类别。
       例如,这些类别可以由特定法规或标准化系统定义,如急性水生危害的 GHS 类别一文中所示。该模型解释了训练集中使用的数据中大约 90% 的方差,以及测试集数据中大约 80% 的方差。
       更准确的预测
       与基于 QSAR 回归模型的策略相比,这种直接分类策略导致错误分类减少了五倍。随后,研究人员扩展了他们的策略以预测大量 32,000 种化学品(NORMAN 数据集)的毒性类别。
       他们证明,他们的直接分类方法可以产生更高准确度的预测,因为来自不同来源和不同化学家族的实验数据集可以分组以生成更大的训练集。它可以适应各种国际法规和分类或标签系统规定的不同预定义类别。
       将来,直接分类方法还可以扩展到其他危害类别(例如慢性毒性)以及环境归宿(例如流动性或持久性),并显示出改进化学危害和风险评估的硅内工具的巨大潜力。

蓝色圆圈代表 AD 之外的化学物质,橙色圆圈代表模型适用范围内的化学物质,绿色圆圈代表训练集适用范围内的化学物质。

       生物样品中小分子的结构注释是生物医学、生物技术、药物发现和环境科学等各个研究领域的关键瓶颈。非靶向代谢组学研究中的样本通常包含数千种不同的分子,其中绝大多数仍未被识别。LC-MS 是使用最广泛的分析平台之一,因为它可以进行高通量筛选、高度灵敏并且适用于范围广泛的分子。
       对于每个离子,记录的碎片及其强度构成 MS^2 谱图,其中包含有关分子中子结构的信息,并作为注释工作的基础。在典型的非靶向 LC-MS^2 工作流程中,数千个 MS 特征(MS^1、MS^2、RT)来自单个样本。结构注释的目标是将每个特征与候选分子结构相关联,以供进一步的下游解释。
       近年来,已经开发了许多预测 MS^2 质谱图结构注释的强大方法。有趣的是,RT 信息在基于 MS^2 的结构注释自动化方法中仍未得到充分利用。自动注释管道中另一个有点被忽视的方面是立体化学的处理,即分子的不同三维 (3D) 变体。
       在此,研究人员着手为联合使用 MS^2 和 retention order (RO) 结合立体化学感知分子特征来提供 LC-MS^2 数据结构注释的新视角。提出了一种名为 LC-MS^2Struct 的新型机器学习框架,它学习如何以最佳方式组合 MS^2 和 RO 信息,以准确注释一系列 MS 特征。
       LC-MS^2Struct 依赖于结构化支持向量机 (SSVM) 和最大间隔马尔可夫网络(max-margin Markov network)框架。框架不需要单独学习的 RO 预测模型。相反,它优化了 SSVM 参数,使得正确和任何其他注释序列之间的分数差最大化。通过这种方式,LC-MS^2Struct 学习如何以最佳方式使用来自一组 LC-MS^2 实验的 RO 信息。
       根据 MassBank 提供的所有可用反相 LC 数据对LC-MS^2Struct 进行了训练和评估,包括来自 18 种不同 LC 配置的总共 4,327 个分子,因此在模型评估中达到了高水平的测量多样性。
                                         图示:LC-MS^2Struct 工作流程概览

技术前沿

ADVABCED TECHNONLGY

科学家使用机器学习
获得前所未有的小分子视图

       数以千计的不同小分子(称为代谢物)在整个人体中传输能量和传递细胞信息。由于它们非常小,因此很难在血液样本分析中将代谢物彼此区分开来——但识别这些分子对于了解运动、营养、饮酒和代谢紊乱如何影响健康非常重要。
       尽管在过去十年中预测方法和工具取得了快速进展,但生物样本中小分子的结构注释仍然是非靶向代谢组学的关键瓶颈。液相色谱-串联质谱法(LC-MS)是使用最广泛的分析平台之一,可以检测样品中的数千个分子,即使使用一流的方法,其中绝大多数仍未被识别。
       近日,来自阿尔托大学和卢森堡大学的研究人员开发了一种机器学习框架:LC-MS^2Struct,用于对 LC-MS 测量产生的小分子数据进行结构注释。经过数十个实验室的数据训练,成为识别小分子最准确的工具之一。
       LC-MS^2Struct 获得了比早期方法显著更高的注释精度,并将最先进的 MS^2 评分器的注释精度提高了高达 106%。使用立体化学感知分子指纹可提高预测性能,这突出了现有方法的局限性,并对未来的计算 LC-MS 发展具有重要意义。
       该研究以「Joint structural annotation of small molecules using liquid chromatography retention order and tandem mass spectrometry data」为题,于 2022 年 12 月 19 日发布在《Nature Machine Intelligence》上。

       LC-MS^2Struct 与其他三种方法(RT 过滤、logP 预测和 RO 预测)进行了比较。LC-MS^2Struct 可以与任何 MS^2 评分器结合使用,并使用 CFM-ID、MetFrag 和 SIRIUS 工具进行了演示。
                                    图示:组合 MS^2 和 RT 信息的不同方法
       实验表明,LC-MS^2Struct 注释小分子的准确性远远优于更传统的 RT 过滤和基于 logP 的方法,也明显优于以前依赖 RO 的方法。所有三个研究的 MS^2 评分器都可以通过LC-MS^2Struct 进行改进,包括同类最佳的 SIRIUS,由于其已经很高的基线准确性,通常很难对其进行改进。对于 CFM-ID 和 MetFrag,LC-MS^2Struct 比 only-MS^2 的 top-1 准确度提高了 4.7 和 7.3% 单位,分别对应于 80.8% 和 106% 的性能增益。
       研究结果显示了立体化学感知分子特征对于 LC-MS^2 数据结构注释的优越性。值得注意的是,这不仅适用于立体异构体的注释,也适用于仅通过其二维结构区分的候选物。
       接下来,研究了LC-MS^2Struct 是否可以比单独使用 MS^2 更准确地注释立体异构体,考虑到双键方向不同的立体异构体之间的差异(例如,顺反异构或 E-Z 异构),这可能会导致其 LC 行为的差异。候选分子使用两种不同的分子指纹表示:一种包括立体化学信息 (3D);和一个省略它的 (2D)(方法)。这使我们能够评估立体化学感知特征对于结构注释的重要性。

                                     图示:使用LC-MS^2Struct 识别立体异构体
       在查看LC-MS^2Struct (3D) 的单个 MS^2 评分器的 top-1 性能时,观察到 CFM-ID、MetFrag 和 SIRIUS 分别提高了 2.6、3.8 和 3.2 个百分比单位。这分别转化为 87.3%、95.9% 和 44.3% 的性能提升。
       一般来说,LC-MS^2Struct 提高了所有三个 MS^2 评分者的排名。然而,当使用立体化学感知 (3D) 候选特征时,改进明显更大。有趣的是,在 ALLDATA 设置中可以观察到类似的行为,尽管绝对性能改进较小。该实验表明LC-MS^2Struct 可以使用 RO 信息来改进立体异构体的注释。
       “我们的研究表明,虽然绝对保留时间可能会有所不同,但保留顺序在不同实验室的测量中是稳定的”,阿尔托大学的博士生 Eric Bach 解释道。“这使我们能够有史以来第一次合并所有公开可用的代谢物数据,并将其输入到我们的机器学习模型中。”
       卢森堡大学卢森堡系统生物医学中心 (LCSB) 副教授 Emma Schymanski 说:“使用立体化学提高了鉴定性能这一事实对所有代谢物鉴定方法的开发人员来说都是一个启示。这种方法也可以用来帮助识别和追踪环境中的微污染物,或表征植物细胞中的新代谢物。”

管控可用于 AI 创新的专用微处理器供应。在这个矛盾丛生、复杂多变的新时代,就让我们从纯技术的角度出发,回顾 AI 科技在 2022 年创造出的那些奇迹。
       一、合成图像已无处不在
       由 AI 生成的图片正广为流传、引发争议,同时也成为新一轮投资的热门去向。
       趋势背景:新一代文本到图像生成器掀起实验热潮,如今普通人也能靠语言描述快速创作出迷人的艺术作品和幻想场景。商业企业迅速将这项技术投入使用,让 AI 图像生成成为图形创作和编辑软件中的又一必备功能。
       关键驱力:凭借友好的用户界面、妙趣横生的输出结果和开放的 API 与模型,媒体生成类模型如今已经成为 AI 技术的“形象代言人”。
       OpenAI 于今年 4 月发布 DALL-E 2,超过 150 万用户参与了这套模型的 beta 测试。到 9 月,DALL-E 2 模型全面开放。微软通过资助 OpenAI 获得了对该成果的独家商业所有权,并迅速将模型集成到 Azure AI 即服务平台当中。
       今年 7 月,各社交媒体平台上出现了大量一键式艺术创作方案,这些略显粗糙的图像背后依托的则是相对简单的 Craiyon。
       Stability AI 很快通过开源模型 Stable Diffusion 将 AI 图像创作推向新高潮今年 11 月,此模型更新为 2.0 版,并最终吸引到超 1 亿美元新资本。
       Adobe 和照片存储业两大巨头 Getty Images 与 Shutterstock,纷纷将图像生成模型集成到自家产品和服务当中。
       此类程序可能根据给出的文本提示生成截然不同的结果。PromptBase 则开辟出新的市场空间,可根据描述生成有趣的文本字符串图形。
       一切都很美,只是:这类模型是根据抓取自网络的图像训练而成。与大语言模型一样,它们也同样继承了线上内容中的偏见和煽动性表达方式。
       Lensa AI 是一款照片编辑应用,可根据用户的自拍照生成“魔法头像”。尽管在移动应用排行榜上迅速蹿红,但其成功也伴随着不少争议不少用户,特别是女性用户,发现该应用会刻意在输出图像中添加性化元素。
       视觉艺术家在线社区 ArtStation 也推出了自己的文本到图像功能。很多艺术家觉得,这种几秒钟内就能模仿艺术家个人风格的计算机程序可能威胁到他们的职业生涯,因此纷纷抵制该网站。
       新闻背后:Diffusion 模型最初的输出结果只能用噪音来形容,但随后会通过一系列步骤有选择地去除低质量内容。由加州大学伯克利分校和斯坦福大学研究人员于 2015 年推出的这套模型经历了数年开发,最终成果表明其已经能够创作出足以匹敌生成对抗网络(GAN)的高水平图像。Stability AI 的 Stable Diffusion 正是以 Diffusion 模型为核心。

       吴恩达在12月25日发布了一年一度的年终盘点,他从纯技术的角度出发,回顾 AI 科技在 2022 年创造出的那些奇迹。在过去的一年,AI 技术取得了巨大进步,生成式 AI 成为新一轮投资的热门去向,人工智能生成的文本、图像甚至是代码已经无处不在。Vision Transformer(ViT)在 2022 年同样迎来爆发式增长,今年之内有超 17000 篇 ViT 论文发布。研究人员突破了语言模型的边界,希望解决可信度、偏见和可更新性等老大难问题。

行业资讯

INDUSTRY INFORMATION

吴恩达:AI 在2022年
创造了这些奇迹

       随着新年的临近,又到了寒冬肆虐的时候。但于 AI 来说,如今的我们绝非身处寒冬,而是热浪席卷的盛夏。
       如今 AI 创造出的大部分经济价值集中在监督学习工具方面,即经过训练即可生成各类短标签(垃圾邮件 / 非垃圾邮件)乃至一系列标签的集合(例如音频转录文本)。今年,建立在监督学习技术之上的生成式 AI 也掀起新一波浪潮,让 AI 得以生成复杂且引人注目的丰富输出,包括自然顺畅的图像或文本段落等。
       虽然强化学习等前一阶段的新工具未能带来与炒作声量相符的成果,但生成式 AI 确实表现良好,也成为 AI 应用领域的又一崭新范例。
       更重要的是,监督学习所发挥的还只是其全部潜力中的一小部分。相信还有数以百万计的监督学习潜在应用尚未成为现实。目前全球无数团队仍在尝试通过监督学习找到产品开发的最佳实践。
       相信在新的一年乃至更久远的未来,生成式 AI 将继续腾飞,为每个人创造更多价值。我有幸能够生活在这个科技飞速发展的时代,也欣慰于有机会参与其中创造未来,更为自己能与各位好友分享这个瞬息万变的世界而高兴不已!
       2022:令人眼花缭乱的 AI 之年
       相信很多朋友正一手端着咖啡,一手跟 ChatGPT 闲聊,想让它为自己的亲朋好友推荐几样新年礼物。回顾这一年,AI 技术无疑取得了巨大进步。无论是目前已经颇有水准的文本、图像和代码生成能力,还是未来即将出现的视频与音乐创作前景,都让用户感到兴奋莫名。
       当然,人们对于 AI 创造力的下一步进展也提出了疑问。一方面,AI 发展让更多化学与物理学模型成为可能,科学发现亦由此迎来又一股助力;而另一方面,政府则开始严格

另一方面,作为基于 GAN 的 DALL-E 的缔造者,OpenAI 也几乎在同一时间用 Diffusion 模型对自家成果进行了更新。
       现状解读:新年中,相信计算机辅助创作革命将继续酝酿蓄力。生成式图像的风潮也绝不会止步于二维平面。谷歌和 Meta 今年都公布了令人印象深刻的文本到视频模型,而 OpenAI 的文本到 3D 对象也将生成速度提升到了新的量级。
       二、程序员的好朋友
       编程助手大显身手,软件项目进度又落后了?别怕,AI 新应用能帮忙。
       趋势背景:事实证明,只要对代码做出微调,语言模型就能很快像经济丰富的开发者那样编写出软件例程……当然,输出质量仍然有待商榷。
       关键驱力:AI 驱动的代码生成器正登陆各大企业,甚至小开发商和非技术人士也能轻松使用。
       今年伊始,Ebay 就尝试将低代码工具交到非工程师的手中,让他们在无需 AI 或机器学习专业知识的情况下构建和部署模型。
       今年 2 月,DeepMind 推出了 AlphaCode。这是一款转换器,接受了 12 种编程语言共 8600 万种程序的预训练,甚至针对编码竞赛的参赛作品进行了调优。在推理阶段,它能生成上百万种可能的解决方案并过滤掉低质量的条目。最终,它在 10 场编码比赛中击败了半数以上的参赛者。
       今年 6 月,GitHub 开放了 Copilot 功能。这是一款能实时提供编码建议的自动补全系统,普通用户须支付订阅费方可使用,但学生和经过认证的开源开发者可以免费访问。
新闻背后:OpenAI GPT-3 语言模型的用户们早在 2020 年就发现,该模型完全可以生成能跑的代码。一年之后,OpenAI 又推出了名为 Codex 的调优版本,这就是如今 GitHub Copilot 的雏形。
       一切都很美,但是:这项技术的公开可用版本还无法编写复杂的程序。而且其输出乍看之下往往正确,但跑起来的结果却是错的。此外,Copilot 项目还身陷法律风险。针对 

GitHub、OpenAI 和微软的集体诉讼认为,Codex 的训练过程违反了开源许可协议。最终判决结果很可能对文本、图像和其他媒体的生成模型产生深远的法律影响。
       现状解读:AI 驱动型编码工具在短时间内还不太可能取代人类程序员,但它们确有可能顶替技术问答网站 Stack Overflow,成为开发者们最喜爱的疑难问询小助手。
       三、AI 之眼也在进化
       Vision Transformer(ViT)在 2022 年同样迎来爆发式增长。
       趋势背景:研究人员们在今年之内发表了超 17000 篇 ViT 论文,它们的共同主题就是:将自注意力与卷积结合起来。
       关键驱力:Google Brain 的一支团队在 2020 年率先推出 Vision Transformer(ViT),此后该架构经历了持续改进。最终的努力让 ViT 获得了适应新任务的能力,同时也解决了不少此前难以克服的短板。
       ViT 能够从海量数据中获得良好学习效果,因此 Meta 和索邦大学的研究人员希望能“仅”靠数百万示例数据集就让模型获得理想性能。他们使用数据增强和模型正则化等源自 transformer 模型的特定改造尝试提高性能。
       韩国仁荷大学的研究人员修改了其中两个关键组件,使 ViT 更像卷积神经网络。他们首先将图像失势成具有更多重叠的小图块,之后修改了自注意力机制以关注每个图块的相邻图块、而非当前图块自身,这样模型就能了解该为相邻图块赋予均匀权重还是选择性权重。这些修改显著提高了模型准确性。
       印度孟买理工学院的研究人员为 ViT 配备了卷积层。由于权重共享,卷积能够在本地处理像素、同时降低内存占用量。在准确性和速度方面,他们的卷积 ViT 也优于常规版本的 ViT 以及 Performer、Nystrformer 和 Linear Transformer 等 transformers 运行时优化方案。这种方法也得到了其他多支团队的采纳。
       新闻背后:虽然不少 ViT 研究的目标在于最终取代卷积神经网络(CNN),但目前的主流趋势显然是将两者结合起来。ViT 的优势,在于它能够从大、小两个尺度考量图像内所有像素间的关系。

但它的缺点是,模型需要额外的训练才能在随机初始化后融入 CNN 架构以进行学习。CNN 的局部上下文窗口(即其中只有局部像素较为重要)和权重共享(使其能够以相同的方式处理不同的图像位置)能帮助 transformers 从较少数据中学习到更多模式。
       现状解读:过去一年来,Vision Transformer 的应用范围得到了极大拓展。ViT 已经能够生成真假难辨的连续视频帧,从 2D 图像序列到生成 3D 场景,并检测点云中的对象。如果没有这些成果,近期大火的 Diffusion 模型恐怕也无法达成如此惊艳的文本到图像生成进步。
       四、语言模型持续扩展
       研究人员突破了语言模型的边界,希望解决可信度、偏见和可更新性等老大难问题。
       趋势背景:虽然不少 AI 实验室都想通过改进数据集和训练方法(包括训练单一 transformer 翻译上千种语言的方法)提升大语言模型的复杂度,但也有一些研究者尝试扩展模型架构,希望借此实现网络搜索、外部文档查询和更强的新信息适应效果。
       关键驱力:如今的语言模型虽然表现出强大的文本生成能力,但在辨别事实、控制“脑洞”和消除社会偏见方面仍然孱弱。研究人员正努力让语言模型的输出更值得依赖,同时减少煽动性。
       2021 年底,DeepMind 提出了 RETRO,一种能从 MassivText 数据集中检索段落、并将其整合至输出中的模型。
       Al21 Labs 于春季推出的 Jurassic-X 引入了一套模块,包含一个计算器加一套维基百科查询系统,能够对语言模型就数学问题、历史事实等做出的回答执行事实验证。
斯坦福大学和洛桑联邦理工学院的研究人员创建了 SERAC,这是一套无需重新训练、即可用新信息更新语言模型的系统。它有一套独立的系统,专门用于存储新数据并学习与之相关的查询结果,借此调整最终输出。
       Meta 构建的 Atlas,是一种能从文档数据库中检索信息以回答问题的语言模型。此方案于今年 8 月发布,参数量仅为 110 亿的 Atlas 在回答问题时表现甚至优于包含 5400 亿参数的 PaLM。
       今年晚些时候,OpenAI 对 ChatGPT 做出调优,以最大限度减少不真实、偏见性或有害性输出。由专人对该模型的训练数据质量进行排名,之后利用强化学习算法奖励模型优先生成与高排名结果相似的输出。
       上述发展趋势,也让人们对语言模型提出了更加微妙且动态的基准要求。为响应号召,130 多家机构在 BIG-bench 项目中展开合作,尝试联手解决通过表情符号推断电影自勉、参与模拟试验和检测逻辑谬误等一系列任务。

       新闻背后:在取得进展的同时,语言模型也闹也不少乱子。Meta 公开展示的 Galactica 是一套可生成关于科学及技术主题文本的语言模型。但在 11 月开放展示短短三天,该模型就由于倾向于生成虚假信息和引用并不存在的来源而遭到关停。今年 8 月,同样来自 Meta 的聊天机器人 BlenderBot 3 则因散布种族主义刻板印象和阴谋论而快速弄臭了名声。
       现状解读:这一年以来,文本生成领域的靠谱工具可谓争相涌现。相信成功的技术将在不久的未来,凭借一鸣惊人的新模型从激烈竞争市场上杀出一条新路。
       五、是否有全能模型
       少数深度学习模型已经证明了自己解决几百种任务的能力。
       趋势背景:过去一年,多任务模型的阵容也在急剧扩大。
       关键驱力:研究人员突破了神经网络所能掌握的技能数量上限。他们的灵感来自大语言模型的新兴技能例如无需架构调整就能创作诗歌加编写计算机程序,而利用文本和图像训练而成的模型也获得了在不同类型数据间找寻对应关系的能力。
       今年春季,谷歌的 PaLM 在涉及语言理解和生成的数百项任务中,展示了小样本学习的最新成果。在某些情况下,其表现甚至优于经过调优的针对性模型或人类的平均水平。
       不久之后,DeepMind 发布了 Gato。其能够处理 600 多种不同任务,包括玩雅达利游戏、用机械手堆积木、生成图像说明等等,而且并不需要借助专用于这些任务的单独模型。该系统同时接受了各种数据集的监督训练,包括文本和图像识别、基于强化学习智能体生成动作等等。
       随着 2022 年接近尾声,谷歌研究人员又为机器人技术带来了类似的普适性能力。RT-1 也是一种 transformers 模型,能够引导机器人执行 700 多项任务。该系统能够将动作和图像令牌化,在近一年半的周期内利用多台机器人收集的 13 万组数据完成了训练。与原有技术相比,它在新任务、新环境和新对象上都表现出了强大的零样本适应性能。
       新闻背后:欧盟拟议的 AI 法案最新草案很可能在 2023 年通过为法律。该法案将要求通用 AI 系统用户向当局注册,由官方评估其系统是否存在潜在滥用行为,并定期接受审计。该草案将通用 AI 系统定义为“执行图像 / 语音识别、音频 / 视频生成、模式检测、问答、翻译等普适性功能”,且“具有多种预期之内 / 之外用途”的 AI 系统。一些观察家批评该定义过于宽泛,相信后续真正具备通用性的新兴模型可能会促使监管机构进一步完善定义内容。
       现状解读:目前能够推广至数百种不同任务的 AI 算法仍处于早期发展阶段。但 2022 年的实际进展,再次表明深度学习具备帮助我们达成这一目标的潜力。

扫一扫关注我们

物端AI芯片  
边缘AI计算设备 高通量AI服务器认知智能与协作计算

Copyright © 2024 陕西妙网网络科技有限责任公司 All Rights Reserved

增值电信业务经营许可证:陕B2-20210327 | 陕ICP备13005001号 陕公网安备 61102302611033号