注册

智研简报2023第1期

智研简报

Sdaict Monthly

智能计算 计算未来

2023年01月第1期 | 总25期

中国 · 济南
山东产业技术研究院智能计算研究院

目录

Contents

春祝福

02

智研大事记

2022年智研院大事记

旧岁已绘万卷秀,新年励志展宏图
新的一年:
祝愿祖国繁荣昌盛、国泰民安!
祝愿大家平安喜乐、万事顺意!
              新年快乐、皆得所愿!

01

智研快讯

团结创新 泛聚智联 计算未来
智研院&泛研院2022年工作总结会

03

政策导读

部门解读|《山东省重点研发
计划管理办法》

04

行业资讯

AI+医疗器械产业发展现状及展望

05

行业资讯

2023年AI十大展望:
GPT-4领衔大模型变革,
谷歌拉响警报,训练数据告急

       总结会上,围绕2022年工作情况和2023年工作计划,研究院全体工作人员分别做述职,讲增量、讲计划、谈经验、谈不足,充分交流了工作经验和规划思路,各位领导认真听取大家的工作总结报告,并对工作情况进行了点评和总结。
       翻开2022年的“成绩单”,可以看到,研究院在科研项目、成果转化、产业落地三大方面创优创新创效,以实际成绩彰显了省级新型研发机构“优等生”的行动自觉,2022年研究院以“创新研发促进产业转化”为定位,积极开展智慧医康养、智慧心理、人工智能等领域技术研发与成果转化,提供公共服务,构建产业生态,取得一批突破进展。

       2023年1月11日—12日上午,山东产业技术研究院智能计算研究院和济南中科泛在智能计算研究院2022年度工作总结会议顺利举行,本次会议以”团结创新 泛聚智联 计算未来“为主题,总结回顾研究院2022年工作进展,研究谋划2023年工作思路及重点工作,推动研究院更好更快发展。
       会议由中科院计算所泛在计算系统研究中心副研究员、山东产业技术研究院智能计算研究院副院长杨晓东主持,中科院计算所所务委员、济南中科泛在智能计算研究院院长、山东产业技术研究院智能计算研究院院长陈益强,洛阳理工学院计算机与信息工程学院院长石念峰,中科院计算所泛在计算系统研究中心副研究员、洛阳中科信息产业研究院副院长李淳芃以及两院全体成员参加会议。

团结创新 泛聚智联 计算未来
智研院&泛研院2022年度工作总结会

智研快讯

NEWSLETTERS

      陈益强院长在会议总结中充分肯定了研究院2022年取得的工作成绩,他指出,当前研究院已经进入产业化发展的”快车道“,2023年是全面贯彻落实党的二十大精神的开局之年,对研究院的发展意义重大,为此他提出了三点殷切希望与要求:一是要更进一步提高站位。通过学习党的二十大,我们要深刻思考如何实现中国式现代化也是人口规模最大的现代化,我们要面向人工智能领域抓住智慧医养的应用场景,思考如何将普适化设备达到医疗级的服务水平,解决医疗分级体系的难点问题,为国家老龄化注入科技力量;二是要聚焦创新。唯有创新才能实现人口规模最大的现代化,要通过在人工智能领域的创新来提升生产力的效率,推动经济更大的发展;三是强化成果转化的效果。解决科研成果到产业应用的“最后一公里”,需要技术发展和市场需求“两张皮”,抓住载体、途径、团队向转化要效益,通过落实激励政策进一步强化成果转化效果,以此来推动我们价值的实现,为解决人口规模最大的现代化提供我们自己的解决方案。
       1月11日下午工作总结会议结束后,研究院举行了2023新春年会,研究院全体员工欢聚一堂,共享联欢。
       2023年,让我们只争朝夕不负韶华,以更加高昂的斗志,继续前进。

       石念峰院长表示研究院积极突破传统模式,寻求创新思路的管理方法和运营模式使他受益颇多,未来希望通过加强双方沟通,集聚AI技术与人才培养,以新思路、新方法,构建长期稳定的合作交流及协同创新平台。
       李淳芃副院长指出研究院亮眼的“年终答卷”彰显高质量发展“成色”,同时也为洛阳中科信息产业研究院的未来发展提供了新思路。新型研发机构的发展要真实面向区域产业数字化转型重大需求,加深创新链、产业链和资金链的深度融合,以更多优秀企业的孵化以及技术成果的转化促进自身发展,更好地服务政府、服务行业、服务社会。

政策导读
部门解读 | 《山东省重点研发计划管理办法》

       为进一步规范山东省重点研发计划(以下简称省重点研发计划)管理,强化使命导向、有组织科研,根据《山东省人民政府关于加快推进新时代科技强省建设的实施意见》(鲁政字〔2022〕225号)、《山东省人民政府办公厅关于改革完善省级财政科研经费管理的实施意见》(鲁政办发〔2022〕6号)等文件要求,省科技厅修订印发了《山东省重点研发计划管理办法》,现将有关情况解读如下。

       一、修订背景
       近年来,党中央、国务院对科技管理体制改革作出一系列战略部署。党的二十大报告指出,要集聚力量进行原创性引领性科技攻关,坚决打赢关键核心技术攻坚战。省委、省政府高度重视科技创新工作,我省在全国率先成立了由省委书记、省长任主任的省委科技创新委员会,整合设立了每年不低于120亿元的省级科技创新发展资金,充分发挥集中力量办大事的制度优势,组织实施重大科技攻关项目。
       重点研发计划是省级科技计划体系的重要组成部分,是围绕“四个面向”,支持前沿交叉和颠覆性技术研究、共性关键技术研究和应用示范,以及前瞻性对策分析和实证研究的专项计划。近年来,省科技厅围绕重点研发计划进行了一系列改革探索。在专项任务组成上,取消了公益类项目,新增了科技示范工程、农业良种工程等任务。在资金管理上,修订了《山东省重点研发计划资金管理办法》。在项目组织模式上,在全国率先启动实施科技示范工程,“揭榜制”“赛马制”等多种项目组织模式日益完善。
       目前,重点研发计划在专项任务组成、资金管理、项目组织方式等方面相较以往有了明显变化。2017年出台的《山东省重点研发计划管理办法》(鲁科字〔2017〕185号,以下简称《管理办法》)已不适应当前管理需要。为进一步固化改革成果,加强和规范重点研发计划管理,省科技厅结合工作实际,对《管理办法》进行了修订。
       二、文件主要内容
       《管理办法》由9章47条修订为6章35条。
       (一)总则。重新阐述了重点研发计划的定义,更新了专项任务组成、项目组织方式,明确了省科技厅、项目主管部门、项目承担单位、专业机构等职责权限。
       (二)项目申报与立项。明确项目指南应采用“自下而上”和“自上而下”相结合的原则编制。取消项目负责人年龄、工作时间限制,将参与单位范围扩大到海内外创新主体。
       (三)组织实施与过程管理。将技术路线、参与人员等事项调整权下放到项目承担单位和项目负责人。明确省科技厅可采取项目承担单位自评、抽查等方式组织开展项目年度绩效评价。
       (四)综合绩效评价(验收)与成果管理。明确项目执行期满后,由省科技厅组织开展项目综合绩效评价和验收。实行验收考核指标和绩效评价指标分类评价制度,验收考核指标须全部完成,绩效评价指标采取定量评分与定性评价相结合的方式进行评价。明确项目研究成果界定标准。
       (五)监督管理。对省重点研发计划监督评估、科研诚信管理提出原则性要求。监督管理按照《山东省科技计划项目监督管理办法》(鲁科字〔2021〕97号)有关规定执行。科研诚信管理按照《科学技术活动违规行为处理暂行规定》(科学技术部令第19号)、《科研失信行为调查处理规则》(国科发监〔2022〕221号)、《山东省科技计划项目科研诚信管理办法》(鲁科字〔2020〕105号)有关规定执行。
       (六)附则。《管理办法》解释权限归省科技厅,涉及资金使用、管理等事项,按照《山东省重点研发计划资金管理办法》相关规定执行。

       中国AI+ 医疗器械市场起步较晚,目前市场仍处于早期阶段。近年来,中国AI医疗器械的市场高速发展,市场规模增速较快,从2019年的1.25亿元人民币大幅增加至2021年的6.82亿元,预计在2024年增长至87.16亿元,3年的复合增长率高达133.9%。
                                        图:我国AI+ 医疗器械市场规模(亿元)
       融资事件数量缓慢下降,自19年起融资金额逐渐回升。全球AI+ 医疗器械产业领域2016年实现融资9.7亿美元,完成融资事件62起。随后两年,AI+ 医疗器械领域融资事件和金额均显著增长,2018年达到峰值,融资金额达到20.1亿美元。但在2019年,随着金融资本寒冬的到来,AI+ 医疗器械融资金额和数量均明显下降。2020年,伴随着医疗器械领域三类证颁发,行业重心由研发转向商业化落地等因素的影像,AI+ 器械领域投融资再度增加;2021年,全球AI+ 器械领域共产生58起融资,融资总额为17.33亿美元。
       我国AI+ 医疗器械行业投融资情况逐步回升。自2016年起,我国AI+ 医疗器械行业投融资金额达到3.6亿元,在2017、18年达到顶峰,AI+ 医疗器械投融资金额达到13.7亿元。在2019年,AI+ 医疗器械行业投融资出现断崖式下跌,跌至4.9亿元,随着后疫情的时代的来临以及资本信心的逐步恢复,AI+ 医疗器械行业投融资金额逐步回升,已达到2021年的12.1亿元。
                              图:2016-2021年我国AI+ 医疗器械行业投融资情况

       AI+ 医疗器械是指采用人工智能技术的医疗器械,包括人工智能独立软件和人工智能软件组件等。其在辅助治疗、医学影像处理等领域的应用愈发广泛,已成为未来医疗器械行业发展热点赛道之一。新一代人工智能技术的兴起,为医疗行业实现智能化转型提供了新的思路和手段,也为医疗器械产业发展带来了重大机遇。我国人工智能医疗器械产业发展势头迅猛,人工智能医疗器械产业生态已经基本形成,面向未来,AI+ 医疗器械的商业化必将取得突破性进展。

行业资讯

INDUSTRY INFORMATION

AI+医疗器械产业发展
现状及展望

       一、AI+ 医疗器械市场情况分析
       人工智能医疗器械市场前景广阔。人工智能技术为器械行业发展带来重大机遇。一方面,人口老龄化、慢病低龄化等趋势导致人民群众的医疗健康需求持续攀升,人工智能医疗有利于缓解医疗资源供需不平衡等问题,为医疗行业转型升级提供了关键思路。另一方面,我国高端医疗器械产业长期以来存在部分关键工艺技术受制于人、整机制造组装水平相对较低等问题,推动人工智能技术嵌入到高端医疗器械中,提升控制、成像等系统的智能化程度,能够加快产品的升级换代与性能提升,有助于推动产业实现跨越式发展。
       从全球范围来看,AI+ 医疗器械市场规模从2016年的8650万美元增长至2021年的5.06亿美元,复合增长率为42.4%,预计2024年增长至34.96亿美元,未来3年复合增长率为118.5%。
                                      图:AI+ 医疗器械领域市场规模(亿美元)

       人工智能医学影像赛道投融资逐渐冷却,AI医学影像企业竞争加剧。2019年-2022年,人工智能医学影像企业投融资逐渐冷却,企业开始将问题聚焦与如何优化产品,基础数据质量提升、算法的不断改进优化以及大量的科研合作,使得人工智能影响产品逐渐被医院端接受和认可。随着人工智能医学影像的临床价值逐步被认可,进入了比拼产品以及商业化能力的阶段,企业间的竞争将更加激烈。
       人工智能医学影像软件产品获批三类器械主要集中在心血管、骨骼、眼底、肺部等领域。截至2022年8月31日,NMPA共批准了45个医疗AI辅助诊断软件上市,其中涵盖CT、MR、DR等相关影像设备、为心血管疾病、胸部疾病、眼底、骨科疾病及儿童生产发育评估、肺部等提供AI辅助诊断。
                    图:2020-2022年NMPA在人工智能医学影像三类证的批证情况
                                 图:2020-2022年AI医学影像三类器械获批情况
       AI机器人中国手术机器人行业发展迅猛近5年市场规模年平均复合增长率逾30%。目前仍处于发展初期的手术机器人行业,技术、研发和时间成本依旧高昂;且离不开政策和资本的支持。相关企业应抓住国家大政方针支持产业的机会,努力解决当前发展中面临的问题。在资本方面,当下,国内手术机器人行业投融资明显加快。据统计,投融资数量大幅增加,整个赛道总融资金额超过30亿元人民币。在投资界看来,从学术和临床两方面,手术机器人都获得了高度关注,并且体现出一定的卫生经济学价值,未来5-10年,手术机器人应该会越来越被市场所认可。

       二、AI+医疗器械应用场景
       在应用场景方面,医学影像是AI在医疗领域应用最多且最成熟的场景。我国一年医学影像的检查量超过75亿人次,2021年我国医学影像市场规模达到523.7亿元,预计2022年有望达到577.6亿元。庞大的检查量带来的是影像数据的快速增长,目前影像数据的年增长率达到30%,而同期放射科医生的年增长率仅为4%,形成较大的供给缺口。放射科医生的短缺造成误诊率偏高,医学影像数据可获得性较强、易标注、标准化程度相对较高等特点,大大降低了AI的应用门槛。因此,医学影像成为AI目前的主要应用市场。
       对于AI+医疗器械重点应用场景主要分为以下几个方面:
       阻肺急性加重院外监测。及早识别慢阻肺急性加重高风险患者、从而开展个体化干预有助于改善临床结局。通过可收集的患者信息与急性发作情况结合建模,建立急性加重风险AI预测模型与院外监测模型,对慢阻肺患者未来的急性发作提前预警。
       癌症影像AI辅助判读。在肺癌领域,通过AI辅助实现癌症检出、良恶性分析以及定量分析等功能,对于医生在大规模筛查时快速、准确的判断患者病情有重要意义。在乳腺癌领域,乳腺超声辅助AI为乳腺癌超声筛查提供更高的诊断准确率和诊断效率,助力乳腺癌的早筛早诊。
       CT筛查慢阻肺。肺功能检查是慢阻肺诊断金标准,由于基层肺功能仪普及率低、肺功能检查对患者配合度要求高等多方面的因素,导致患者被漏诊、误诊,错失最佳干预时间。影像AI技术已广泛应用于肿瘤和心脑血管疾病的诊断和评估。
       三、AI+医疗器械产业细分领域发展情况
       在中国AI医疗发展中,AI医学影像是最热门的应用领域,是其主要的应用场景是医疗健康和大健康中,两种场景下增速较高,未来五年AI医学影像整体市场规模预计复合增速达102.4%。AI医学影像应用多以单一疾病入手,以单纯图像训练为主,从落地应用来看,以肿瘤和慢病领域为主,其中肺结节和眼底筛查是目前企业布局最多的两个疾病领域,乳腺癌也是热门领域之一。
                                            图:AI医学影像的疾病应用领域

       AI辅助诊疗以单病种切入为主,应用集中在肿瘤领域。AI辅助诊断是基于海量医疗数据与人工智能算法,利用认知计算、深度学习、计算机视觉等技术发现病症规律,为医生疾病诊断与制定治疗方案提供辅助。
                                               图:AI辅助诊断系统构建
       四、AI+医疗器械未来发展方向
       以深度学习为代表的新一代人工智能技术将赋能医疗器械领域。目前,人工智能医疗器械主要应用于疾病的诊断、治疗、监测、康复等多个领域,在辅助决策、医学数据处理、健康管理等方面崭露头角。2020年起,采用深度学习技术的医疗器械产品陆续获批上市,基于新一代人工智能技术的医疗器械正加速进入临床应用,人工智能医疗器械迈入商业化阶段,其临床价值日渐凸显。
       人工智能医疗器械产业生态已经基本形成。传统医疗卫生行业是数据资源的提供方,新一代人工智能算法研发企业与医疗信息化、医疗器械企业共同主导产品研发,赋能传统医疗卫生行业,形成产业生态闭环。随着技术的提升和应用的深入,目前已经发展出几大典型产品,包括智能辅助诊断产品、智能辅助治疗产品、智能监护与生命支持产品、智能康复理疗产品、智能中医诊疗产品。
       人工智能技术瓶颈有待进一步突破。一方面,现有医疗数据体量难以支撑人工智能进行充分学习,人工智能技术在小数据场景下的应用成效仍然不尽如人意。另一方面,很多医疗人工智能算法缺乏在医学上的可解释性,患者在就医时无法了解诊断决策背后的依据,影响对医生的信任度及后续的治疗效果,一定程度上导致人工智能在医疗行业中的应用比在其他行业面临更大的质疑与担忧。
摘自:火石创造

       新年伊始,大模型的话题热度不减。2022年11月底,展现的惊人能力将大模型研究和应用热度推向高潮,人们激烈讨论着这个高级“物种”的推出意味着什么,比如是否会颠覆搜索引擎市场格局。踏入2023年,这不禁让我们对GPT-4的发布充满遐想,它会比ChatGPT更上一层楼吗?会有哪些不一样的惊喜?
       岁末年初之际,科技圈的年度盘点不胜枚举,相关技术预测倒是不多。本文作者Rob Toews发布了2023年AI发展的十大预测,整体来看,大部分预测都离不开“大模型”这个关键词,具体分析也有其道理。当然,其中的文生图、人形机器人等领域的发展也举足轻重。2023,让我们拭目以待。
       1、重磅事件:GPT-4将在年初发布
       GPT-4是OpenAI的新一代生成语言模型,它有着强大的功能,最近到处流传着它的消息。
       GPT-4预计将在2023年年初发布,相较于GPT-3和3.5,GPT-4的性能有着跳跃式的提升。尽管最近有关ChatGPT的讨论正在火热朝天地进行,但相比GPT-4,这只是前奏而已,让我们拭目以待!
       

行业资讯

INDUSTRY INFORMATION

2023年AI十大展望:
GPT-4领衔大模型变革,
谷歌拉响警报,训练数据告急

       GPT-4 会是什么样子的呢?与人们的直觉不同,我们预测它不会比其前身GPT-3大太多。在今年早些时候发表的一篇有影响力的研究论文(https://arxiv.org/pdf/2203.15556.pdf)中,DeepMind研究人员称现在的大型语言模型实际上比本来应该有的大小还要大。为了能在给定的有限计算预算中获得最佳模型性能,现在的模型应该用更少的参数在更大的数据集上进行训练。也就是说,训练数据比模型大小重要。
       当今大多数主要语言模型都是在约3000亿个token的数据语料库上训练的,比如说OpenAI的GPT-3(1750 亿个参数)、AI21 Labs的Jurassic(1780 亿个参数)和微软/英伟达的Megatron-Turing(5700 亿个参数)。
       我们预测,GPT-4的数据集要比上面提到的大一个数量级,也就是说它可能在10万亿个token的数据集上进行训练。同时它的参数将比Megatron-Turing的要少。
       据说,GPT-4有可能是多模态的,除文本生成之外,它还可以生成图片、视频以及其他数据类型的输入。这意味着GPT-4能够像DALL-E一样根据输入的文本提示词(prompt)生成图像,或者是可以输入视频然后通过文本的形式回答问题。
       多模态GPT-4的发布可能是一个重磅消息。但是它更可能和以前的GPT模型一样是纯文本模型,它在语言任务上的表现将重新定义SOTA。具体来说GPT-4会是什么样的呢?那就是它在记忆(保留和参考前期对话信息的能力)和摘要(提取和精简大规模文本的能力)这两个语言领域的性能会有跨越式提升。
       2、训练大型语言模型将逐渐开始耗尽数据
       数据是新时代的石油这种说法早就已经是陈词滥调了,但这样说还不足以表明数据的重要性:因为石油和数据都是有限的,都有消耗殆尽的一天,在AI领域,语言模型对数据的需求量最大,数据耗尽的压力也更大。
       正如前面提到的,DeepMind的Chinchilla work等研究已经表明,构建大型语言模型(LLM)最有效的方式不是把它们做得更大,而是在更多的数据上对其进行训练。
但是世界上有多少语言数据呢?更准确地说有多少语言数据达到了可以用来训练语言模型的要求呢?实际上,现在网络上大多数的文本数据并没有达到要求,不能用来训练大型语言模型。
       对于这个问题,我们很难给出确切的答案,但是根据一个研究小组( https://arxiv.org/pdf/2211.04325.pdf )给出的数据,全球高质量文本数据的总存量在4.6万亿到17.2万亿个token之间。这包括了世界上所有的书籍、科学论文、新闻文章、维基百科、公开代码以及网络上经过筛选的达标数据,例如网页、博客和社交媒体。最近的另一项研究数据(https://www.lesswrong.com/posts/6Fpvch8RR29qLEWNH/chinchilla-s-wild-implications )显示,数据总数大约为3.2万亿个token。

       DeepMind的Chinchilla模型是在1.4万亿个token上训练的。也就是说,在这个数量级内,我们很有可能耗尽世界上所有有用的语言训练数据。这可能成为人工智能语言模型领域持续进步的一大障碍。许多前沿AI研究人员和企业家私下里都对此忧心忡忡。
       随着研究人员开始寻求解决数据短缺这一迫在眉睫的问题,预计2023年对这方面的关注度会增加。针对这一问题,合成数据是一种可能的解决方案,尽管该如何操作这一方法还未可知。还有另一种可能的方法,那就是系统性地转录会议上的讲话,毕竟口头交流代表着还有大量未捕获的文本数据。
       作为世界领先的LLM研究机构,人们十分好奇OpenAI在其即将发布的GPT-4研究中会如何应对这一挑战,同时,大家也期待着可以获得一些启发。
       3、一些消费者开始将完全自动驾驶作为日常出行模式
       在多年预热炒作却一再失信之后,最近自动驾驶汽车领域出现了一些少有人注意的新变化:真正的无人驾驶汽车时代已经悄悄来临。
       现在在旧金山,你可以下载Cruise应用程序(这个程序和Uber或Lyft的APP差不多),通过这个APP你可以叫到真正的没有司机辅助的无人驾驶汽车带你在街道上穿行。
       目前,这些无人驾驶汽车仅在夜间服务,服务时间是晚上22:00点到早上5:30,但是Cruise已经准备好了要在旧金山提供全天候服务,这个计划预计将在几周后实行。另一边Cruise的竞争对手Waymo紧跟其后,也开始在旧金山投放无人驾驶汽车。
       2023年,人们将快速习惯robotaxi服务,作为一种方便、可行的交通服务方式,人们一开始会感到新颖、奇怪,然后会快速习惯robotaxi的存在,直到司空见惯。街道上无人驾驶汽车的数量和使用它们的人数将会激增。简而言之,无人驾驶汽车即将进入商业化和规模化阶段。
       无人驾驶汽车的推广将以城市为单位,逐个进行。在旧金山的基础上,来年可能会新增至少两个面向公众投放无人驾驶汽车的美国城市。比较理想的候选城市有凤凰城、奥斯汀、拉斯维加斯和迈阿密。
       4、AI绘画工具Midjourney将筹集风险投资资金
       OpenAI的DALL-E,Stability AI(和其他贡献者)的Stable Diffusion和Midjourney是目前最著名、最有影响力的三个文生图的AI平台。
       2019年,OpenAI从微软处获得了10亿美元的投资,并且目前正在商讨筹集更多资金。几个月前,Stability AI获得了1亿美元的投资,而且已经开始寻求更多投资。
       相比之下,Midjourney没有任何外部投资。不过,Midjourney的用户和发展速度增长极快,目前为止,它拥有近600万用户和相当可观的收入。但是其网站显示Midjourney仍然是一个“小型自筹资金”组织,只有11名全职团队成员。

       大卫·霍尔茨(David Holz)是Midjourney的创始人兼首席执行官,他曾是Leap Motion的联合创始人兼首席技术官,Leap Motion曾是一家飞速发展的虚拟现实创业公司,这家公司在2010年代筹集了近1亿美元的风险投资,之后公司发展状况迅速恶化,最终被收购。据称这段失败的经历让霍尔茨拒绝接受外部资金。到目前为止,Midjourney已经拒绝了很多投资者。
       然而,面对公司的迅猛发展、激烈的竞争以及大量的市场机会,我们推测霍尔茨将在2023年开始为Midjourney筹集投资。否则,Midjourney将快速在这场由其引发的生成式人工智能淘金热中落伍。
       5、谷歌作为主流搜索引擎的地位将面临挑战
       搜索引擎是现代互联网体验的核心,是我们浏览和访问数字信息的主要方式。现在的大型语言模型可以进行复杂级别的读和写,这在几年前几乎是不可思议的,这会对我们的搜索方式产生深远影响。
       在ChatGPT出现之后,重新定义搜索的对话式搜索(conversational search)引起了人们的广泛注意。对话式搜索让我们可以与AI智能体进行动态对话以找到要查找的内容,不用再像传统的搜索引擎一样先输入要查询的内容,然后返回一长串链接,比如现在谷歌搜索的做法。
       对话式搜索具有广阔的发展前景,但是它还有一个亟待解决的大问题,那就是搜索结果不够准确,只有解决了这个问题,对话搜索才能发展起来。目前对话式LLM的准确性还不够,因为它们有时会给出与事实不符的信息。
       最近OpenAI首席执行官Sam Altman称,“现在在重要的事情上,我们还不能依赖ChatGPT”。大多数用户也不会接受不能百分百保证结果准确的搜索引擎,即使它的准确率可以达到95%甚至99%。2023年,研究人员面临的主要挑战之一就是,以一种可扩展且稳健的方式来解决这个问题。
       一批发展势头良好的初创公司正在对谷歌的搜索引擎发起挑战,它们希望通过LLM和对话界面重塑消费者的搜索方式,比如You.com,Character.AI,Metaphor 和Perfucity等公司。
       但是,LLM不仅仅只是会改变消费者的互联网搜索方式,它还会改变其他搜索类型。
       比如企业搜索(组织搜索和检索私有数据的方式)同样也处于新黄金时代的风口浪尖。由于大规模矢量化的出现,LLM首次实现了真正的语义搜索:它能够根据基本概念和上下文而不是简单的关键字来索引和访问信息。这将使企业搜索更加强大和高效。像Hebbia和Glean这样的初创公司正在使用大型语言模型引领改变企业搜索的潮流。
       下一代搜索引擎将不仅限于文本。人工智能的最新进展为多模态搜索提供了新的可能

性:即跨数据模式查询和检索信息的能力。
       因为视频占据了互联网数据总量的80%左右,所以视频搜索代表了最大的发展机会。想象一下,如果我们可以轻松且准确地搜索视频中的某个片段、某个人、某个概念或者某个动作,这将是什么样的局面?Twelve Labs是一家初创公司,它构建了一个多模态AI平台,以实现精细化的视频搜索和理解。
       自谷歌在互联网时代崛起以来,搜索领域就几乎没怎么发生过变化。2023年,有了大语言模型,该领域将发生巨变。
       6、开发人形机器人将吸引大量注意力、人才以及资金,2023年将有几个新的人形机器人项目启动
       人形机器人可能是好莱坞电影对AI进行夸张化的极端代表,比如说电影 《机械姬》和《我,机器人》。人形机器人发展迅速,并逐渐成为现实。
       为什么要打造人形机器人呢?原因很简单,因为我们现实世界的大部分架构都是为了人类而打造,如果我们想利用机器人在工厂、购物中心、办公室和学校这样的场所自动完成复杂活动,最有效的方法就是让机器人拥有和人类一样的外形。这样,机器人就可以应用到多种场景中,且无需适应周围环境。
       今年9月,特斯拉在人工智能日推出了擎天柱(Optimus)机器人,这大大推动了人形机器人领域的发展。埃隆·马斯克表示,擎天柱最终会比汽车业务更有价值。然而,擎天柱机器人要想完全成熟,还任重而道远 。但是,当特斯拉将所有资源都投入到优化擎天柱这项任务时,能够取得的进展是无法估量的。
       同样地,许多具有发展前景的初创公司也推动着人形机器人领域的发展,包括Agility robotics、Halodi robotics、Sanctuary AI以及Collaborative robotics。
随着人形机器人产业竞争愈演愈烈,预计2023年会有更多的公司加入到这场角逐中,包括       初创企业和一些知名公司(如丰田、三星、通用汽车、松下)。这类似于2016年的自动驾驶汽车,当越来越多的人开始意识到汽车行业拥有巨大的市场机会时,次年将会有大量人才和资本涌入该领域。
       7、MLOps的新版本:LLMOps将登台亮相
       当某种新的技术平台出现时,相应的需求和机会也会随之出现,比如说用以支持新平台的工具和基础设施。风险投资家们通常把这些辅助工具视为“镐头和铲子”(以迎接即将到来的淘金热)。
       近年来,初创企业界最热门的当属广为人知的MLOps机器学习工具。初创公司开始一蜂窝地研究MLOps,并以令人咋舌的估值筹集到大量资金:Weights & Biases(获得2亿美元融资,平台估值达10亿美元)、Tecton(获得1.6亿美元融资)、Snorkel(获得1.38亿

美元融资,平台估值达10亿美元)、OctoML(获得1.33亿美元融资,平台估值达8.5亿美元)等等。
       如今,我们目睹了新一代人工智能技术平台——大型语言模型(LLMs)的问世。与预训练语言学习模型(pre-LLM)相比,大型语言模型具有独特的工作流程、技能组件和发展潜能,代表了人工智能的新范式。通过API或者开源,人们可以很容易获得大量预训练模型,这完全改变了人工智能产品。因此,注定会出现一套新的工具和基础设施。
       我们预测LLMOps将成为新的流行趋势,它代表着新一代人工智能的镐头和铲子。以新一代LLMOps产品为例,包括基础模型微调工具、无代码LLM部署、GPU访问与优化、提示词实验、提示词链以及数据合成与数据增强。
       8、基于或引用AlphaFold的研究项目数量将会激增
       2020年底,DeepMind公司首次推出了AlphaFold平台,破解了生命的一大谜团:即蛋白质的折叠问题。AlphaFold能够仅从蛋白质的一维氨基酸序中准确地预测出蛋白质的三维形态。这是一个里程碑式的成就,解决了困扰研究人员几十年的问题(AlphaFold代表了人工智能历史上最重要的成就)。
       因为蛋白质是地球上所有生物进行重要活动的内在基础,对蛋白质的结构和功能了解得越透彻,就越能为生物学和人类健康提供新的可能。不论是从开发救生疗法(life-saving therapeutics),到改善农业,还是从对抗疾病到研究生命起源,蛋白质存在于生活中的方方面面。
       DeepMind于2021年7月开源了AIphaFold,并推出了一个数据库,它包含350,000种三维蛋白质结构(作为参考,在推出AlphaFold之前,人类已知的蛋白质结构大约有180,000种)。此外,几个月前,DeepMind公布了另一个包含2亿种蛋白质结构的数据库——这几乎覆盖了所有科学上已知的蛋白质。
       DeepMind最新版本发布短短几个月后,就有来自190多个国家的50多万名研究人员使用AlphaFold平台,用它查看了200万种不同的蛋白质结构。但这仅仅只是开始。AlphaFold的巨大突破所带来的影响需要好几年才能逐渐展现出全貌。
       到2023年,预计基于AlphaFold的研究数量将会激增。研究人员将利用这一庞大的新型基础生物学知识宝库,将其应用于新型疫苗、新型塑料研发等多个跨学科领域,进而改变世界。
       9、DeepMind、Google Brain和OpenAI将致力于为机器人构建基础模型
       去年,斯坦福大学的一个研究团队提出了“基础模型”(foundation model)一词,它是指基于大量数据训练的大规模人工智能模型。该模型的构建并不是为了执行特定任务,而是为了能有效执行各种不同活动的任务。

       基础模型一直是人工智能最新发展的关键驱动力。如今,基础模型非常强大。但无论是GPT-3这样的文本生成模型,还是Stable Diffusion这样的文本转图像模型,又或是Adept这样的计算机操作(computer actions)模型,均只能运用于数字领域。
       AI系统在真实世界的应用随处可见,例如自动驾驶汽车、仓库机器人、无人机、人形机器人等等,但到目前为止,它们大多还未受到基础模型新范式的影响。
       这种情况将在2023年发生变化。预计用于机器人的基础模型这一早期开创性工作,将由世界领先的人工智能研究机构DeepMind、Google Brain和OpenAI完成(尽管OpenAI去年退出了机器人研究)。
       构建用于机器人的基础模型意味着什么?换句话说,构建物理世界的基础模型意味着什么呢?从高层次来看,这样的模型可以用不同传感器模式(如相机、雷达、激光雷达)的大量数据进行训练,以产生对物理和现实世界物体的普遍理解能力:比如这些不同的物体是如何移动的、它们之间如何相互作用、它们有多重、多脆弱、多柔软、多灵活以及当你触碰、投掷或者扔它们的时候会发生什么。这种“真实世界的基础模型”可以针对特定的硬件平台和特定的下游任务进行微调。
       10、美国将投资数十亿美元建设本国芯片制造设施
       人工智能和人类智能(human intelligence)一样同时依赖于硬件和软件设施。先进半导体对推动现代人工智能而言至关重要。到目前为止,影响最大、应用最为广泛的是英伟达的GPU;像AMD、因特尔以及一些研究人工智能芯片的新兴企业也试图跻身芯片市场。
几乎所有的人工智能芯片都是由美国设计,并在台湾完成制造。并且全球最先进的芯片几乎都是由台积电(TSMC)这家公司生产的,包括英伟达的GPU。
       由于中美地缘政治的紧张局势,为了降低人工智能硬件瓶颈的不确定性,降低对台湾的依赖,2023年,美国政府将加大激励措施并对在美建设先进芯片制造设施的工厂给予补贴。而今年夏天通过的《芯片与科学法》(The CHIPS and Science Act)则为此提供了立法动力和预算资源。
       这一进程已经开始。两周前,台积电宣布将投资400亿美元在亚利桑那州建立两家新的芯片制造厂(美国总统拜登亲自访问了亚利桑那州的工厂选址,对其称赞不绝),更重要的是,新台积电工厂预计将于2026年开始运行,生产3纳米芯片,该芯片将成为当今世界最先进的半导体。
       随着美国开始在国内寻找生产基地以化解关键人工智能硬件所面临的风险,预计2023年将看到更多这样的承诺。
                                                                                                           摘自:人工智能学家

电话:0531-88287262 
官网:www.sdaict.ac.cn地址:济南市高新区旅游路8661号

Copyright © 2024 陕西妙网网络科技有限责任公司 All Rights Reserved

增值电信业务经营许可证:陕B2-20210327 | 陕ICP备13005001号 陕公网安备 61102302611033号