注册

智研简报2023第3期

智研简报

Sdaict Monthly

智能计算 计算未来

2023年03月第3期 | 总27期

中国 · 济南
山东产业技术研究院智能计算研究院

CONTENTS

目录

面向“政产学研金服用”,打造研究机构与企业间体系化、标杆化及标准化合作模式

01

智研快讯

智研院党支部、工会组织开展义务植树、红色教育活动

详解科技部“人工智能驱动的科学研究”专项部署工作

陈益强院长受邀参加济南市政协十五届常委会第七次会议并作专题讲座

04

05

02

清华可穿戴智能喉登Nature子刊,实测准确率90%+

技术前沿

06

智研院智能计算公共实训基地荣获2022年济南市先进制造业和数字经济领域公共实训基地奖励

03

春风十里,芳华如你——智研院工会庆祝"三八"国际劳动妇女节

行业资讯

       2023年2月22日下午,济南市政协十五届常委会第七次会议召开。市政协主席雷杰出席会议并讲话。
       雷杰指出,今年是全面贯彻落实党的二十大精神的开局之年,是加快新时代社会主义现代化强省会建设的关键之年。全市各级政协组织、广大政协委员要进一步提高政治站位,以昂扬的精神状态和务实的工作举措,高质量完成年度各项履职任务,不断开创全市政协事业发展新局面,努力为强省会建设凝聚智慧力量。
       雷杰强调,要加强理论武装,深入学习贯彻党的二十大精神,做到学深悟透笃行,深刻领悟“两个确立”的决定性意义,坚决做到“两个维护”。认真学习政协理论,不断提高履职本领,以学习增进思想共识、引领工作实践,促进政协事业发展。要扎实履职尽责,锚定“勇当排头兵、建设强省会”目标,发挥政协优势,围绕全市经济社会发展重要问题深入调查研究,积极建言献策,广泛凝聚共识。不断加强专门协商机构建设,完善委员联系界别群众制度机制,持续擦亮“商量”协商民主品牌。要强化自身建设,进一步加强政协组织党建工作,持续改进工作作风,严守纪律规矩,永葆清正廉洁的政治本色。

陈益强院长受邀参加
济南市政协十五届常委会第七次会议
并作专题讲座

智研快讯

NEWSLETTERS

AI大战太凶猛!微软、谷歌、
英伟达、Adobe杀疯了

07

       近日,济南市工业和信息化局公示了2022年济南市先进制造业和数字经济领域公共实训基地奖励名单,智研院智能计算公共实训基地被列入其中。
       济南市先进制造业和数字经济领域公共实训基地是为贯彻落实《关于加快建设工业强市的若干政策措施》(济办发﹝2021﹞6 号)文件精神,进一步加强济南市高技能人才队伍培养,推动济南市经济高质量发展,对实训基地的实训场地、培训设备、培训理念、实训方向、实训项目、师资条件等方面都有一定的要求。

智研院智能计算公共实训基地
荣获2022年济南市先进制造业和
数字经济领域公共实训基地奖励

智研快讯

NEWSLETTERS

       会议还审议通过了有关人事事项。
       市政协副主席王京文、王伯芝、赵居安、刘勤、王建森、刘霞,省管副厅级干部董杰、吕凤华、李兴实参加会议。

       会上,中科院计算所研究员、山东产业技术研究院智能计算研究院院长陈益强受邀进行了“AI赋能数字经济”专题讲座。

       智研院于2020年9月12日成立了智能计算公共实训基地,是为服务《新一代人工智能发展规划》国家战略,整合人工智能产业资源,培养山东十强产业发展需求的人工智能领用实用性、交叉复合型、创新型研发与管理人才,积极促进山东省人工智能产业发展,加速山东智能化建设,增强山东国际竞争力。
       智能计算公共实训基地自成立起,始终以建成省内一流的智能计算公共实训基地为目标,基地聚焦了人工智能核心课程的实验及实训、创新实践教学,涵盖机器视觉、语音识别、自然语言处理、机器人等行业应用方向。切合人工智能职业人才培养要求,适应行业技术发展趋势及人才岗位技能要求。
                                                  实训教学整体解决方案
                                                      实训基地合作单位

        三月春燃,莺啼鸟啭。我们迎来了第113个“三八”国际妇女节。值此,智研院工会向社会各界女同胞致以亲切的问候和诚挚的祝福。
       为感谢辛勤奉献、默默付出的女职工,表达对全体女职工的关爱与祝福,工会主席杨建为各位女职工发放了精美节日礼品,希望大家继续弘扬“立足岗位,巾帼不让须眉”的精神,彰显新时代女性的独特魅力。

春风十里,芳华如你——
智研院工会庆祝"三八"国际
劳动妇女节

智研快讯

NEWSLETTERS

党建带团建,凝心聚力共铸辉煌——
智研院党支部、工会组织
开展义务植树、红色教育活动

       随后,为深入开展党史学习教育,进一步引导智研院党员职工继承和发扬党的优良传统,智研院党支部、工会组织全体职工赴莱芜吐丝口战役纪念碑开展红色教育活动,重温入党誓词,并集体了解了莱芜战役中老一辈革命家浴血奋战的历史。
       活动之初,在党支部书记马兴敏同志的领誓下,全体党员同志面对鲜红的党旗高举右拳、神情庄重、精神饱满、庄严宣誓,进一步激发了党员的自豪感、责任感和荣誉感。大家用铿锵有力、掷地有声的铮铮誓言彰显了身为共产党员的赤诚之心,表达了对党的无限忠诚和为党的事业奋斗终身的坚定信念。

智研快讯

NEWSLETTERS

       共建生态文明,共享绿色幸福。在第45个植树节来临之际,为了进一步提高绿化意识和文明素质,努力营造良好的家园环境,推进生态文明建设,在智研院党支部书记、工会主席的带领下,3月10日早上我院全体员工集体乘车到达吉山林场参加义务植树。

       按照预先的分组,全体员工很快就投入了植树劳动。植树现场,大家分工协作,有的挖坑,有的植树苗,栽的认真,干的卖力,整个植树活动现场一片热火朝天的劳动景象。在整个植树过程中,大家充分享受着植树活动带来的乐趣。经过努力,将全部树苗栽植完成。活动取得圆满的成功,上百颗树苗在微风中摇动,它们是汗水的凝结,希望的寄托,未来的象征。

        随即马书记向大家讲述了莱芜战役中老一辈革命家浴血奋战的历史,并倡议全体职工要向老一辈革命家学习,积极向党组织靠拢 ,争做入党积极分子。
    通过此次“党建带团建,凝心聚力共铸辉煌”主题活动,使大家都充分认识到,一年之计在于春。大家充分感受到了保护环境,保护家园的这一份责任。工作之余,植树造林,人人有责。绿化家园,功在当代,利在千秋。未来智研院全体员工将继续以饱满的热情、昂扬的斗志、扎实的作风,携手共进,以无坚不摧的信心,坚持不懈的毅力,热情高昂的工作态度,把自己的智慧和力量,投入到智研院的发展和建设中去,为智研院的发展做出新的更大的贡献!

技术前沿

ADVABCED TECHNONLGY

清华可穿戴智能喉登Nature
子刊,实测准确率90%+

       将一块仅硬币大小的圆片,贴在喉咙处,嗓子有问题的人就可以重获新“声”了。
       这是清华大学发表在Nature子刊上的最新研究成果,一个用石墨烯材料做成的可穿戴喉咙。
       △ Nature Machine Intelligence(自然·机器智能)
       它可以准确识别到佩戴者喉咙处的细微振动以及模糊的话语,然后将之合成为正常的语音,平均识别准确率高达99.05%。
       据称,这款设备在噪音非常大的地方也好使。

       如此一来,那些不能正常发声的人,包括喉切除患者、临时嗓子发炎者、长时间讲课的老师、在嘈杂环境工作但需要交流的人等,都有救了。
       当然,还有不少人直接cue起了李雪健老师。
       清华可穿戴智能喉,患者实测准确率91%
       要说帮喉咙有问题的人解决交流问题,科学家早就在研究了。
       不过此前的一些方案由于带有一系列外设或者多通道电极,通常具有侵入性且不够便携。
       要解决这俩问题,需要感应器足够灵敏且小巧,在外部就能使用。
       还需要足够贴合皮肤。
       因为理论上,喉部的振动反映的是声带以及相关肌肉群的运动。
       一些声带发声有障碍的人,可能会训练食管发声,因此,需要柔性传感器来保持对皮肤的贴合从而照顾到这一部位。
       好在,有这么一种东西可以满足这些需要。
       它就是用柔性激光直写(laser-scribed)石墨烯(LSG)制成的机械传感器,专门用于身体表面。
       不过,由于不确定这种设备对低频肌肉运动和传递到皮肤表面的声音振动是否敏感,作者团队对它的蜂窝状微观结构进行了优化。

       最终,它可以做到在>1000次的弯曲测试后仍表现出均匀稳定的灵敏度,准确识别出频率范围在100–20kHz之间的振动信息。
       由于LSG薄膜具有导电性和导热性,这种设备也可以通过热声效应产生声音。在声音发射稳定性的实验中,作者证明它可以做到连续三小时都保持稳定。
       下面是这款可穿戴智能喉的工作流程:
       首先,设备将收集到的振动信息编码为标准脉冲编码调制(PCM)信号。
       然后通过快速傅里叶变换(FFT)生成相应的频谱图。
       接着通过模型进行外部处理和识别,将检测到的多模态信号转换为相应的语音。
       最后通过热声效应驱动设备发声,帮助佩戴者完成交流。
       实验表明,这款设备对音素、音调以及单词的识别准确率平均达到了99.05%。
       下图则显示了设备在不同强度(dB)噪音下的识别精度。

       可以看到,它在环境噪声超过60dB的情况下,也能保持识别能力,抗噪能力远远优于麦克风。
       “Talk is cheap”,作者也进行了实战测试。
       他们找来一位完成了喉切除(非全切)手术的志愿者,检测六个日常短句的识别情况。
       从频谱图可以看出,可穿戴智能喉可以感知患者喉咙的发声振动。
       不过由于发声器官不完整,患者有时会在说话时吞咽声音。不过微调模型仍然能够从       信号中提取足够的信息,将识别准确率做到81.25%。
       接着,他们又对用到的单个AlexNet模型进行了优化(Alex Net+ReliefF+SVM),最终实现了91%的识别精度。
       总的来说,由于制造工艺可行、灵敏度高、性能稳定、抗噪能力强以及集成了发声能力,作者认为,这款可穿戴喉咙可以成为下一代语音识别和交互系统的理想工具。

行业资讯
详解科技部“人工智能驱动的科学研究”专项部署工作

       近期,科技部会同自然科学基金委启动“人工智能驱动的科学研究”(AI for Science)专项部署工作,布局“人工智能驱动的科学研究”前沿科技研发体系。
       “人工智能驱动的科学研究”专项部署工作的背景是什么?相关重点有哪些?具体将如何推动我国在人工智能领域的理论研究与应用?新华社记者采访了中国科学院院士、北京大学国际机器学习研究中心主任鄂维南,科技创新2030-“新一代人工智能”重大项目实施专家组组长、中科院自动化研究所所长徐波,科技创新2030-“新一代人工智能”重大项目实施专家组成员、北京科学智能研究院副院长张林峰,对“人工智能驱动的科学研究”专项部署工作进行详细解读。

       问:“人工智能驱动的科学研究”的特点是什么?我国在相关方面研究水平如何?
       张林峰:“人工智能驱动的科学研究”最大的一个特点是,它以一种前所未有的方式,将不同学科、不同背景的人们联系在一起。
       “人工智能驱动的科学研究”既需要计算机、数据科学、材料、化学、生物等学科的交叉融合,同时也需要数学、物理等基础学科进行更加深入的理论构建和算法设计,是一个学科与知识体系大重构的过程。
       鄂维南:“人工智能驱动的科学研究”是以“机器学习为代表的人工智能技术”与“科学研究”深度融合的产物。
       借助机器学习在高维问题的表示能力,人类可以更加真实细致刻画复杂系统的机理,同时可以把基本原理以更加高效、实用的方式应用于解决实际问题中,可帮助将复杂的基础研究成果构建为更有逻辑的知识决策体系或更实用的工具,提升科研、原始创新效率。
       近年来,国内多所高校、科研机构都在科学智能领域积极布局,国内企业也在投入巨大力量来推动科学智能发展和产业落地。我们率先意识到人工智能方法对基础科学研究可能产生的影响,全面布局人工智能驱动的科学研究和培养科研团队,将人工智能方法、高性能计算与物理模型相结合,并已走在了国际前沿。

人工智能已成为科学研究新范式

       问:推动“人工智能驱动的科学研究”专项部署工作的背景和意义是什么?
       徐波:随着新一代人工智能技术的蓬勃发展,科学研究范式正在发生新变革,推动基础科学的重大发现和突破。人工智能已成为继实验、理论、计算之后的科学研究新范式。
目前,人工智能技术已在很多科学研究领域展现出超越传统数学或物理学方法的强大能力,但在“人工智能驱动的科学研究”体系化布局、重大系统设计、跨学科交叉融合、创新生态构建等方面仍有提升空间。
       近年来,我国人工智能技术发展快速、科研数据和算力资源日益丰富、科学研究领域应用场景不断拓展,为加快推动“人工智能驱动的科学研究”发展奠定了坚实基础。
       为了抢抓人工智能驱动科学研究的新机遇,科技部会同自然科学基金委启动“人工智能驱动的科学研究”专项部署工作,将进一步加强对其创新工作的统筹指导、系统布局,充分发挥我国在人工智能方面优势,加速科学研究范式变革和能力提升,推动人工智能走向高质量应用新阶段。
       鄂维南:我们正在迎来新一轮的科技革命,有很重要的一点是科学研究从“作坊”模式转变到“平台科研”模式。
       在科研活动中,如材料研究、生物制药研究等,存在很多共性,理论上用的物理模型和基本原理,是有限的、有共性的,研究中用的实验手段亦如是。人工智能技术发展至今,能让我们将这些共性的工具串联起来,从整体角度看待科研,大幅提高科研效率。“人工智能驱动的科学研究”有可能推动我们在下一轮科技革命中走在前沿。

学科与知识体系大重构的“人工智能驱动的科学研究”

       问:本次专项部署工作结合的学科与围绕的领域有哪些考虑?
       徐波:数学、物理、化学、天文、地球科学、生命科学等基础学科为科技发展提供了重要理论基础,紧密结合这些基础学科关键问题,布局“人工智能驱动的科学研究”前沿科技研发体系,是增强基础科学研究竞争力的重要保证。
       药物研发、基因研究等领域,是人工智能与科学研究结合需求迫切、进展突出、具有代表性的重要方向。例如,基于生物学机制、疾病和用药相关数据、药物的各种药学性质等建立的人工智能模型可预测新药的安全性和有效性,通过人工智能辅助,减少研发过程中的人力、物力、时间投入,提高药物研发成功率。
       值得注意的是,科学研究中的人工智能方法不能简单照搬我们现在所熟知的,如计算机视觉和自然语言处理等领域的现有模型和算法,而是需要根据每个基础科学具体情况,将人工智能技术与自然科学和技术科学的领域知识深度结合,研发针对性的智能算法、模型和软件工具。

行业资讯

INDUSTRY INFORMATION

AI大战太凶猛!微软、谷歌、
英伟达、Adobe杀疯了

       最近, AI 领域真的太卷了。继微软发布由 AI 驱动的 Microsoft 365 Copilot之后, 同一天时间内,三大科技巨头同时发布自家最新产品,杀入这场AI大战。
       01  微软发布颠覆性 AI 工具 Copilot
       当地时间3月16日,在微软举办的 Microsoft 365 Copilot 发布会上,微软正式把 OpenAI 的 GPT-4 模型装进了 Office 套件,推出了全新的 AI 功能 Copliot。
       微软强调,Copilot并不仅仅是微软办公软件与ChatGPT的简单结合,而是一个系统,“为了构建Copilot,我们不仅仅是将ChatGPT连接到Microsoft 365.Microsoft 365 Copilot是由我们称之为Copilot系统的东西驱动的。”

紧扣基础学科关键问题 紧抓重点领域科研需求

加强体系化布局 打造智能化科研创新生态

       问:“人工智能驱动的科学研究”未来还有哪些规划与建议?
       徐波:科技创新2030-“新一代人工智能”重大项目将在第二个五年实施阶段(2023-2027年)持续加强体系化布局和支持力度,推动研究新理论、新模型、新算法,研发软件工具和专用平台,推进软硬件计算技术升级,打造智能化科研的开源开放创新生态。
       后续,将在国家《新一代人工智能发展规划》的指导下、新一代人工智能规划推进办公室的协调下,加快人才、技术、数据、算力等要素汇聚,形成推进“人工智能驱动的科学研究”政策合力。
       在平台支撑方面,科技部正在加快推动国家新一代人工智能公共算力开放创新平台建设;在机制创新方面,科技部鼓励用户单位围绕业务深度挖掘技术需求和科学问题,深度参与模型研究与算法创新,积极开放数据、资源。
       鄂维南:着眼未来“人工智能驱动的科学研究”发展,首先要把资源真正配置到做实事的一线科研人员手里。同时要有有效的人才培养体系,培养对于基本原理和实际问题都有充分了解的人才。
       此外,要有有效的组织形式,构建垂直整合的团队。“人工智能驱动的科学研究”对科研团队提出了全新要求,真正让人工智能的研究人员与基础科学领域研究人员一起工作,进行高频率的日常学术交流,同时引入工程化人才,从行业需求出发,开发出可实际应用并持续迭代的新工具与软件。

       据了解,Copilot 被嵌入常用的办公软件后,能够根据不同软件的功能与需要,处理不同类型的任务。比如,在Word应用场景中,Copilot能够根据用户的简单描述或提示生成可进一步定制和编辑的初稿;在PowerPoint中,用户只需从其他文档导入内容,并用自然语言简单描述,Copilot便能将这些内容自动组合成图文并茂的PPT;而在Excel中,用户不必掌握复杂公式,只需向Copilot提出相应需求,即可快速创建一个 SWOT 分析或基于数据的数据透视表。
       “通过以用户的业务内容和环境为基础,Copilot 提供相关且可操作的结果。Copilot 标志着一个新的计算时代,它将从根本上改变我们的工作方式。”微软全球现代化办公副总裁 Jared Spataro说道。
       此前2月,微软推出搭载了聊天机器人ChatGPT同源技术的新版必应(Bing),这一举动被外界看作向谷歌“下战书”,毕竟目前谷歌占据全球搜索引擎市场的九成份额,而必应的市场份额不到3%。
       此外,办公应用软件和相关云服务一直是微软的主要业务之一。根据《华尔街日报》,最近一个财年,该业务占微软总收入的23%,而搜索和新闻广告的贡献仅为6%。数据分析平台Visible Alpha的数据显示,2021年,Office 365的商用产品和消费者产品产生近410亿美元的收入,这笔金额已经超过Adobe等大多数公司一整年的收入。
       因此,对于微软而言,在办公应用软件中引入AI技术既能带来盈利,但也面临着更大风险。《华尔街日报》认为,微软不能在办公软件方面犯错,不能像ChatGPT及必应那样,向用户提供不准确的信息,或引用受版权保护的资料。
       目前,微软还没有具体介绍Copilot的正式推出时间以及具体定价。不过该公司透露,已经有20名企业参与测试Copilot,其中包括8家在《财富》杂志排名500强以内的企业。
       对于是否真的会有客户为这项新技术买单,《华尔街日报》援引瑞银分析师Karl Keirstead的报告称,部分大型企业曾透露“在技术真正达到企业级规模,且投资回报率得到证实之前,他们不愿付费”。

       02  反击ChatGPT!谷歌推出Bard测试版
       当地时间3月21日,美国科技巨头谷歌公司推出了聊天机器人Bard的测试版本,以期追赶OpenAI火爆的ChatGPT。谷歌CEO桑达尔·皮查伊坦承,开放公众测试可能会出现问题,但公众反馈对Bard的成长至关重要。
       科技媒体TheVerge评价称,开放Bard是谷歌在AI领域竞争中收复失地的重要一步。
       Bard将与其谷歌搜索引擎分开运行,且仅以英语生成答案。目前,谷歌仅允许美国和英国地区的用户在官方网站进行注册,并将以先到先得的方式向候补名单的用户提供访问权限。
       公司在博文中称,随着时间的推移,Bard将适配更多的语言以及推广到更多的地区。
       与ChatGPT不同,在每次提问后,Bard会对用户提出的问题给出三种不同版本的回答。“你可以使用Bard来提高你的生产力,加速你的思维,激发你的好奇心。到目前为止,我们已经通过测试Bard学到了很多东西,下一个关键步骤就是从更多人那里获得反馈意见。”
       Bard背后是谷歌开发的大型语言模型LaMDA,该模型能够赋能Bard从谷歌认为的“高质量”信息源中提取回复内容,以显示最新的答案。

       此外,在推出Bard的方式上,谷歌选择了和微软截然不同的路径——Bard并未被嵌入搜索引擎中,而是作为独立的页面存在,谷歌强调它是“搜索的补充体验(complementary experience)”。
       具体来看,Bard回复的最下方存在一个名为“Google It”的按钮,点击之后可进入传统的谷歌搜索页面。
       谷歌并未将Bard与搜索引擎直接结合,或许是为了避免其搜索引擎广告业务受到威胁。
       《纽约时报》分析道,尽管AI能够使得一系列谷歌产品变得更加有用,但也可能削减其庞大的互联网搜索业务——因为聊天机器人能够立即回复完整的答案,并不会强迫用户逐一浏览含有广告的搜索结果列表。有意思的是,在博客的最后,谷歌透露这篇文章是在Bard的辅助下完成的,它为这篇博客提供了大纲和编辑建议。
       谷歌这次推出Bard仍然延续了小心谨慎的风格,强调本次开放测试只是“早期实验”(earlyexperiment)。此前2月谷歌就曾表示Bard是基于大型语言模型(LaMDA)的“实验性人工智能程序”。
       谷歌也坦然承认目前Bard还存在缺陷,并表示它生成的回复中可能存在偏见性信息或刻板印象,它也可能提供不准确、误导性或虚假信息。
       为此,谷歌专门在Bard的对话框下方列出免责声明,“Bard可能会回复不准确或冒犯性的信息,这不代表谷歌的观点。”为了保证对话不会失控,谷歌还表示将限制对话次数,“以尽量保持互动有助于用户且切合主题”。
       在最新的博客中谷歌表示,“我们将继续改进Bard,并添加编码、多种语言和多模态体验等功能。我们会和用户一起学习,有了用户的反馈,Bard会变得越来越好。”
       多年来谷歌一直是生成式AI的领军者,但在向公众推出产品上让OpenAI抢了先机。此前2月,在微软将ChatGPT模型融进搜索引擎“必应”的同一天,谷歌仓促地将仍处于内部测试阶段的Bard进行了演示,但Bard连连出错,导致谷歌母公司Alphabet股价大跌。

       媒体报道称,在2022年11月ChatGPT上线公测后,谷歌公司内部立即拉响“红色警报”,甚至创始人Sergey Brin也亲自下场为Bard写代码,随后谷歌开启了紧追不舍的节奏,与微软和OpenAI的竞争日趋白热化。
       上周,谷歌宣布将对其Workspace系列软件进行全面更新,Gmail、谷歌文档、表格、会议、幻灯片等等软件中都将嵌入其人工智能模型。
       03  英伟达发布新核弹:ChatGPT专用GPU
  当地时间3月21日,一年一度的英伟达(NVIDIA)春季GTC大会正式开幕。英伟达创始人兼CEO黄仁勋发表主题演讲,介绍了英伟达在人工智能(AI)领域的多款产品,包括为大型语言模型设计的新款GPU(图形处理器)、针对AI(人工智能)视频的芯片L4,以及AI超级计算服务DGX Cloud等。
       在演讲中,黄仁勋多次重复道,AI的iPhone时刻已经到来,并表示“生成式AI将重塑几乎所有行业”。
  ChatGPT专用GPU。其中最主要的是H100 NVL,它将英伟达的两个H100 GPU拼接在一起,以部署像ChatGPT这样的大型语言模型(LLM)。“当前唯一可以实际处理ChatGPT的GPU是英伟达HGX A100。与前者相比,现在一台搭载四对H100和双NVLINK的标准服务器速度能快10倍,可以将大语言模型的处理成本降低一个数量级。”黄仁勋说。
  H100 NVL将英伟达的两个 H100 GPU 拼接在一起,以部署像 ChatGPT 这样的大型语言模型 (LLM)。
  H100不是新的GPU,英伟达在一年前的GTC上展示了其Hopper架构,并在各种任务中加速AI推理(推理是机器学习程序部署的第二阶段,此时运行经过训练的程序以通过预测来回答问题)。英伟达表示,H100 NVL附带94GB内存,与上一代产品相比,H100的综合技术创新可以将大型语言模型的速度提高30倍。

       据黄仁勋透露,H100 NVL预计将在今年下半年上市。
       第二款芯片是用于AI Video的L4,在视频解码和转码、视频内容审核、视频通话功能上做了优化。英伟达称其可以提供比CPU高120倍的AI视频性能,同时能效提高99%。也就是说,一台8-GPU L4服务器,将取代一百多台用于处理AI视频的双插槽CPU服务器。
       用于AI Video的L4芯片,在视频解码和转码、视频内容审核、视频通话功能上做了优化。
       “谷歌是第一家提供L4视频芯片的云提供商,目前处于私人预览版。L4将集成到谷歌的Vertex AI模型商店中。”黄仁勋说。除了谷歌的产品外,L4还在30多家计算机制造商的系统中提供,其中包括研华、华硕、源讯、思科、戴尔科技、富士通、技嘉、惠普企业、联想、QCT和超微。
       同时,英伟达还针对Omniverse、图形渲染以及文本转图像/视频等生成式AI推出了L40芯片。其性能是英伟达最受欢迎的云推理GPU T4的10倍。另外,英伟达还推出了全新的超级芯片Grace-Hopper,适用于推荐系统和大型语言模型的AI数据库,图推荐模型、向量数据库和图神经网络的理想选择,通过900GB/s的高速一致性芯片到芯片接口连接英伟达Grace CPU和Hopper GPU。

       总体而言,英伟达在推理方面的全新GPU推理平台包括:4种配置(L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper超级芯片)、一个体系架构、一个软件栈,分别用于加速AI视频、图像生成、大型语言模型部署和推荐系统。
       此外,英伟达还推出云端人工智能DGX Cloud。DGX Cloud提供了专用的 NVIDIA DGX AI超级计算集群,用户能够按月租用这些计算资源,并使用简单的网络浏览器访问。从而消除在本地获取、部署和管理基础设施的成本,大大增加了AI的便捷性。
       据介绍,每个DGX Cloud实例都具有8个H100或A100 80GB Tensor Core GPU,每个节点共有640GB GPU内存。使用NVIDIA Networking构建的高性能、低延迟结构确保工作负载可以跨互连系统集群扩展,允许多个实例充当一个巨大的GPU,以满足高级AI训练的性能要求。
  据黄仁勋介绍,每个实例的月租价格为36999美元起。
  在演讲中,黄仁勋宣布,英伟达将与云服务提供商合作托管DGX云基础设施。目前英伟达已经与甲骨文达成合作,甲骨文的OCI RDMA Supercluster已经提供了一个可扩展到超过32000个GPU的超级集群。微软云服务Azure预计下个季度开始托管DGX Cloud,很快谷歌云也将加入托管的行列。
  ChatGPT 和 GPT-4 掀起这股生成式 AI 热潮后,为 AI 提供心脏的英伟达成了背后的大赢家。大型语言模型需要规模庞大的算力,目前大模型竞赛中的很多玩家都依赖英伟达的 GPU 芯片。据悉,受益于 ChatGPT 相关产品的热度,英伟达 A100、H100 及 A800 系列 GPU 等三款针对数据中心的 GPU 代工订单增加。

       投资公司 Baird 认为,ChatGPT 的“有意义的”订单正在到来,并帮助该英伟达上调了下半年数据中心收入预期。Baird 分析师 Tristan Gerra 表示,英伟达的 Hopper 芯片很可能受益于大型语言模型的增长,并成为一种“长期趋势”。
       据悉,自今年年初以来,英伟达股价涨幅已超 80%。英伟达 2023 财年第四季度财报显示,AI 数据中心业务再次成为该公司最大的收入来源。
       04  Adobe的“萤火虫”飞入 AI 战局
       北京时间周二晚间,内容生产力工具大厂Adobe宣布推出名为”Firefly(萤火虫)”的创意生成式AI,正式杀入AIGC商业化赛道。
       作为修图工具Photoshop、视频剪辑软件Premiere等内容生产软件的开发商,Adobe选择的AI赛道切入点也与自己的老本行有关——图片生成。
       Firefly 主要提供两个模式,一种是利用文字生成图像的功能,另一种是字体效果编辑。在画图上,FireFly和目前流行的AI绘图工具类似,能够根据提示词“prompt”生成图像,并提供数百种风格并对结果进行调整。
       Firefly还可根据周边内容生成图像,这使用户可以更有效地测试和完善图像效果。在图形设计和插图工作中,自定义矢量、画笔和纹理可以从几个单词甚至草图生成,并能够编辑使用熟悉的工具创建的内容。
       而创意文字工具上,用户可以创作看起来毛茸茸、鳞片等各种形态和效果的文字,类似Office中的“艺术字”功能。
       除了文字生成图片、文字生成字体效果两个功能外,Firefly目前仍在探索中的功能包括“文字生成矢量/笔刷/模板”“根据自己的风格生成图像”“指定纵横比扩展图像”“根据3D模型生成图像”“为黑白图像上色”“使用画笔修改图像并用文字描述的风格进行填充”等等。

       目前,这款产品仅开放了网页Beta版的试用。Adobe公司表示将尽快把这款AI融入图片、视频、特效等一系列生产力工具中。
       对于卖软件出身的Adobe来说,推出这款AI还有一个杀手锏——商业版权。
       Adobe的首席技术官Ely Greenfield介绍称,在训练“萤火虫”AI时,Adobe精心挑选了数据来源,主要包括Adobe自有版权的图片、具有公开授权的图片和版权过期的图片,因此训练出来的AI具备商业上的安全性。
       Adobe同时宣布,正在与行业伙伴推进一项“请勿训练”(Do Not Train)的内容凭证标签,内容创作者可以在内容凭证中提出拒绝使用自己的图片进行机器训练。不过Adobe并没有透露,是否有其他AI模型开发者加入这项倡议。
       05  AI时代已经到来
       近期,多模态、大模型等AI相关技术不断涌现,人工智能已经成为科技巨头们逐鹿的新战场,推动整个AI行业迈入“iPhone时刻”。
       周二,比尔·盖茨在他的博客GatesNotes盛赞人工智能,AI时代已经开启,人工智能革命重要程度不亚于手机和互联网的诞生,这是其一生中唯二的革命性技术进步。
       AI时代已经到来,ChatGPT是1980年以来最具革命性的技术进步。比尔·盖茨指出:
第一次是在1980年,当时他看到现代图形桌面环境 (GUI),这后来成为他构建微软Windows操作系统的基石。
       第二次是在2022年年中,他对OpenAI团队及其生成式AI模型发起了挑战,要求其做一些没有经过训练或编程的测试,结果令人惊艳。
       比尔·盖茨表示,人工智能的发展与微处理器、电脑、互联网和手机的出现一样重要。它将改变人们工作、学习、旅行、获得医疗保健以及彼此交流的方式;整个行业都将围绕它重新定位;企业将通过如何使用它而脱颖而出。

电话:0531-88287262 
官网:www.sdaict.ac.cn地址:济南市高新区旅游路8661号

Copyright © 2024 陕西妙网网络科技有限责任公司 All Rights Reserved

增值电信业务经营许可证:陕B2-20210327 | 陕ICP备13005001号 陕公网安备 61102302611033号