通用人工智能文字版-FLBOOK

Artificial General Intelligence

▷政策速递

▷焦点新闻

▷评测专栏

▷行业动态

▷特邀续集

通用人工智能

2023.06.09

上海市人工智能行业协会

通用人工智能

《通用人工智能》是一份专注于通用人工智能（AGI）领域的研究报告，旨在为读者提供最新的政策速递、焦点新闻、评测专栏、行业动态和特邀续集等内容。关注AGI的技术进展、应用场景、风险防范和伦理治理等方面，以客观、专业、前瞻的视角，展现AGI的发展现状和未来趋势。《通用人工智能》的栏目设置如下：

Contents

政策速递

梳理国内外相关政策文件，分享政策背景、目标、措施和影响，为读者提供可靠的政策指引。

焦点新闻

报道国内外AGI领域的重大事件、突发新闻和热点话题，为读者提供及时的信息资讯。

评测专栏

评测AGI领域的代表性技术产品和模型，分析其优势、缺陷和改进空间，为读者提供严谨的技术评价。

行业动态

关注AGI领域的投融资新闻和分析，探索AGI产业的发展机遇和挑战，为读者提供有价值的商业洞察。

特邀续集

邀请AGI领域的专家学者、企业家、创新者等，分享他们对AGI的见解、经验和展望，为读者提供深度的思想交流。

《上海市加大力度支持民间投资发展若干政策措施》

开源大模型新增重磅成员

焦点新闻

政策速递

Sam Altman 谈OpenAI

特邀续集

重点关注算力，大模型企业频获融资

行业动态

上海市生成式人工智能质量检验检测中心

评测专栏

XR界的iphone时刻

焦点新闻

1）为民营企业租用算力提供便利

统筹全市政府投资的高性能计算资源，为民营企业提供中立普惠、持续迭代、安全可靠的公共算力资源；通过科技创新券支持民营企业租用算力、存储资源。

2）鼓励民营企业投资数据、算力等人工智能新基建

延长新型基础设施项目贴息政策执行期限至2027年底，提供最高1.5个百分点的利息补贴。

3）为民间投资的数据储存和算力资源寻找市场

推动“补需方”改革，支持高校、科研机构、国有企业通过政府采购、租用等方式使用民间投资的数据储存和算力资源；推动政府部门租用民间投资专用算力支持大语义学习、元宇宙、时空底图等专业场景应用。

《中国数据产权制度蓝皮书》

为进一步推动数据要素的高质量发展，促进激活数据要素潜能，人民数据结合自身实践探索，联合浙江大学网安学院撰写《中国数据产权制度蓝皮书》，从理论、研究、产业等多角度、广视野对我国数据产权制度的研究内容、发展现状、存在问题、确权方式、技术发展、产业实践、国际视野等方面进行梳理和探究，为各界在数据产权制度建设方面提供一定的参考。

长三角首个量子超算协同创新中心成立

6月3日，上海超级计算中心与本源量子计算科技（合肥）股份有限公司携手成立长三角量超协同创新中心，该中心成立是“量超协同”在全国的先行试点，将有助于推动量子计算技术服务长三角经济发展一体化，引领构建全国算力新格局。

上海大模型商用基建首个动作

2023年6月2日，在临港新片区智算大会上，《临港新片区加快构建算力产业生态行动方案》正式发布。目标到2025年，将形成以智算算力为主、基础算力和超算算力协同的多元算力供给体系，总算力超过5EFLOPS（FP32），AI算力占比达到80%，算力产业总体规模（含相关硬件、软件、应用、服务等）突破100亿元，建成公共算力服务平台，规范算力交易机制，实现区域算力调度，打造具有全国影响力的算力产业集聚区，建设一批算力示范应用标杆场景。

北京高度关注通用人工智能技术发展

聚焦大模型、类脑智能、具身智能、价值与因果驱动的通用智能体等方向开展研究，产出悟道大模型、通用智能体平台等多项重大原创成果。同时集聚了一批人工智能优势创新企业和科研机构，推出紫东太初、文心一言、ChatGLM、CPM、孟子等大模型产品，并具备商业化落地能力。为系统推动全市人工智能技术及产业发展，市政府印发《北京市加快建设具有全球影响力的人工智能创新策源地实施方案（2023-2025年）》。

政策解读

5月30日，上海市发展改革委近日印发《上海市加大力度支持民间投资发展若干政策措施》。其中提出，充分发挥人工智能创新发展专项等引导作用，支持民营企业广泛参与数据、算力等人工智能基础设施建设。

编者按

通用人工智能（AGI）是当下最热门的话题之一，也是未来发展的重要方向。随着计算能力和数据量的增长，人工智能和大模型的性能和应用范围也在不断扩大，给各个行业和领域带来了巨大的变革和机遇。但同时也面临着诸多的挑战和风险，如资源消耗、安全隐患、伦理道德、社会责任等。如何平衡大模型的利弊，如何促进人工智能和大模型的健康发展，如何让更多的人受益于人工智能技术的创新，这些都是我们需要思考和探讨的问题。

本期杂志为您带来了一些关于AGI的最新动态和信息，包括上海市生成式人工智能质量检验检测中心的筹建、OpenAI的路线图和挑战、各种新兴的人工智能创业公司和产品等。我们希望通过这些内容，让您了解通用人工智能的发展现状和趋势，以及它们对社会和经济的影响和价值。我们也为您精选了一些优秀的案例和实践，展示了人工智能在医疗、教育、文化、娱乐等领域的应用效果和创造力。我们希望通过这些案例和实践，激发您对大模型的兴趣和想象力。

同时，我们也搜集了OpenAI的CEO Sam Altman的专访，他分享了他对自家GPT模型的看法和期待，以及他对监管、开源、竞争等问题的态度和建议。OpenAI是一个致力于创建并确保所有人都可以平等使用通用人工智能的研究机构，它开发了GPT系列等多个知名的大模型，并提供了开放的API服务。我们希望通过这次专访，让您更深入地了解OpenAI这个领先的人工智能研究机构的内部运作和愿景。

我们相信，通用人工智能是未来科技发展的重要驱动力，也是推动社会进步的有力工具。我们希望通过本期杂志，为您提供一个全面而深入的视角，让您更好地认识、理解、利用、参与通用人工智能的发展。我们也期待您与我们一起分享您对人工智能和大模型的看法、感受、建议、创意等。让我们共同探索AGI的无限可能！

—— Dr.Wang

焦点新闻

Falcon（猎鹰）可以说是目前业界最受关注的明星，已飙升至Hugging Face最新开放大型语言模型（OpenLLM）排行榜榜首。Falcon-40B是一个大型语言模型（LLM），400亿参数量，1000B token训练量，训练采用RefinedWeb（一个大规模英语网络数据集）。它是由阿联酋-阿布扎比技术创新研究所（TII）开发的，该研究所致力于推动科技发展，造福人类。

1）表现优于LLaMA、StableLM、RedPajama、MPT等，是可免费获取的高性能大模型。作为Causal Decoder模型，训练预算仅为GPT-3的75%，推理计算开销仅为GPT3的1/5。

2）历时两个月，用AWS SageMaker 384块GPU训练而成，不仅开源还可以用于商业化。（不过要注意，超过100万美元的任何商业应用都将征收10%授权费，许可证部分基于Apache License 2.0协议）

3）训练Falcon的数据集RefinedWeb经过大量过滤清洗，并消除重复内容获取的5万亿token的高质量庞大训练集，也已开源。

英伟达^TM（NVIDIA）三件大事

ACE游戏系统；

DGX GH200 AI超级计算机；

Neuralangelo 研究重构3D场景

Avatar Cloud Engine (ACE)

玩家与一家拉面店的经营者Jin进行互动。虽然他是一个NPC，但Jin对玩家的回答是真实的，并且与叙述的背景故事一致——所有这些都是在AIGC帮助下完成的。画面采用虚幻引擎5中最新的光线追踪技术和NVIDIA DLSS进行渲染。

GH200

技术亮点主要体现在存储、互连、以及针对Transformer加速的优化。NV已经成为AI计算GPU的垄断者，牢牢的占据了GPU甚至AI芯片的头把交椅。从卖卡发展到了卖机柜。

Neuralangelo

模型采用了即时神经绘图（instant neural graphics primitives），并利用了自家的 Instant NeRF 技术，因此即使是对于低对比度的视频，也可以从中捕捉到微妙的细节，并转换为更具备商业价值的 3D 模型。该模型可以准确呈现复杂材料的质地，例如屋顶瓦片、玻璃窗格和光滑的大理石；创作者们能够简单使用智能手机拍摄视频，就能创作逼真的3D物件模型。

焦点新闻

Apple Vision Pro

Apple的首款混合现实空间计算设备,提供无边际画布和3D交互体验,内置M2和R1两颗芯片,运行visionOS操作系统。能够将数字UI与物理环境融合,支持调整窗口大小和覆盖现实环境。可以通过眼睛和手势进行交互操作。支持EyeSight功能,在他人靠近时使设备视野变透明。提供3D界面,支持各种方向和大小的应用窗口。支持蓝牙键盘、触控板等配件,可无线连接Mac作为4K显示器。支持3D照相机拍摄和回放空间照片和视频。提供沉浸式电影和游戏体验。

采用3D成型层压玻璃和铝合金框架。中部为织物材料眼罩。配有可调节头带和配镜片。分离式电源设计。微OLED显示，单眼分辨率2300万像素。三镜头光学系统，支持广色域和高动态范围。空间音频扬声器。搭载M2和R1芯片,R1芯片可消除画面延迟。支持多人FaceTime通话,利用用户空间环境。运行visionOS和App Store。支持Optic ID虹膜识别解锁。

售价3499美元，约合人民币25000元。将于明年在美国发售，随后在更多国家上市。

PandaGPT

剑桥、NAIST 和腾讯 AI Lab 结合了ImageBind 多模态编码器和 Vicuna 大型语言模型。在文本、图像、视频、音频、深度、热学和 IMU 上展示了令人印象深刻的跨模式能力。

Mind video

新加坡国立大学和香港中文大学的研究，可以从大脑信号中重建“高质量”视频。根据fMRI 和 Stable Diffusion 的增强模型共同训练，平均准确率为85%。

特斯拉 FSD (Full Self-Drive)

6月5日，马斯克作为无人驾驶领域的先行者，当听到福特CEO Mary Barra夸赞特斯拉的技术后，在推特上回应，特斯拉一直致力于帮助其他车企，很愿意授权Autopilot或FSD给其他车企使用。

StyleDrop

谷歌推出的Midjourney竞品。用户提供参考图像作为风格基础，如水彩画或彩色玻璃窗，StyleDrop就可以学习画风并快速迁移创作。生成的图像质量很高，可以说一众年轻画师又开始为自己的职业前景捏一把汗了。

　　6月9日上午，2023北京智源大会上FlagEval （天秤）大语言模型评测体系正式宣布，从“能力、任务、指标”三维评测角度，600多个维度对大模型进行全面测评，建立科学、公正、全面的大模型技术评价体系。

　　据介绍，天秤大模型的任务维度当前包括22个主观、客观评测数据集，评测题目多达84433道。目前正在探索运用人工智能技术进行科学评测，力求减少更多的主观评测。同时也正在探索通过大模型评价，辅助大模型预训练。

复杂推理任务列表 Chain-of-Thought Hub

来自爱丁堡大学、华盛顿大学、艾伦AI研究所的研究人员认为，复杂推理能力是大模型在未来进一步朝着更加智能化工具发展的基础。基本的文字总结归纳能力，大模型执行起来确实属于「杀鸡用牛刀」。针对这些基础能力的测评，对于研究大模型未来发展似乎是有些不务正业，而实验得出模型越大推理能力越强：1. 开源和封闭之间存在明显的差距。2. 大多数排名靠前的主流模型是RLHF。3. LLaMA-65B非常接近code-davinci-002，GPT-3.5的基础模型。 4. 综合上述，最有希望的方向是「在LLaMA 65B上做RLHF」。

【Stack Overflow】近期更新了当初对GPT的禁令：

鉴于目前我们无法准确识别AI生成的内容，「假阳性」的概率非常高，这种一言堂的过度禁言措施，可能会让网站损失大量有贡献的网友。

因此，只有在真实可验证的情况下，版主们才能禁言账号。而不管是写作风格等主观猜测，还是GPT检测器的结果，都不可作为衡量指标。

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

于是版主们集体罢工了，他们抗议Stack Overflow的新政策，认为这将导致人工智能生成的垃圾内容泛滥。他们写了一封公开信，表示他们将暂停审核、删除、投票等活动，直到Stack Overflow收回或修改这项政策，这或许是保护社区质量和信任的最后手段。

评测专栏

榜单出处：

Huggingface - Open LLM Leaderboard

开源中文大模型测试数据集

行业动态

OpenAI和Supermicro喊话英伟达，GPU不够！

　　OpenAI目前遭到客户最大的抱怨是API的可靠性和速度。OpenAI的CEO Sam Altman 承认当下GPU非常紧缺，这不得不推迟了许多的短期计划，微调 API 、专用容量产品都受到GPU 可用性的限制。不过，OpenAI还会提供专用容量，为客户提供模型的私人副本，但如若访问此服务，客户必须预先承诺支付100万美元。

　　超微电脑（Supermicro）创始人、CEO梁见后表示：市场对AI需求强劲，公司正扩大美国、荷兰等地产能，在马来西亚及日本也都设有服务器生产基地，预计年底前要把4000台机柜产能拉升至5000台。他还对黄仁勋表示，请英伟达多提供一些芯片，即使目前已提供但还不够。

【奇绩创坛】项目赛道涉及人工智能及大模型、企业服务、机器人、开发者工具、生物医疗、先进制造等22个细分行业。

包含41家人工智能主题公司，其中39家大模型相关；23家企业服务主题公司，11家机器人主题公司。

创始人平均年龄29岁，78%拥有硕士及以上学位，67%具有海外背景，32%的项目有女性创始人。

【MiniMax】宣布完成一轮规模超2.5亿美元的融资，其估值有望达到近12亿美元。MiniMax由商汤科技的一些前员工于2021年创立，其中包括商汤科技前副总裁、商汤研究院副院长闫俊杰。该公司正在研究类似于 ChatGPT 的人工智能解决方案。据报道，参与 MiniMax本轮融资的投资者还包括腾讯的关联实体。

【深言科技】（DeepLang AI），腾讯帮助其快速完成10亿级别的Pre-A+轮融资，源流自清华大学自然语言处理实验室（THUNLP）。腾讯话事人马化腾已经表态，对于大模型这样的时代级浪潮不会袖手旁观，但也不会急于求成搞半成品，会专心搞好研发。

【出门问问】正式向港交所递交招股书，成为国内第一家以通用大模型能力为主打概念启动上市的国内企业。20年至22年，公司营收分别为2.65亿元、3.98亿元及5.00亿元，毛利分别为7967.2万元、1.49亿元及3.36亿元，20年及21年经调整后净亏损为1.57亿元、7343.9万元，2022年扭亏为盈，经调整后净利润1.09亿元。

【光年之外】美团联合创始人王慧文的AI创业公司，已在近期完成了新一轮2.3亿美元（折合人民币16.3亿）融资，估值10亿美元，进场百天，晋升独角兽。

本轮融资，据称由源码资本领投，押注8000万美元，此外腾讯、五源资本和快手创始人宿华均参与其中。

据《Fortune》报道，5 月Sam Altman 与一些开发人员和初创公司创始人闭门会面，并讲述了 OpenAI 的路线图和面临的挑战。

OpenAI 目前面临着 GPU 的严重短缺，这也影响了他们一些近期计划的进展。近期，客户对 API 的稳定性和速度问题反馈较多。Sam 承认了这个问题，并解释说大部分问题都是由于 GPU 缺乏导致的。

在文本处理方面，更长的 32k 上下文还未能普及。现在 OpenAI 还没有完全解决注意力机制的 O (n^2) 扩展难题，尽管 OpenAI 似乎很快就能实现 100k-1M token 上下文长度（在今年内），但更大的文本长度还需要更多的研究突破。

此外，微调 API 也受到 GPU 供应的制约。OpenAI 还没有采用像 Adapters 或 LoRa 这样的高效微调方法，因此微调运行和管理都非常耗费计算资源。Sam 透露更好的微调技术将在未来推出，他们甚至可能提供一个社区专门研究模型。

另外，专用容量服务也受到 GPU 供应的影响。OpenAI 还提供专用容量服务，为客户提供一个私有的模型副本。要使用此服务，客户必须愿意预付至少 10 万美元。

OpenAI API 的两年计划

2023 年：

OpenAI 的首要任务是推出更便宜、更快的 GPT-4—— 总的来说，OpenAI 的目标是尽可能地降低智能成本，因此随着时间的推移，API 的成本将会降低。

更长的上下文窗口 —— 在不久的将来，上下文窗口可能高达 100 万个 token。

微调 API—— 微调 API 将扩展到最新的模型，但其确切形式将由开发人员决定。

状态 API—— 现在调用聊天 API 时，你必须反复地通过相同的会话历史，并一次又一次地为相同的 token 进行支付。将来版本的 API 可以记住会话历史记录。

2024 年：

多模态 —— GPT-4 版本的一部分，但在更多 GPU 上线之前不能扩展到所有人。

插件没有 PMF，也不会很快出现在 API 中

许多开发者都想通过 API 使用 ChatGPT 插件，但 Sam 表示他认为这些插件不会在短时间内推出。除了浏览功能外，插件的使用情况表明他们还没有找到产品市场契合度。Sam 指出，很多人希望将自己的应用程序嵌入到 ChatGPT 中，但他们真正需要的是在应用程序中集成 ChatGPT。

专注与类 ChatGPT 交手，OpenAI 将避免与客户竞争

许多开发者担心，当 OpenAI 推出新产品时，他们基于 OpenAI API 构建的应用程序会面临竞争。Sam 表示 OpenAI 不会在 ChatGPT 以外再发布其他产品。他说有很多优秀的平台公司都有一个核心的应用程序，ChatGPT 将使他们能够通过成为自己产品的用户来改进 API。ChatGPT 的愿景是成为一个超级智能的工作助理，但 OpenAI 不会涉及许多其他 GPT 的应用场景。

特邀续集

扩展定律依然有效

近期有很多文章都宣称「巨型人工智能模型的时代已经终结」。Sam 表示这并没有准确地反映他的观点。

OpenAI 的内部数据显示，扩展定律依然成立，而且增加模型的规模将继续提升性能。然而，模型的规模无法一直按照同样的比例扩大，因为在短短几年内，OpenAI 已经将模型规模扩大了数百万倍，继续这样做将不切实际。但这并不意味着 OpenAI 将停止努力扩大模型，而是意味着它们可能每年增加一倍或三倍的规模，而不是几个数量级的增长。

扩展模型依然有效，这对 AGI 的发展有着重要的意义。扩展规模的理念是，我们可能已经拥有构建 AGI 所需的大部分元素，而剩下的大部分工作将是用现有的方法，并将它们应用到更大的模型和更大的数据集上。如果模型扩展时代已经结束，我们实现 AGI 的时间将会更长。扩展定律依然适用的事实暗示着我们会用更短的时间达到 AGI。

监管是必要的，但开源也是必要的

虽然 Sam 主张对未来的模型进行监管，但他并不认为现有的模型有危险。他再次强调了开源的重要性，并表示 OpenAI 正在考虑开源 GPT-3。OpenAI 之所以迟迟未能开源的部分原因是因为他们觉得没有多少人和公司有能力合理地管理如此庞大的语言模型。

电话：021-62037717

网址：www.sh-aia.com

邮箱：saia@sh-aia.com

地址：上海市浦东新区世博村路231号

（汇博中心）330室

通用人工智能

内容简介

往期作品

为您推荐

热门标签

产品服务

关于我们

网络条款

其他

联系方式