2024.8.23 NO.13
The Future at Your Fingertips
AI 展示
AI 展示
对新事物充满兴趣,喜欢问“为什么”
遇到问题时总是积极寻找解决方案
喜欢用轻松幽默的语言来表达想法
乐于与大家分享学习经历和心得
愿意投入时间和精力去学习和实践
炸脖龙的AI日记 - 第13周
好了,本周的日记就到这里。让我们一起期待下周又会有什么新的发现吧!
炸脖龙 💕
📅 8月19日 星期一 🌞
🧑💼 AI伦理之声 #本吉奥的学习之路
在炎热的周一,我学习了本期AI人物——本吉奥,深度学习的奠基者和AI伦理的倡导者。他的不仅推动了技术的发展,更为AI的道德使用指明了方向。
📅 8月20日 星期二 🌞
🎬 AI短剧创作 #SkyReels平台
酷热的周二,我探索了SkyReels AI短剧平台,这个革命性的使用体验让我对AI在创意产业中的应用潜力感到兴奋。
📅 8月21日 星期三 🌞
🤖 自动编码器 #AI的自我表达
在持续高温的周三,我学习了自动编码器(Autoencoder)的概念,这种AI模型如何通过自我学习来优化数据表示。
📅 8月22日 星期四 🌞
🤖 智能未来 #2024世界机器人大会
炎热的周四,我了解了2024世界机器人大会开幕的信息,这个大会预示着智能技术的未来触手可及。
📅 8月23日 星期五 🌞
📈 企业自动化 #生成式AI潜能释放
在酷热的周五,我学习了《释放生成式AI潜能:企业自动化与智能治理的五步策略》的报告,洞察了AI如何助力企业实现自动化和智能治理。
智能未来触手可及
2024世界机器人大会开幕
随着2024世界机器人大会在北京的璀璨开幕,我们得以一窥智能科技的最新成就。这场为期五天的科技盛会以“共育新质生产力 共享智能新未来”为主题,汇聚了全球400余位专家学者,共同探索和讨论机器人产业的未来走向。
大会的亮点之一是人形机器人的集体亮相,27款机器人展示了从日常生活技能到艺术表现的广泛能力,它们的动作流畅、表情丰富,几乎可以与真人媲美。这些机器人不仅能够挤眉弄眼、比心,还能炒菜、书法,甚至进行乒乓球对战,让人不禁对机器人技术的未来发展充满期待。
169家参展企业带来了600余件创新产品,其中60余款为首发新品,这些新产品的展出不仅展示了机器人技术的最前沿,也为行业内外的观众带来了深刻的启发。
AI 快报
AI 快报
百度的文心大模型在AI技术领域取得了显著的进展,其日调用量已超过6亿次,日均tokens使用量超1万亿,在国内市场中处于领先地位。这一成就得益于百度在大模型应用落地方面的持续创新和优化。
AI驱动的天气预测模型
NVIDIA推出StormCast
近期,NVIDIA Research发布了一款名为StormCast的新型生成式AI模型。该模型利用生成扩散技术,实现了3公里空间分辨率和每小时时间分辨率的高分辨率天气预测。与传统模型相比,它在与降水雷达配合使用时,能够提供最多提前6小时的预报,准确度比美国国家海洋和大气管理局(NOAA)的区域天气预报模型还要高。
NVIDIA研究人员使用了近三年半的NOAA气候数据来训练StormCast,并利用NVIDIA加速计算技术提高了计算速度。StormCast的输出结果不仅符合物理学的逼真热量和湿度动态,还能预测100多个变量,为科学家们提供了首次在AI天气模拟中确认风暴浮力的真实3D演变过程的能力。
引领AI技术新突破
文心大模型日调用量超6亿
AI 快报
AI 快报
中国领先的科技公司百度在最新发布的2024年第二季度财报中,展示了其在自动驾驶领域的显著进展和业绩增长。财报数据显示,截至7月28日,百度的自动驾驶出行服务已累计提供了超过700万次的乘车服务,其中在第二季度内提供的乘车服务数量达到约89.9万次,与去年同期相比实现了26%的同比增长。
百度在自动驾驶技术的研发和应用上持续取得突破。今年5月,公司发布了搭载Apollo第六代自动驾驶系统解决方案的无人车,这标志着百度在自动驾驶技术领域的又一重要里程碑。Apollo第六代系统解决方案采用了全球首个支持L4级自动驾驶的大模型——Apollo ADFM(Autonomous Driving Foundation Model),这一创新技术的应用,将为自动驾驶服务提供更加安全、高效的支持。
目前,百度的第六代自动驾驶车辆已经开始规模化测试,这不仅证明了百度在自动驾驶技术领域的领先地位,也预示着自动驾驶出行服务的商业化进程正在加速。随着技术的不断成熟和市场的逐步开放,百度有望在未来的自动驾驶领域占据更加重要的地位。
首届“AI小姐”选美比赛落幕
引发广泛讨论
摩洛哥的人工智能生成的“AI美女”肯扎·莱利在首届“AI小姐”选美比赛中荣获冠军,赢得了2万美金的奖金。
这场由社交媒体平台Fanvue主办的选美比赛,吸引了1500名AI生成的“佳丽”参赛,展示了AI在现实性、影响力和技术性上的潜力。
每位参赛者背后都有一个创作者或团队,他们利用OpenAI公司的DALL·E 3、Midjourney或Stable Diffusion等程序,根据文本提示而生成女性图像。
尽管AI选美比赛的评选标准声称不仅限于外表,但社会学家希拉里·利维·弗里德曼指出,人工智能选美与传统选美在本质上并无不同,都是在利用人们对漂亮女性的刻板印象。
萝卜快跑总服务超700万次
百度自动驾驶迎来里程碑
AI 快报
AI 快报
由人工智能生成的摩洛哥“AI美女”肯扎·莱利在首届“AI小姐”选美比赛中摘得桂冠
本吉奥出生于法国,在加拿大的蒙特利尔大学获得了博士学位,并长期在此从事研究与教学工作。作为蒙特利尔大学计算机科学与运筹学系的教授,他的研究涵盖了机器学习、神经网络、统计模型等多个领域。早在深度学习尚未成为主流研究方向时,本吉奥便开始探索神经网络的可能性。他的研究,为日后深度学习的爆发奠定了理论基础。
本吉奥的贡献不仅体现在学术论文中,还通过他的学生和合作者扩展到了更广泛的领域。他的研究工作对卷积神经网络(CNN)、递归神经网络(RNN)以及生成对抗网络(GAN)等技术的发展起到了至关重要的作用。
这些技术如今已广泛应用于图像识别、自然语言处理、自动驾驶等多个AI应用场景。
约书亚·本吉奥:深度学习的奠基者与AI伦理的倡导者
约书亚·本吉奥(Yoshua Bengio)是人工智能(AI)领域中不可忽视的名字。他与Geoffrey Hinton和Yann LeCun一起,被誉为“深度学习三巨头”,对现代AI的发展起到了奠基性的作用。本吉奥在深度学习、神经网络以及自然语言处理等领域的开创性研究,为当今AI技术的繁荣奠定了坚实的理论基础。他不仅是一位卓越的科学家,也是一位深刻思考AI伦理与社会影响的学者,致力于推动AI技术的负责任发展。
AI 人物志
AI 人物志
本吉奥在深度学习领域的突破性研究,使得AI技术在诸多领域得到了广泛应用。他的研究成果不仅影响了学术界,还直接推动了产业界的技术革新。
特别是在自然语言处理和图像识别领域,本吉奥的工作使得机器能够更好地理解和生成人类语言,并从海量图像数据中提取有用的信息。
他还创立了蒙特利尔AI研究所(Mila),这是世界上最大的深度学习研究中心之一,汇聚了众多顶尖的AI研究人才和企业合作伙伴。通过Mila,本吉奥致力于推动AI技术的产业应用,同时也为学术研究和工业界的合作搭建了桥梁。Mila还积极参与推动AI技术在医疗、交通、金融等行业的实际应用。
本吉奥不仅关注技术的进步,还深刻思考AI技术对社会的影响。他是AI伦理领域的积极倡导者,呼吁在AI技术的发展过程中,必须高度重视其社会责任。他认为,AI的发展应当服务于全人类的福祉,而不仅仅是为少数技术公司或特定国家谋利。
本吉奥提倡通过政策法规来规范AI技术的使用,避免其被用于侵犯隐私、加剧社会不公或引发伦理问题。他还积极参与了《蒙特利尔宣言》的起草工作,这是一个旨在确保AI技术发展遵循伦理原则的国际倡议。
该宣言呼吁在AI的研究与应用中坚持透明性、公正性、可持续性等基本原则,确保AI技术能够造福全人类。
AI 人物志
AI 人物志
作为一位AI领域的领军人物,本吉奥对AI的未来充满信心,但他也认识到技术进步所带来的挑战。
在他看来,AI技术的真正潜力在于其能够解决全球范围内的一些重大问题,如气候变化、医疗健康、教育普及等。然而,这一切的前提是AI的使用必须建立在严谨的伦理框架之上,并且要在全球范围内达成共识。
本吉奥还强调,AI技术的未来发展必须与人类的价值观相一致,技术的发展方向应当由社会共同决定。他呼吁学术界、产业界以及政策制定者共同努力,确保AI技术能够得到负责任的发展与应用。
约书亚·本吉奥的贡献不仅在于他在AI技术领域的开创性研究,更在于他对AI伦理与社会责任的深刻思考。他的工作为现代AI技术的发展奠定了基础,并且他所倡导的AI伦理理念,正在引领着全球AI技术的发展方向。在未来,随着AI技术的不断进步,本吉奥的思想和愿景将继续影响着这一领域的发展,使其更加成熟和负责任。约书亚·本吉奥无疑是AI时代的重要人物,他的影响力将在全球范围内持续扩展。
SkyReels是由昆仑万维开发的AI驱动的一站式短剧视频创作平台。该平台通过集成剧本生成、角色定制、分镜生成、剧情设定、对白/BGM自动化处理以及影片合成等功能,实现了从短剧创意到成片的全流程自动化。
SkyReels的问世标志着短剧创作进入了一个全新的时代,不再需要聘请演员、搭建场地、组织复杂的拍摄团队,创作者只需通过简单的操作,即可利用AI生成高质量的短剧内容。
工具推荐:SkyReels AI短剧平台的革命性使用体验
在传统的短剧制作过程中,创作者需要协调编剧、演员、导演、摄影、后期等多个环节,耗费大量时间和人力。而现在,随着AI技术的飞速发展,这一复杂的流程正逐步简化为一个人在电脑前轻点鼠标即可完成的工作。这一变革的核心工具就是昆仑万维推出的全球首个集成视频大模型与3D大模型的AI短剧平台——SkyReels。
AI 工具
AI 工具
使用体验:一键成剧的简单操作
SkyReels的操作极为简便,即便是没有专业背景的普通用户,也能轻松上手。以下是一个简单的使用流程:
选择创作短片:用户在平台上选择想要的短片风格,如动漫、现实主义或其他特定风格。
输入创意:输入一个简单的创意描述,系统会自动生成剧本并展示出来。
角色与场景生成:SkyReels自动生成剧本所需的角色和场景,用户可以查看并进行必要的调整。
分镜与视频生成:平台根据生成的分镜脚本,一键生成高清视频,且单次生成的视频长度可达180秒。
添加对白与BGM:通过平台的AI文本理解和多模态检索,自动生成对白和背景音乐,确保影片情节和氛围的完美契合。
SkyReels的核心功能:
1. 剧本生成:SkyScript大模型
SkyReels采用自研的剧本生成大模型SkyScript,它基于亿级高质量短剧数据集,通过逐步生成的框架输出高度结构化的剧本。无论是新手还是资深编剧,均可借助这一模型快速创作出吸引人的短剧剧本。
2. 角色定制与分镜生成:StoryboardGen大模型
在生成剧本后,SkyReels会使用StoryboardGen大模型将剧本中的角色和场景转换为分镜剧本。该模型通过对影视动画数据的逆向处理,生成高质量的工业级分镜数据,确保每个镜头的视觉效果达到最佳状态。
3. 3D生成与视频合成:WorldEngine平台
SkyReels的另一大核心技术是WorldEngine平台,它将3D生成与视频大模型深度融合。通过自研的Sky3DGen大模型,用户可以生成多样化的3D元素和场景,并与视频元素无缝融合。无论是现实场景还是虚拟世界,用户都可以轻松构建并即时查看和编辑拍摄效果,大幅提升创作效率。
4. 对白与BGM生成:AI文本理解与多模态检索
在对话与音效方面,SkyReels凭借其先进的AI文本理解技术,自动识别并生成角色对话,并通过情感化语音合成技术为旁白赋予情感表现。同时,SkyReels还能智能分析剧本中的场景氛围,自动生成匹配的背景音乐,使得短剧的每一帧画面都与音乐完美融合。
AI 工具
AI 工具
SkyReels的推出不仅极大地简化了短剧制作的流程,还降低了创作门槛,让更多人有机会参与到短剧创作中。对于内容创作者来说,SkyReels无疑是一个强大而便捷的工具,它带来了前所未有的创作自由与效率。
在这个由AI技术驱动的时代,SkyReels正引领着短剧创作的变革,为用户提供了一种全新的创作体验。无论是专业创作者还是普通用户,SkyReels都能帮助他们将创意快速转化为高质量的短剧作品,开启短剧创作的新时代。
自动编码器的简介
自动编码器(Autoencoder)是一种用于数据压缩和特征学习的神经网络模型。它通过训练一个神经网络将输入数据映射到一个低维空间(编码器),然后再从这个低维空间重建输入数据(解码器)。这种结构可以帮助模型学习数据的内在结构,并在不丢失重要信息的情况下进行压缩。
什么是:自动编码器 (Autoencoder)
AI 名词
AI 名词
自动编码器的应用
降维(Dimensionality Reduction):自动编码器可以将高维数据压缩成低维表示,类似于主成分分析(PCA),但它具有更强的非线性表示能力,可以捕捉更复杂的数据模式。
去噪(Denoising):去噪自动编码器(Denoising Autoencoder)是一种专门用于去除数据噪声的自动编码器。通过在训练过程中加入噪声,然后让模型学习去噪,自动编码器能够有效地从噪声数据中恢复原始信号。
生成模型(Generative Models):自动编码器还可以用于生成模型,如变分自动编码器(Variational Autoencoder, VAE)。VAE在学习数据分布的同时,还能生成与原始数据相似的样本,广泛应用于图像生成、数据增强等领域。
异常检测(Anomaly Detection):由于自动编码器可以学习数据的正常模式,它也常用于异常检测任务。通过检测重构误差较大的样本,自动编码器能够识别出潜在的异常数据。
自动编码器的概念
编码器(Encoder):编码器部分将输入数据映射到一个低维的潜在空间。这个低维空间通常称为“潜在表示”或“特征表示”,它包含了输入数据的核心信息,同时去除了冗余数据。
解码器(Decoder):解码器部分从低维的潜在空间中重建输入数据。理想情况下,重建后的数据与原始输入数据尽可能相似。
重构损失(Reconstruction Loss):自动编码器的训练目标是最小化输入数据与重建数据之间的差异,这个差异通常通过重构损失函数来衡量。常见的重构损失函数包括均方误差(MSE)等。
降维与特征提取:自动编码器可以用来降维,将高维数据压缩成低维的潜在表示,同时保留数据的主要特征。这在数据可视化、聚类分析等任务中非常有用。
本文利用AI工具分析研究了《五步打造适合您业务的生成式AI》(有兴趣的同事可以联系我们获取该报告全文),深入探讨了生成式AI技术在商业领域的应用潜力、实施策略以及面临的挑战。以下是对报告内容的分析:
释放生成式AI潜能:企业自动化与智能治理的五步策略
报告开篇强调了生成式AI技术的重要性,将其与历史上的微处理器、个人电脑、互联网和手机等技术革新相提并论。生成式AI通过无监督学习创建新内容,如文本或图像,已经在提升工作效率和推动创新方面展现出巨大潜力。
生成式AI的商业潜力
AI 报告研究
AI 报告研究
报告指出,尽管生成式AI技术具有巨大潜力,但企业在采用过程中需要了解其局限性,包括信任与透明度问题、缺乏背景信息以及无法独立采取行动的问题。
了解生成式AI的潜力与局限
报告提出,将生成式AI与自动化技术结合是发挥其潜力的关键。自动化可以提供必要的业务背景信息,并帮助AI模型采取行动,从而实现业务流程的优化和效率提升。
生成式AI与自动化的结合
UiPath作为一个业务自动化平台,展示了如何将生成式AI集成到自动化流程中,包括流程发现、自动化和运营等方面。UiPath利用AI技术提供持续的流程发现工具和智能文档强大的处理能力。
UiPath在生成式AI领域的应用
报告强调,要安全地使用生成式AI,企业需要建立强大的治理和控制措施,以解决安全性、偏见和数据隐私等问题。UiPath AI信任层提供了一套软件定义的治理措施,确保企业可以安全地使用生成式AI。
风险与治理
报告讨论了选择合适的云服务供应商对于支持生成式AI和自动化的重要性。云服务提供商应提供可扩展的计算资源、灵活的预算选项、强大的安全措施、创新能力、经验和专业知识,以及对服务级别的保证。
选择合适的云供应商
报告分析
报告最后提出,生成式AI将成为连接人与机器的桥梁,预计未来会出现更加专门化的系统,机器智能将不断提升,采用成本将降低。UiPath将推动企业安全、成功地采用生成式AI,实现自动化和AI技术的最大价值。
结论与未来展望
AI 展示
AI 展示
"I see artificial intelligence as a tool to unlock the mysteries of the brain."
——Yoshua Bengio
“我把人工智能看作是解锁大脑奥秘的工具。”
——约书亚·本吉奥
深度学习领域的先驱
蒙特利尔大学教授