Sora全球爆火
这事还有谁不知道吗?
2月16日, OpenAI发布了一条由视频大模型Sora所自动生成的视频,逼真的视觉效果让其在一夜之间“刷屏”。
一石激起千层浪,Sora的发布让科技从业者,投资圈、影视行业纷纷“炸锅“,甚至出现了 “AI人传人”焦虑。这招措手不及,也让Adobe、国内BAT等公司应声而动纷纷成立了自己的AI视频研究团队,街头巷尾再度燃起AI必将取代人类的话题。
目前Sora尚处于GPT-3的阶段,从发布的视频来看,有成功有失败的。但让人身临其境的高逼真画面却给人留下深刻印象,甚至让人一度分不清是真实画面还是AI生成。
▲高逼真效果
不同于别的AI生成视频,Sora跨时代的意义在于:第一,它可以发布 “60s超长视频”,而在此之前AI生成视频最长连贯时间为4s。第二,视频中出现的物体状态真切还原了现实世界光影变化并且镜头可以无缝切换等。第三,Sora所合成的视频内容与真实世界的物理规律保持一致,运动物体符合流体力学运行状态。
那么它背后的技术原理是什么呢?
简单说来,Sora是一个在不同时长、分辨率和宽高比的视频及图像上训练而成的扩散模型,它采用先进的扩散模型+Transformer架构,对合成内容中最小单元进行上下文关联有意义组合。这相当于利用若干词根词缀进行随机排列组合形成一个单词,再从这些单词里随机抓取组合形成一篇文章,而Sora则利用一批视觉子块在空间布局维度上有意义组合成一张图像、再由一张张图像有意义拼接合成一段视频。
Sora的火爆,彻底将AI这把火从文字领域烧到了视频领域,可以清晰预知它的模型参数规模也会进一步扩大,对算力的需求也会随之大幅度提升。自动视频生成:无论是细腻的画面质感、流畅的帧率,还是精准的特效处理,都对AI服务器、GPU卡等算力设备的需求提出了更高要求。Gooxi是中国领先的服务器解决方案供应商,基于AI行业发展需求推出了AI推理服务器以及大模型训练服务,能够为视觉模型训练提供强大存储与计算能力,快速生成高质量视频内容。
算力方面,Gooxi Eagle Stream平台4U10卡AI服务器是基于Intel第四代、第五代至强®可扩展处理器平台而推出,采用DDR5和PCIe5.0最新技术,能显著加快数据传输速率。它支持10张国内外品牌双宽GPU卡,整机最多可支持19个PCIe扩展插槽 ,提供了丰富的PCIe扩展能力。除此之外,服务器系统关键件冗余设计,功能部件模组化设计,能有效提升产品可靠性和可维护性。其高效稳定的数据处理和运算能力能够满足各种视频生成业务对服务器高性能、高扩展性的需求。
▲Gooxi Eagle Stream平台4U10卡AI服务器
平台方面, Gooxi白泽智算融合平台是自主研发的面向于人工智能(AI)场景的算力调度平台,采用先进的技术架构,支持主流 X86 服务器,配置 NVIDIA GPU 实现高性能加速计算,采用主流分布式存储设备,支持 TCP/IP,InfiniBand 高速网络互联。能够实现异构资源的高效管理、调度和监控;同时,平台内置Tensorflow、PyTorch、MxNet、CUDA、Gromacs、NAMD、LAMPPS、OpenVINO、oneAPI等镜像,还可连接NGC、Docker HUB等获取镜像,允许用户通过Docker Exec连接并配置镜像环境;支持通过requirements.txt、pip、conda等多种方式安装配置python包,满足不同背景和层次的用户对镜像制作的要求。
▲Gooxi 白泽智算解决方案
除此之外,白泽平台的一大优势是可进行本地化部署,提高大模型开发效率,助力企业打造全栈开发能力,有效推进AI产业化。除提供AI模型开发、AI模型训练到AI部署的完整功能外,白泽也适用于生命科学、气象预报、量子力学、油气勘探等HPC科学计算领域。
视频大模型Sora的发布,标志着视频生成技术进入了新的里程碑。Gooxi将会沿着时代的脚步,携手生态合作伙伴,共同推动AI大模型行业向前发展。
文中图源:视觉中国、Sora官方视频截取