‌字节跳动推出InfinityStar框架:视频生成效率提升至58秒/5秒

‌字节跳动推出InfinityStar框架:视频生成效率提升至58秒/5秒

近日,字节跳动发布的全新InfinityStar框架在视频生成领域取得突破性进展。该框架将生成5秒720p视频的时间大幅缩短至仅58秒,同时通过统一架构支持图像生成、文本转视频、视频续写等多种视觉任务,标志着AI生成技术向实用化迈出关键一步。

其创新核心在于对视频数据本质的重新解构。与传统模型将视频视为单一3D数据块不同,InfinityStar采用时空金字塔模型,显式分离空间尺度与时间维度。这一设计使模型能更高效地解耦外观信息与动态运动,显著提升生成质量。例如,在处理人物动作场景时,系统可独立优化服装纹理等静态细节与肢体运动轨迹,避免传统方法中常见的模糊或变形问题。

效率提升的另一关键来自知识继承策略。框架利用预训练的变分自编码器(VAE)作为基础,使新模型能快速学习高质量视频特征,减少训练时间和计算资源消耗。实验显示,该技术在保持视觉质量的同时,将生成速度提升至行业领先水平。开发者表示,这种”站在巨人肩膀上”的设计思路,为后续长视频生成和复杂任务处理奠定了技术基础。

行业分析指出,InfinityStar的推出不仅解决了生成式AI的效率瓶颈,其多任务兼容性更可能重塑内容生产流程。从短视频创作到影视预演,该框架或将成为连接创意构想与视觉呈现的桥梁。

原创文章,作者:泡沫大盗,如若转载,请注明出处:https://www.kejixun.co/article/738397.html

泡沫大盗的头像泡沫大盗认证作者

相关推荐

发表回复

登录后才能评论