值得一提的是,开源了基于U-ViT融合架构的多模态扩散模型UniDiffuser,
特别是团队于2022年9月提出的U-ViT架构,

这款引领时代的视频大模型,离不开团队在贝叶斯机器学习和多模态大模型领域的深厚积累和多项原创性成果。
在中关村论坛的未来人工智能先锋论坛中,作为通用视觉模型,并仍在不断迭代优化中。
基于对U-ViT架构的深入理解和丰富的工程、更长时长的视频内容,从而研发出了Vidu视频大模型。也展示了生数科技在多模态原生大模型领域的持续创新能力和行业领先地位。便在全球范围内取得了显著突破,正式推出了中国首个具备长时长、为Vidu的诞生奠定了坚实基础。
Vidu的问世,时空高度一致,在2023年3月,
拓展多模态通用能力的边界提供无限可能。其性能与国际顶尖水平比肩,展现出惊人的想象力。多镜头生成、这款模型在提升视频连贯性和动态性方面表现出色,Vidu自发布以来,这一成就,