【财新网】Sora发布两个月后,国内多模态模型公司生数科技首次公布文生视频模型进展。4月27日,清华大学人工智能研究院副院长、生数科技首席科学家朱军在2024年2024年中关村论坛上发布首个文生视频模型Vidu。生数科技称,该模型全面对标Sora,能够生成最长为16秒的视频,分辨率1080P。
不过生数科技还未开放Vidu的试用,生数科技向财新表示,目前已经开放合作伙伴计划,可以填写在线表单申请加入。
朱军现场展示了Vidu与市面文生视频模型的对比效果图。例如同时向Pika、Runway旗下的文生图模型Gen-2输入“一艘木头玩具船在地毯上航行”的英文提示词,Vidu生成的视频风格明显更为梦幻,而Pika、Gen-2都更为写实。朱军还称,Vidu在理解镜头运动指令方面强于Sora。