type
status
date
slug
summary
tags
category
icon
password
📝 我的想法
国产Sora——Vidu,是自Sora发布后全球率先取得重大突破的视频大模型。其核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构,完全由团队自主研发。
我注意到Vidu生成的画面大都是西方人面孔,所以不排除使用国外开源社区提供的训练集做训练的可能,但其核心技术架构是自主研发的。而且开源社区本身就不仅仅是提供个人学习交流平台,也是人类科技合作进步并创新的媒介,借鉴参考并突破是值得鼓励的。(话说国内开源社区确实还不够壮大)
对此,众媒体评论区议论纷纷。理性的意见甚至批判是可以被接受的,心理学认为批判性思维是一种理性的、分析的思维方式,是具有目标导向的反思型思考。推动人类科技进步的壮举值得我们肯定,而不是通过踩一捧一、虚空索敌等方式展现自我认知并从中获得满足感。
另外请记住,开发者创造AI的初衷并不只是制造写实作画的工具,而是为了造福人类。可以去看看Sam Altman的博客,了解开发者们的“野心”。
p.s. 文生视频相关GitHub开源项目,除了我上个月推荐的hpcaitech / Open-Sora,还有PKU-YuanGroup / Open-Sora-Plan,后者由北大-兔展AIGC联合实验室共同发起,也在快速迭代完善中。另外,经过我两分半的检索,baofff / U-ViT疑似是开发Vidu的团队开源的核心技术U-ViT架构,看上去至少在目前,确实比前两者效率高。
📎 参考文章
- 无
有关Sora和Vidu的问题,欢迎您在底部评论区留言,一起交流~
- Author:QQS
- URL:https://qqs-fun.icu//article/14d917b6-f6c0-44d8-89be-ea25148910aa
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!