TechnicalDiscovery 2024 #8

趣闻

levihsu/OOTDiffusion

OOTDiffusion是官方实现,模型检查点已发布。克隆存储库,创建conda环境并安装所需软件包。使用半身或全身模型进行推理。待办事项:论文、Gradio演示、推理代码、模型权重、训练代码。

Sora的前世今生:从文生图到文生视频

数据质量重要,原始文本描述视频不足,可通过re-captioning优化。DALL·E 3报告强调图片re-captioning扩展到视频。

3原理+1揭秘,将Sora拉下神坛