hpcaitech/Open-Sora

GitHub: hpcaitech/Open-Sora

开源视频生成大模型项目,以低成本实现接近Sora级别的文本/图像到视频生成能力

Stars: 28669 | Forks: 2905

## Open-Sora:让所有人都能高效制作视频 我们设计并实现了 **Open-Sora**,这是一项致力于**高效**制作高质量视频的倡议。我们希望让所有人都能访问模型、工具和所有细节。通过拥抱**开源**原则,Open-Sora 不仅普及了高级视频生成技术的访问权限,还提供了一个精简且用户友好的平台,简化了视频生成的复杂性。通过 Open-Sora,我们的目标是促进内容创作领域的创新、创造力和包容性。 🎬 如需专业的 AI 视频生成产品,请尝试 [Video Ocean](https://video-ocean.com/) —— 由更强大的模型驱动。
## 📰 新闻 - **[2025.03.12]** 🔥 我们发布了 **Open-Sora 2.0** (11B)。🎬 11B 模型在 📐VBench 和 📊人类偏好上与 11B 的 HunyuanVideo 及 30B 的 Step-Video 达到了[同等水平](#evaluation)。🛠️ 完全开源:Checkpoints 和仅需 **$200K** 的训练代码。[[报告]](https://arxiv.org/abs/2503.09642v1) - **[2025.02.20]** 🔥 我们发布了 **Open-Sora 1.3** (1B)。随着升级的 VAE 和 Transformer 架构,我们生成视频的质量得到了极大提升 🚀。[[checkpoints]](#open-sora-13-model-weights) [[报告]](/docs/report_04.md) [[演示]](https://huggingface.co/spaces/hpcai-tech/open-sora) - **[2024.12.23]** 视频生成模型的开发成本节省了 50%!现在提供带有 H200 GPU 代金券的开源解决方案。[[博客]](https://company.hpc-ai.com/blog/the-development-cost-of-video-generation-models-has-saved-by-50-open-source-solutions-are-now-available-with-h200-gpu-vouchers) [[代码]](https://github.com/hpcaitech/Open-Sora/blob/main/scripts/train.py) [[代金券]](https://colossalai.org/zh-Hans/docs/get_started/bonus/) - **[2024.06.17]** 我们发布了 **Open-Sora 1.2**,其中包括 **3D-VAE**、**rectified flow** 和 **score condition**。视频质量有了极大提升。[[checkpoints]](#open-sora-12-model-weights) [[报告]](/docs/report_03.md) [[arxiv]](https://arxiv.org/abs/2412.20404) - **[2024.04.25]** 🤗 我们在 Hugging Face Spaces 上发布了 [Open-Sora 的 Gradio demo](https://huggingface.co/spaces/hpcai-tech/open-sora)。 - **[2024.04.25]** 我们发布了 **Open-Sora 1.1**,支持 **2s~15s、144p 到 720p、任意宽高比** 的文本生成图像、**文本生成视频、图像生成视频、视频生成视频、无限时长** 生成。此外,还发布了完整的视频处理流水线。[[checkpoints]](#open-sora-11-model-weights) [[报告]](/docs/report_02.md) - **[2024.03.18]** 我们发布了 **Open-Sora 1.0**,一个完全开源的视频生成项目。Open-Sora 1.0 支持完整的视频数据预处理流水线、使用 加速的训练、推理等功能。我们的模型仅需 3 天训练即可生成 2 秒的 512x512 视频。[[checkpoints]](#open-sora-10-model-weights) [[博客]](https://hpc-ai.com/blog/open-sora-v1.0) [[报告]](/docs/report_01.md) - **[2024.03.04]** Open-Sora 提供了成本降低 46% 的训练方案。 [[博客]](https://hpc-ai.com/blog/open-sora) 📍 由于 Open-Sora 处于活跃开发中,我们保留了不同版本的不同分支。最新版本是 [main](https://github.com/hpcaitech/Open-Sora)。旧版本包括:[v1.0](https://github.com/hpcaitech/Open-Sora/tree/opensora/v1.0)、[v1.1](https://github.com/hpcaitech/Open-Sora/tree/opensora/v1.1)、[v1.2](https://github.com/hpcaitech/Open-Sora/tree/opensora/v1.2)、[v1.3](https://github.com/hpcaitech/Open-Sora/tree/opensora/v1.3)。 ## 🎥 最新演示 为了方便起见,演示以压缩的 GIF 格式呈现。如需原始质量的样本及其对应的提示词,请访问我们的 [图库](https://hpcaitech.github.io/Open-Sora/)。 | **5s 1024×576** | **5s 576×1024** | **5s 576×1024** | | -------------------------------------------------------------------------------------------------------------------------------------------------- | -------------------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------- | | [](https://streamable.com/e/8g9y9h?autoplay=1) | [](https://streamable.com/e/k50mnv?autoplay=1) | [](https://streamable.com/e/bzrn9n?autoplay=1) | | [](https://streamable.com/e/dsv8da?autoplay=1) | [](https://streamable.com/e/3wif07?autoplay=1) | [](https://streamable.com/e/us2w7h?autoplay=1) | | [](https://streamable.com/e/yfwk8i?autoplay=1) | [](https://streamable.com/e/jgjil0?autoplay=1) | [](https://streamable.com/e/lsoai1?autoplay=1) |
OpenSora 1.3 演示 | **5s 720×1280** | **5s 720×1280** | **5s 720×1280** | | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | [](https://streamable.com/e/r0imrp?quality=highest&autoplay=1) | [](https://streamable.com/e/hfvjkh?quality=highest&autoplay=1) | [](https://streamable.com/e/kutmma?quality=highest&autoplay=1) | | [](https://streamable.com/e/osn1la?quality=highest&autoplay=1) | [](https://streamable.com/e/l1pzws?quality=highest&autoplay=1) | [](https://streamable.com/e/2vqari?quality=highest&autoplay=1) | | [](https://streamable.com/e/1in7d6?quality=highest&autoplay=1) | [](https://streamable.com/e/e9bi4o?quality=highest&autoplay=1) | [](https://streamable.com/e/09z7xi?quality=highest&autoplay=1) | | [](https://streamable.com/e/16c3hk?quality=highest&autoplay=1) | [](https://streamable.com/e/wi250w?quality=highest&autoplay=1) | [](https://streamable.com/e/vw5b64?quality=highest&autoplay=1) |
OpenSora 1.2 演示 | **4s 720×1280** | **4s 720×1280** | **4s 720×1280** | | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/7895aab6-ed23-488c-8486-091480c26327) | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/20f07c7b-182b-4562-bbee-f1df74c86c9a) | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/3d897e0d-dc21-453a-b911-b3bda838acc2) | | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/644bf938-96ce-44aa-b797-b3c0b513d64c) | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/272d88ac-4b4a-484d-a665-8d07431671d0) | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/ebbac621-c34e-4bb4-9543-1c34f8989764) | | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/a1e3a1a3-4abd-45f5-8df2-6cced69da4ca) | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/d6ce9c13-28e1-4dff-9644-cc01f5f11926) | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/561978f8-f1b0-4f4d-ae7b-45bec9001b4a) |
OpenSora 1.1 演示 | **2s 240×426** | **2s 240×426** | | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | [](https://github.com/hpcaitech/Open-Sora-dev/assets/99191637/c31ebc52-de39-4a4e-9b1e-9211d45e05b2) | [](https://github.com/hpcaitech/Open-Sora-dev/assets/99191637/c31ebc52-de39-4a4e-9b1e-9211d45e05b2) | | [](https://github.com/hpcaitech/Open-Sora-dev/assets/99191637/f7ce4aaa-528f-40a8-be7a-72e61eaacbbd) | [](https://github.com/hpcaitech/Open-Sora-dev/assets/99191637/5d58d71e-1fda-4d90-9ad3-5f2f7b75c6a9) | | **2s 426×240** | **4s 480×854** | | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | [](https://github.com/hpcaitech/Open-Sora-dev/assets/99191637/34ecb4a0-4eef-4286-ad4c-8e3a87e5a9fd) | [](https://github.com/hpcaitech/Open-Sora-dev/assets/99191637/c1619333-25d7-42ba-a91c-18dbc1870b18)| **16s 320×320** | **16s 224×448** | **2s 426×240** | | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/3cab536e-9b43-4b33-8da8-a0f9cf842ff2) | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/9fb0b9e0-c6f4-4935-b29e-4cac10b373c4) | [](https://github.com/hpcaitech/Open-Sora-dev/assets/99191637/3e892ad2-9543-4049-b005-643a4c1bf3bf) |
OpenSora 1.0 演示 | **2s 512×512** | **2s 512×512** | **2s 512×512** | | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ | | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/de1963d3-b43b-4e68-a670-bb821ebb6f80) | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/13f8338f-3d42-4b71-8142-d234fbd746cc) | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/fa6a65a6-e32a-4d64-9a9e-eabb0ebb8c16) | | 森林地区宁静的夜景。[...] 视频是延时摄影,捕捉了从白天到夜晚的过渡,湖泊和森林作为恒定的背景。 | 无人机升空镜头捕捉了海岸悬崖的壮丽美景,[...] 水面轻轻拍打着岩石基部,绿色植物依附在悬崖顶部。 | 瀑布从悬崖倾泻而下落入宁静湖泊的壮丽美景。[...] 镜头角度提供了瀑布的鸟瞰图。 | | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/64232f84-1b36-4750-a6c0-3e610fa9aa94) | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/983a1965-a374-41a7-a76b-c07941a6c1e9) | [](https://github.com/hpcaitech/Open-Sora/assets/99191637/ec10c879-9767-4c31-865f-2e8d6cf11e65) | | 夜晚繁忙的城市街道,充满了汽车前灯的光辉和路灯的环境光。[...] | 向日葵田野的充满活力的美景。向日葵排列整齐,营造出一种秩序感和对称感。[...] | 宁静的水下场景,一只海龟游过珊瑚礁。海龟有着绿褐色的壳 [...] | 视频被下采样为 `.gif` 以便展示。点击查看原始视频。提示词为便于展示进行了修剪, 请参阅[此处](/assets/texts/t2v_samples.txt)查看完整提示词。
## 🔆 报告 - **[Open-Sora 2.0 技术报告](https://arxiv.org/abs/2503.09642v1)** - **[逐步训练或微调您自己的模型](docs/train.md)** - **[逐步训练和评估视频自动编码器](docs/ae.md)** - **[访问高压缩视频自动编码器](docs/hcae.md)** - 以前版本的报告(最好在相应分支中查看): - [Open-Sora 1.3](docs/report_04.md):shift-window attention、统一时空 VAE 等。 - [Open-Sora 1.2](docs/report_03.md),[技术报告](https://arxiv.org/abs/2412.20404):rectified flow、3d-VAE、score condition、评估等。 - [Open-Sora 1.1](docs/report_02.md):多分辨率/长度/宽高比、图像/视频条件/编辑、数据预处理等。 - [Open-Sora 1.0](docs/report_01.md):架构、captioning 等。 📍 由于 Open-Sora 处于活跃开发中,我们保留了不同版本的不同分支。最新版本是 [main](https://github.com/hpcaitech/Open-Sora)。旧版本包括:[v1.0](https://github.com/hpcaitech/Open-Sora/tree/opensora/v1.0)、[v1.1](https://github.com/hpcaitech/Open-Sora/tree/opensora/v1.1)、[v1.2](https://github.com/hpcaitech/Open-Sora/tree/opensora/v1.2)、[v1.3](https://github.com/hpcaitech/Open-Sora/tree/opensora/v1.3)。 ## 快速开始 ### 安装 ``` # 创建并激活 virtual env(以 conda 为例) conda create -n opensora python=3.10 conda activate opensora # 下载 repo git clone https://github.com/hpcaitech/Open-Sora cd Open-Sora # 确保 torch >= 2.4.0 pip install -v . # for development mode, `pip install -v -e .` pip install xformers==0.0.27.post2 --index-url https://download.pytorch.org/whl/cu121 # install xformers according to your cuda version pip install flash-attn --no-build-isolation ``` (可选)您可以安装 flash attention 3 以获得更快的速度。 ``` git clone https://github.com/Dao-AILab/flash-attention # 4f0640d5 cd flash-attention/hopper python setup.py install ``` ### 模型下载 我们的 11B 模型支持 256px 和 768px 分辨率。T2V 和 I2V 均由一个模型支持。🤗 [Huggingface](https://huggingface.co/hpcai-tech/Open-Sora-v2) 🤖 [ModelScope](https://modelscope.cn/models/luchentech/Open-Sora-v2)。 从 huggingface 下载: ``` pip install "huggingface_hub[cli]" huggingface-cli download hpcai-tech/Open-Sora-v2 --local-dir ./ckpts ``` 从 ModelScope 下载: ``` pip install modelscope modelscope download hpcai-tech/Open-Sora-v2 --local_dir ./ckpts ``` ### 文本生成视频 我们的模型针对图像生成视频进行了优化,但也可用于文本生成视频。为了生成高质量视频,在 flux 文本生成图像模型的帮助下,我们构建了一个文本-图像-视频流水线。对于 256x256 分辨率: ``` # 生成一个 given prompt torchrun --nproc_per_node 1 --standalone scripts/diffusion/inference.py configs/diffusion/inference/t2i2v_256px.py --save-dir samples --prompt "raining, sea" # 使用 offloading 节省内存 torchrun --nproc_per_node 1 --standalone scripts/diffusion/inference.py configs/diffusion/inference/t2i2v_256px.py --save-dir samples --prompt "raining, sea" --offload True # 使用 csv 生成 torchrun --nproc_per_node 1 --standalone scripts/diffusion/inference.py configs/diffusion/inference/t2i2v_256px.py --save-dir samples --dataset.data-path assets/texts/example.csv ``` 对于 768x768 分辨率: ``` # One GPU torchrun --nproc_per_node 1 --standalone scripts/diffusion/inference.py configs/diffusion/inference/t2i2v_768px.py --save-dir samples --prompt "raining, sea" # Multi-GPU with colossalai sp torchrun --nproc_per_node 8 --standalone scripts/diffusion/inference.py configs/diffusion/inference/t2i2v_768px.py --save-dir samples --prompt "raining, sea" ``` 您可以通过 `--aspect_ratio` 调整生成宽高比,通过 `--num_frames` 调整生成长度。aspect_ratio 的候选值包括 `16:9`、`9:16`、`1:1`、`2.39:1`。num_frames 的候选值应为 `4k+1` 且小于 129。 您也可以通过以下方式直接运行文本生成视频: ``` # One GPU 用于 256px torchrun --nproc_per_node 1 --standalone scripts/diffusion/inference.py configs/diffusion/inference/256px.py --prompt "raining, sea" # Multi-GPU 用于 768px torchrun --nproc_per_node 8 --standalone scripts/diffusion/inference.py configs/diffusion/inference/768px.py --prompt "raining, sea" ``` ### 图像生成视频 给定一个提示词和一张参考图像,您可以使用以下命令生成视频: ``` # 256px torchrun --nproc_per_node 1 --standalone scripts/diffusion/inference.py configs/diffusion/inference/256px.py --cond_type i2v_head --prompt "A plump pig wallows in a muddy pond on a rustic farm, its pink snout poking out as it snorts contentedly. The camera captures the pig's playful splashes, sending ripples through the water under the midday sun. Wooden fences and a red barn stand in the background, framed by rolling green hills. The pig's muddy coat glistens in the sunlight, showcasing the simple pleasures of its carefree life." --ref assets/texts/i2v.png # 256px with csv torchrun --nproc_per_node 1 --standalone scripts/diffusion/inference.py configs/diffusion/inference/256px.py --cond_type i2v_head --dataset.data-path assets/texts/i2v.csv # Multi-GPU 768px torchrun --nproc_per_node 8 --standalone scripts/diffusion/inference.py configs/diffusion/inference/768px.py --cond_type i2v_head --dataset.data-path assets/texts/i2v.csv ``` ## 高级用法 ### 运动分数 在训练期间,我们将运动分数提供给文本提示词。在推理过程中,您可以使用以下命令生成带有运动分数的视频(默认分数为 4): ``` torchrun --nproc_per_node 1 --standalone scripts/diffusion/inference.py configs/diffusion/inference/t2i2v_256px.py --save-dir samples --prompt "raining, sea" --motion-score 4 ``` 我们还提供了一个动态运动分数评估器。设置您的 OpenAI API key 后,您可以使用以下命令来评估视频的运动分数: ``` torchrun --nproc_per_node 1 --standalone scripts/diffusion/inference.py configs/diffusion/inference/t2i2v_256px.py --save-dir samples --prompt "raining, sea" --motion-score dynamic ``` | 分数 | 1 | 4 | 7 | | ----- | ------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------- | | | | | | ### 提示词优化 我们利用 ChatGPT 来优化提示词。您可以使用以下命令来优化提示词。该功能适用于文本生成视频和图像生成视频。 ``` export OPENAI_API_KEY=sk-xxxx torchrun --nproc_per_node 1 --standalone scripts/diffusion/inference.py configs/diffusion/inference/t2i2v_256px.py --save-dir samples --prompt "raining, sea" --refine-prompt True ``` ### 可复现性 为了使结果可复现,您可以通过以下方式设置随机种子: ``` torchrun --nproc_per_node 1 --standalone scripts/diffusion/inference.py configs/diffusion/inference/t2i2v_256px.py --save-dir samples --prompt "raining, sea" --sampling_option.seed 42 --seed 42 ``` 使用 `--num-sample k` 为每个提示词生成 `k` 个样本。 ## 计算效率 我们在 H100/H800 GPU 上测试了文本生成视频的计算效率。对于 256x256,我们使用 colossalai 的 tensor parallelism,并使用了 `--offload True`。对于 768x768,我们使用 colossalai 的 sequence parallelism。所有测试均使用步数 50。结果以以下格式呈现:$\color{blue}{\text{总时间 (秒)}}/\color{red}{\text{峰值 GPU 显存 (GB)}}$ | 分辨率 | 1x GPU | 2x GPUs | 4x GPUs | 8x GPUs | | ---------- | -------------------------------------- | ------------------------------------- | ------------------------------------- | ------------------------------------- | | 256x256 | $\color{blue}{60}/\color{red}{52.5}$ | $\color{blue}{40}/\color{red}{44.3}$ | $\color{blue}{34}/\color{red}{44.3}$ | | | 768x768 | $\color{blue}{1656}/\color{red}{60.3}$ | $\color{blue}{863}/\color{red}{48.3}$ | $\color{blue}{466}/\color{red}{44.3}$ | $\color{blue}{276}/\color{red}{44.3}$ | ## 评估 在 [VBench](https://huggingface.co/spaces/Vchitect/VBench_Leaderboard) 上,与 Open-Sora 1.2 相比,Open-Sora 2.0 显著缩小了与 OpenAI Sora 的差距,从 4.52% → 0.69%。 ![VBench](https://github.com/hpcaitech/Open-Sora-Demo/blob/main/readme/v2_vbench.png) 人类偏好结果显示我们的模型与 HunyuanVideo 11B 和 Step-Video 30B 相当。 ![Win Rate](https://github.com/hpcaitech/Open-Sora-Demo/blob/main/readme/v2_winrate.png) 凭借强大的性能,Open-Sora 2.0 具有成本效益。 ![Cost](https://github.com/hpcaitech/Open-Sora-Demo/blob/main/readme/v2_cost.png) ## 致谢 这里我们仅列出了部分项目。关于其他工作和数据集,请参阅我们的报告。 - [ColossalAI](https://github.com/hpcaitech/ColossalAI):一个强大的大模型并行加速和优化系统。 - [DiT](https://github.com/facebookresearch/DiT):基于 Transformers 的可扩展扩散模型。 - [OpenDiT](https://github.com/NUS-HPC-AI-Lab/OpenDiT):DiT 训练的加速方案。我们采用了 OpenDiT 中宝贵的加速策略来推进训练进度。 - [PixArt](https://github.com/PixArt-alpha/PixArt-alpha):一个开源的基于 DiT 的文本生成图像模型。 - [Flux](https://github.com/black-forest-labs/flux):一个强大的文本生成图像模型。 - [Latte](https://github.com/Vchitect/Latte):高效训练视频 DiT 的一种尝试。 - [HunyuanVideo](https://github.com/Tencent/HunyuanVideo/tree/main?tab=readme-ov-file):开源文本生成视频模型。 - [StabilityAI VAE](https://huggingface.co/stabilityai/sd-vae-ft-mse-original):一个强大的图像 VAE 模型。 - [DC-AE](https://github.com/mit-han-lab/efficientvit):用于图像压缩的深度压缩自动编码器。 - [CLIP](https://github.com/openai/CLIP):一个强大的文本-图像嵌入模型。 - [T5](https://github.com/google-research/text-to-text-transfer-transformer):一个强大的文本编码器。 - [LLaVA](https://github.com/haotian-liu/LLaVA):一个基于 [Mistral-7B](https://huggingface.co/mistralai/Mistral-7B-v0.1) 和 [Yi-34B](https://huggingface.co/01-ai/Yi-34B) 的强大图像描述模型。 - [PLLaVA](https://github.com/magic-research/PLLaVA):一个强大的视频描述模型。 - [MiraData](https://github.com/mira-space/MiraData):一个具有长时长和结构化描述的大规模视频数据集。 ## 引用 ``` @article{opensora, title={Open-sora: Democratizing efficient video production for all}, author={Zheng, Zangwei and Peng, Xiangyu and Yang, Tianji and Shen, Chenhui and Li, Shenggui and Liu, Hongxin and Zhou, Yukun and Li, Tianyi and You, Yang}, journal={arXiv preprint arXiv:2412.20404}, year={2024} } @article{opensora2, title={Open-Sora 2.0: Training a Commercial-Level Video Generation Model in $200k}, author={Xiangyu Peng and Zangwei Zheng and Chenhui Shen and Tom Young and Xinying Guo and Binluo Wang and Hang Xu and Hongxin Liu and Mingyan Jiang and Wenjun Li and Yuhui Wang and Anbang Ye and Gang Ren and Qianran Ma and Wanying Liang and Xiang Lian and Xiwen Wu and Yuting Zhong and Zhuangyan Li and Chaoyu Gong and Guojun Lei and Leijun Cheng and Limin Zhang and Minghao Li and Ruijie Zhang and Silan Hu and Shijie Huang and Xiaokang Wang and Yuanheng Zhao and Yuqi Wang and Ziang Wei and Yang You}, year={2025}, journal={arXiv preprint arXiv:2503.09642}, } ``` ## Star 趋势 [![Star History Chart](https://api.star-history.com/svg?repos=hpcaitech/Open-Sora&type=Date)](https://star-history.com/#hpcaitech/Open-Sora&Date)
标签:AIGC, AI视频, Apex, ColossalAI, HPC, Open-Sora, Sora替代, Transformer, 人工智能, 内容创作, 凭据扫描, 图生视频, 多模态大模型, 开源Sora, 扩散模型, 文生视频, 机器学习, 深度学习, 用户模式Hook绕过, 系统调用监控, 自动化视频, 视频制作, 视频合成, 视频生成, 逆向工具