Pixelle-Video: AI 全自动短视频引擎 — 2026 完整指南
📅 2026-05-04 · ⭐ 10,000+ GitHub Stars · AI Tools
只需输入一个主题 Pixelle-Video 就能自动完成文案撰写、AI配图生成、语音合成、背景音乐添加和一键视频合成。这个 GitHub 上最火的开源 AI 短视频引擎 在短时间内获得了超过一万颗星 成为内容创作者的新宠
什么是 Pixelle-Video
Pixelle-Video 是一个 AI 全自动短视频引擎 基于 ComfyUI 架构 整合了多个 AI 模型来实现从文字到视频的完整创作流程 它的核心理念是
- 全自动 - 输入主题 一键生成完整视频
- 模块化 - 基于 ComfyUI 可灵活替换各环节的 AI 模型
- 零门槛 - 不需要剪辑经验 也不需要写复杂提示词
- 本地运行 - 支持本地部署 保护数据隐私
- 多模型支持 - GPT、通义千问、DeepSeek、Ollama 任选
当前 Stars: 10,000+ · 语言: Python · 协议: Open Source
核心功能
📝 AI 智能文案
根据用户输入的主题 自动生成完整的视频解说词 支持多种语言和风格 可以使用 GPT-4o、DeepSeek、Qwen 等多种大语言模型
🎨 AI 配图与视频生成
为每一段解说自动生成精美的 AI 插图 支持 WAN 2.1 等主流 AI 视频模型 可生成动态视频内容而非静态图片
🗣️ 多语言语音合成
支持 Edge-TTS、Index-TTS、CosyVoice 等多种 TTS 引擎 覆盖中文、英文、韩语、日语等多语言 还可以自定义音色
🎵 背景音乐
自动为视频添加合适的背景音乐 让成品更有氛围感
📱 多尺寸输出
支持竖屏 9:16(抖音/快手格式)、横屏 16:9(YouTube/B站格式)等多种视频尺寸
🎬 多种模板
内置多种视觉风格模板 覆盖人文纪实、科技解说、文化解构、科学思辨等不同类型的内容
安装部署
Pixelle-Video 提供三种部署方式 根据自己的情况选择
方法一:Windows 整合包(推荐新手)
从 GitHub Releases 页面下载 Windows 整合包 解压后双击运行即可 无需配置环境
1. 访问 https://github.com/AIDC-AI/Pixelle-Video/releases
2. 下载最新版 Windows 整合包
3. 解压到任意目录
4. 双击 start.bat 启动
方法二:Docker 部署
docker pull aidcai/pixelle-video:latest
docker run -d -p 7860:7860 \
-v ./models:/app/models \
-v ./output:/app/output \
aidcai/pixelle-video:latest
方法三:源码安装
git clone https://github.com/AIDC-AI/Pixelle-Video.git
cd Pixelle-Video
conda create -n pixelle python=3.10
conda activate pixelle
pip install -r requirements.txt
# 配置 ComfyUI
python install_comfyui.py
# 启动
python app.py
使用教程
基本使用流程
- 启动服务 - 运行后访问 http://localhost:7860
- 输入主题 - 在输入框填写视频主题 比如"长城的历史"
- 选择模型 - 选择 LLM(文案模型)和图像生成模型
- 选择模板 - 选择适合的视觉风格模板
- 设置尺寸 - 选择竖屏或横屏输出
- 一键生成 - 点击生成 等待自动完成
API 调用
Pixelle-Video 也提供了 REST API 方便集成到自己的工作流中
curl -X POST http://localhost:7860/api/generate \
-H "Content-Type: application/json" \
-d '{
"topic": "长城的历史",
"llm_model": "deepseek",
"tts_engine": "edge-tts",
"template": "science",
"aspect_ratio": "9:16"
}'
高级功能
动作迁移
上传参考视频和图片 可以将视频中的人物动作迁移到你提供的图片上 实现各种创意效果
数字人口播
输入文案和人物照片 自动生成数字人说话的视频 非常适合知识分享类内容
自定义素材
支持上传自己的照片和视频作为素材 AI 会自动分析并生成相应的视频脚本
批量创建
支持批量创建视频任务 可一次性生成多个视频 大幅提高内容生产效率
更换 AI 模型
- 文案模型: GPT-4o / DeepSeek / Qwen / Ollama
- 图像模型: FLUX / SDXL / SD3 / WAN 2.1
- 语音模型: Edge-TTS / Index-TTS / CosyVoice / ChatTTS
与其他工具对比
| 功能 | Pixelle-Video | Runway Gen-3 | Pika Labs | 剪映 AI |
|---|---|---|---|---|
| 开源免费 | ✅ 完全开源 | ❌ 付费 | ❌ 付费 | ❌ 部分付费 |
| 全自动流程 | ✅ 文案到成片 | ❌ 仅视频生成 | ❌ 仅视频生成 | ✅ 半自动 |
| 本地部署 | ✅ 支持 | ❌ 不支持 | ❌ 不支持 | ❌ 不支持 |
| 多模型支持 | ✅ GPT/DeepSeek等 | ❌ 单一模型 | ❌ 单一模型 | ❌ 内置模型 |
| TTS 语音 | ✅ 多引擎 | ❌ 不支持 | ❌ 不支持 | ✅ 内置 |
| 数字人 | ✅ 支持 | ❌ 不支持 | ❌ 不支持 | ✅ 支持 |
| 动作迁移 | ✅ 支持 | ❌ 不支持 | ❌ 不支持 | ❌ 不支持 |
| 批量生成 | ✅ 支持 | ❌ 不支持 | ❌ 不支持 | ⚠️ 有限 |
- 图片转 Base64 — 快速将图片转为 Base64 编码
- 文本转 Slug — 生成 SEO 友好的 URL 别名
- HTML 实体编码/解码 — HTML 字符转义工具
- Base64 编码/解码 — 通用的编码解码工具
总结
Pixelle-Video 是目前最值得关注的开源 AI 短视频工具 无需付费、无需翻墙 支持本地部署 只需要一个主题就能自动生成完整的短视频 如果你是内容创作者 欢迎下载试试
更多免费的在线开发工具 欢迎访问 EasyTool.me
--- 本文仅供技术参考 Pixelle-Video 是 AIDC-AI 团队的开源项目 请遵守其开源协议