输入一句话创意,AI Agent 自动编排——剧本→分镜→配音→生图→动画→BGM→合成。
Agent 全流程自动化,从创意到成片
Agent SDKComfyUIWan2.1Qwen-TTS宝可梦×火影×Minecraft,+物理科普
Flux.2-KleinLoRACustomVoiceWan2.1阿里巴巴自动驾驶中心一线实践。77 万播放爆款 + 专业评测,真实路测记录。
窄路复杂路况 0 接管,49分钟一镜到底
77.3万播放XNGPL4无人物流专业视角深度评测无限XNGP一镜到底
6,852播放专业评测L4 级无人驾驶出租车真实乘坐体验
9,575播放RobotaxiAI眼镜第一视角记录大模型版XNGP体验
4,759播放AI眼镜端到端从 Loss Function 到物理 AI 数据基础设施,7 篇系列 + 深度思考,累计 400+ 赞同。
MPS/MPD 怎么定义,给组织定"目标函数",资源投在哪里
一级指标需要什么样的数据:1Hz 业务心跳、实时流、数仓
数据闭环地基工程:车端分级、Road Case/Bad Case 映射设计
每车每秒标签体系,秒级特征空间,把数据变成富矿
让异常事件自动"长成"问题单:车端/云端/离线统一触发
从问题聚类到主动挖数、训练与多层验证的完整链路
世界模型×端到端×物理AI,重新审视数据闭环的价值
语音合成、角色一致性、换脸换装、音乐生成——全本地运行在 RTX 5090D 上。
多角色 TTS,9 说话人 + 6 情绪控制
自研 LoRA 训练管线,13 版迭代
AceStep 多风格 BGM 自动生成
「贾维斯」多模态+工具调用+记忆
ReActor + CatVTON 高精度替换
Agent + ComfyUI + ffmpeg 全流程
四步管线概览——详细教程请移步 B 站和知乎。
萌悦AI 是李众力的 AI 作品合集。核心方向:AI 视频生成 + L4 自动驾驶数据闭环。所有技术方案自研,运行在本地 RTX 5090D 上,完全自主可控。
专业背景:阿里巴巴集团自动驾驶中心质量 & 数据部负责人。中南大学物联网工程。知乎「高新科技」认证技术专家,B站 UP 主「扛枪KQ」。
详细技术教程和深度思考发布在知乎和 B 站,欢迎关注交流 👇