DiffDrone-PyTorch3D

基于 PyTorch3D 对 DiffPhysDrone (Zhang et al., Nature Machine Intelligence, 2025) 的独立复现与扩展。本项目加入了 CMA-ES 超参优化、多传感器融合、动态障碍物和 10 种策略网络架构（9 种为原创扩展）。整个仿真管道（渲染、物理、控制）完全可微分，策略网络直接通过梯度下降从任务目标中学习——无需强化学习，无需人类示教。

English version

演示

三种飞行场景（合成画面：RGB + 深度图）。从左到右：梯度裁剪策略穿越狭窄通道、基线策略穿梭分散障碍物、CMA-ES 衰减策略通过密集簇生障碍群。

关键指标

指标	数值	说明
SR	83.13%	严格成功率——到达目标且全程无碰撞
RR	93.75%	到达率——到达目标（可能发生轻微接触）
CFR	88.13%	无碰撞率——全程未接触任何障碍物
平均速度	1.09 m/s	成功 episode 的平均飞行速度

最佳模型 (exp21_grad_clip_goal)，基于 5 个随机种子评估。完整结果见实验。

这是什么？

DiffDrone-PyTorch3D 训练一个神经网络，让无人机仅凭前视深度相机在障碍物密集的环境中自主飞行。整个仿真器——3D 渲染、气动力学、碰撞检测——都是可微分的，策略网络直接通过梯度下降从任务目标中学习。

核心意义。 传统无人机导航依赖强化学习，需要数百万次试错交互。将仿真管道变为端到端可微分后，损失信号（"撞了吗？"）可以直接沿计算图反向传播，穿过物理引擎和渲染器，直达策略网络参数。这意味着仅需几千个训练 episode 就能完成学习，样本效率远高于强化学习方法，也避免了仿真与现实的策略梯度鸿沟。

与 DiffPhysDrone 的关系。 核心算法——GDecay 梯度衰减、Verlet 积分动力学、端到端训练循环——源自 DiffPhysDrone (Zhang et al., 2025)。本项目使用纯 PyTorch3D 重新实现了该管道（无需 CUDA 编译），并在此基础上加入了大量扩展，详见核心创新一节。

快速开始

前提条件：Python 3.10+, CUDA GPU。完整环境配置见环境安装。

# 克隆并安装依赖
git clone https://github.com/kirkchinese/Diffable_Drone_Pytorch3D.git
cd Diffable_Drone_Pytorch3D
pip install -r requirements.txt

mkdir -p ./checkpoints/thesis/exp21_grad_clip_goal
wget https://github.com/kirkchinese/Diffable_Drone_Pytorch3D/releases/download/v0.1.0/exp21_grad_clip_goal_best_ar.pth \
    -O ./checkpoints/thesis/exp21_grad_clip_goal/best_ar.pth

# 或先自行训练（见训练一节），再运行评估：
python visualize_eval.py \
    --checkpoint ./checkpoints/thesis/exp21_grad_clip_goal/best_ar.pth \
    --model_type bigger --num_episodes 4 --random_scene \
    --output_dir ./viz_results/demo --gpu 0

# 在 viz_results/demo/ 下查看生成的视频和轨迹图

系统架构

可微分训练管道

graph LR
    Scene["随机场景<br/>生成器"] -->|"OBJ 网格"| Render["PyTorch3D<br/>MeshRasterizer"]
    Render -->|"深度图 48x64"| Policy["策略网络<br/>CNN + GRU"]
    Odometry["里程计状态<br/>v, R, margin"] --> Policy
    Policy -->|"推力指令"| Physics["可微分<br/>动力学 (Verlet)"]
    Physics -->|"飞行轨迹"| Loss["任务损失<br/>速度 + 碰撞 + 平滑"]
    Loss -.->|"梯度反向传播<br/>穿过整条管道"| Policy

从左到右：场景生成、深度渲染、策略推理、物理仿真、损失计算。虚线表示梯度反向传播穿过整条计算图——从损失直达策略网络参数。

系统模块

graph TB
    subgraph Core ["核心管道"]
        train["train.py<br/>DroneTrainer"]
        model["model.py<br/>9 种架构 + 4 种 CMA-ES 控制器"]
        env["drone_env.py<br/>DroneSimulator"]
        render["drone_renderer.py<br/>PyTorch3D 封装"]
        dynamics["drone_dynamics.py<br/>Verlet + GDecay"]
        loss["loss.py<br/>12 个损失项"]
    end

    subgraph Extensions ["相比 DiffPhysDrone 的扩展"]
        scene["scene_generator.py<br/>随机网格场景生成"]
        lidar["lidar_sensor.py<br/>LiDAR 传感器模拟"]
        monitor["training_monitor.py<br/>CSV + TensorBoard 日志"]
        viz["visualize_eval.py<br/>可视化评估"]
    end

    train --> model
    train --> env
    train --> loss
    env --> render
    env --> dynamics
    env --> scene
    env --> lidar

核心创新

相比原 DiffPhysDrone 项目的扩展：

维度	DiffPhysDrone (Zhang et al.)	本项目
渲染	CUDA 自定义光线投射（需编译）	PyTorch3D MeshRasterizer（纯 Python）
策略架构	1 种 (CNN + GRU)	10 种模型：增强版、自适应、高分辨率、注意力、多尺度、残差、轻量、LiDAR、融合 + 原始模型
传感器模态	仅深度	深度、LiDAR、深度+LiDAR 融合
超参优化	人工调参	CMA-ES 四种模式：衰减控制、损失系数引导、元控制器、损失网络
场景生成	CUDA 参数化几何体	随机网格生成器，支持簇生/接地两种障碍物分布模式
障碍物	仅静态	静态 + 动态移动障碍物
多机支持	基础	分组渲染 + 张量拼接快速路径（28ms 开销优化）
梯度稳定性	GDecay	GDecay + 梯度裁剪 + EMA 影子参数
训练基础设施	单文件脚本	类封装训练器、CSV 日志、TensorBoard、checkpoint 管理

实验

共 22 组实验，覆盖 5 个研究维度（损失函数、CMA-ES 模式、传感器模态、模型架构、训练稳定性）。每组 5 个随机种子，每种子评估 80 episode。

汇总表（节选）

实验	SR (%)	RR (%)	CFR (%)	速度 (m/s)
exp21_grad_clip_goal	83.13 ± 4.74	93.75 ± 4.42	88.13 ± 3.42	1.09 ± 0.07
exp01_baseline_mse	74.38 ± 4.63	83.75 ± 5.59	88.12 ± 2.61	1.11 ± 0.04
exp05_cmaes_guide	75.00 ± 6.25	99.38 ± 1.40	75.00 ± 6.25	1.08 ± 0.02
exp04_cmaes_decay	75.00 ± 6.63	88.13 ± 8.67	84.38 ± 3.83	1.33 ± 0.08
exp09_sensor_fusion	75.00 ± 5.85	80.63 ± 5.13	88.75 ± 6.09	1.27 ± 0.08
exp10_model_attention	72.50 ± 9.48	83.13 ± 11.18	85.63 ± 2.79	1.29 ± 0.11
exp06_cmaes_meta	67.50 ± 4.20	74.37 ± 5.59	85.62 ± 6.09	2.09 ± 0.04

SR = 严格成功率（到达且无碰撞）。RR = 到达率。CFR = 无碰撞率。完整表格见 viz_results/thesis_eval/summary_aggregated.csv。

关键发现

梯度裁剪 + 目标达成 (exp21) 取得最佳严格成功率 83.13%，相比基线 74.38% 有显著提升
CMA-ES 损失系数引导 (exp05) 将到达率推至 99.38%，证明进化算法能有效搜索损失函数权重空间
CMA-ES 元控制器 (exp06) 以安全性为代价换取速度，平均速度达 2.09 m/s，为所有实验中最高
传感器融合 (exp09) 和 注意力机制 (exp10) 在增加系统复杂度的同时维持了基线水平性能
损失网络 (exp07) 未能收敛 (SR 仅 1.25%)，说明端到端可微分训练对损失函数的设计高度敏感

环境安装

# 创建虚拟环境
conda create -n diffdrone python=3.10 -y
conda activate diffdrone

# 安装 PyTorch（根据你的 CUDA 版本调整）
pip install torch==2.4.1 --index-url https://download.pytorch.org/whl/cu118

# 安装项目依赖
pip install -r requirements.txt

运行要求：Python 3.10+, CUDA GPU (CUDA 11.8/12.1), 推荐 8GB+ 显存。

训练与评估

训练模型

# 单机避障基线
python train.py @configs/thesis_base.args --save_dir ./checkpoints/exp_baseline --gpu 0

# 多机编队（每组 8 架无人机，动态障碍物）
python train.py @configs/multi_agent.args --save_dir ./checkpoints/exp_multi --gpu 0

# CMA-ES 超参优化
python train.py @configs/single_agent-CMA-ES.args --save_dir ./checkpoints/exp_cmaes --gpu 0

配置文件 (configs/*.args) 定义了全部训练超参。可在命令行覆盖任意参数，如：--lr 5e-4 --batch_size 64。

评估与可视化

# 生成飞行视频和轨迹图
python visualize_eval.py \
    --checkpoint ./checkpoints/exp_baseline/best_ar.pth \
    --model_type bigger --num_episodes 4 --random_scene \
    --output_dir ./viz_results/exp_baseline_eval --gpu 0

# 多种子批量评估
python testscript/multi_seed_eval.py --exp_dir ./checkpoints/exp_baseline --n_seeds 5

每个 episode 的输出文件：rgb.mp4, depth.mp4, composite.mp4, trajectory.png, log.csv。

项目结构

.
├── train.py                  # 主训练脚本 (DroneTrainer 类)
├── model.py                  # 策略网络 + CMA-ES 控制器
├── drone_env.py              # 可微分无人机仿真环境
├── drone_dynamics.py         # Verlet 积分动力学 + GDecay
├── drone_renderer.py         # PyTorch3D 渲染器封装
├── drone_renderer_dynamic.py # 动态障碍物渲染
├── scene_generator.py        # 随机网格场景生成器
├── lidar_sensor.py           # 可微分 LiDAR 传感器
├── loss.py                   # 12 项复合损失函数
├── navigation_utils.py       # 统一策略推理适配器
├── training_monitor.py       # CSV/TensorBoard/tqdm 日志
├── visualize_eval.py         # 可视化评估与视频生成
├── configs/                  # 训练配置文件 (.args)
├── checkpoints/              # 训练模型权重 (gitignored)
├── data/                     # 3D 网格资源 (无人机、障碍物等)
├── testscript/               # 批量评估与分析脚本
└── viz_results/              # 可视化输出 (视频、图表、CSV)

参与贡献

欢迎提交 Bug 报告和 Pull Request。如有重大修改，请先开 Issue 讨论。开发入门可参考 configs/ 中的实验配置和 testscript/ 中的评估工具。

引用与相关工作

主要引用

本项目基于 DiffPhysDrone 构建。如果在研究中使用了本代码，请引用：

@article{zhang2025learning,
  title   = {Learning vision-based agile flight via differentiable physics},
  author  = {Zhang, Yuang and Hu, Yu and Song, Yunlong and Zou, Danping and Lin, Weiyao},
  journal = {Nature Machine Intelligence},
  year    = {2025},
  publisher = {Nature Publishing Group}
}

许可证

本项目采用 GNU General Public License v3.0 许可证。详见 LICENSE。

关于作者

浙大城市学院自动化本科生。本项目为毕业设计课题。

GitHub: @kirkchinese

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DiffDrone-PyTorch3D

演示

关键指标

目录

这是什么？

快速开始

系统架构

可微分训练管道

系统模块

核心创新

实验

汇总表（节选）

关键发现

环境安装

训练与评估

训练模型

评估与可视化

项目结构

参与贡献

引用与相关工作

主要引用

相关工作

许可证

关于作者

About

Uh oh!

Releases 1

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 71 Commits
assets		assets
configs		configs
data		data
ipynb		ipynb
testscript		testscript
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
README_EN.md		README_EN.md
drone_dynamics.py		drone_dynamics.py
drone_env.py		drone_env.py
drone_renderer.py		drone_renderer.py
drone_renderer_dynamic.py		drone_renderer_dynamic.py
dynamic_scene_test.ipynb		dynamic_scene_test.ipynb
lidar_sensor.py		lidar_sensor.py
loss.py		loss.py
model.py		model.py
navigation_utils.py		navigation_utils.py
requirements.txt		requirements.txt
scene_generator.py		scene_generator.py
train.py		train.py
train_test_sample.ipynb		train_test_sample.ipynb
training_monitor.py		training_monitor.py
visualize_eval.py		visualize_eval.py

Folders and files

Latest commit

History

Repository files navigation

DiffDrone-PyTorch3D

演示

关键指标

目录

这是什么？

快速开始

系统架构

可微分训练管道

系统模块

核心创新

实验

汇总表（节选）

关键发现

环境安装

训练与评估

训练模型

评估与可视化

项目结构

参与贡献

引用与相关工作

主要引用

相关工作

许可证

关于作者

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages