SimToReal 概述
AKA-Sim2Real 是一个基于前视视角的自动驾驶模拟到真实(Sim2Real)系统,旨在通过模拟器采集人类驾驶数据,训练 ACT(Action Chunking Transformer)模型,并将训练好的策略迁移到真实小车上运行。
系统架构
┌─────────────────────────────────────────────────────────┐
│ AKA-Sim2Real │
│ │
│ ┌─────────────┐ ┌──────────────┐ ┌───────────┐ │
│ │ 模拟器/真车 │───▶│ 数据采集模块 │───▶│ 数据集 │ │
│ │ (Sim/Real) │ │ Episode API │ │ output/ │ │
│ └─────────────┘ └──────────────┘ │ dataset/ │ │
│ │ └────┬─────┘ │
│ │ │ │
│ │ ┌──────────────┐ ┌────▼─────┐ │
│ │ │ ACT 模型推理 │◀───│ 模型训练 │ │
│ └──────────▶│ Inference │ │Training │ │
│ │ Runtime │ └──────────┘ │
│ └──────────────┘ │
└─────────────────────────────────────────────────────────┘
系统由三个核心部分组成:
| 模块 | 说明 |
|---|---|
| 模拟器 / 真车接口 | 提供前视视角仿真环境,支持键盘手动控制与自动推理两种模式 |
| 数据采集 | 记录图像帧 + 车辆状态 + 动作,导出为结构化数据集 |
| ACT 训练与推理 | 基于 Action Chunking Transformer 进行模仿学习,支持 CVAE 与时序集成 |
技术栈
| 层级 | 技术 |
|---|---|
| 后端框架 | FastAPI + Socket.IO (Python) |
| 深度学习 | PyTorch + ResNet18 + Transformer |
| 前端 | React + TypeScript + Socket.IO Client |