G1-23dof 强化学习网络架构深度解析

深入解析 G1-23dof 强化学习系统的核心网络模块:FusionActorCritic、CrossAttentionFusion、MultiCriticPPO、FusionVecEnvWrapper 等完整前向传播流程。

G1-23dof Blind-Teacher 盲教师任务配置规范 (V0~V2)

G1-23dof Blind-Teacher 盲教师任务配置规范,详解 V0~V2 版本演进、地形自适应抬脚高度、命令自适应 Curriculum 设计。

G1-23dof CPG-Flat 任务训练配置规范

G1-23dof 人形机器人 CPG-Flat 任务完整配置规范,详解 CPG 振荡器原理、CPG-Residual 动作接口、奖励函数设计及超参数影响分析。

G1-23dof 强化学习训练文档 Phase 1 总结

Phase 1 文档阶段总结,包含 Velocity、CPG-Flat、Fusion 三大任务配置的完整索引及核心要点速查。

G1-23dof 强化学习训练实战复盘与经验总结

整理自 V1→V2 真实训练过程中的关键决策、失败排查、Curriculum 演进及 NaN 崩溃根因分析,凝结 18000+ iterations 的实战经验。

G1-23dof Fusion 多传感器融合任务配置规范 (V0~V11)

G1-23dof 人形机器人 Fusion 多传感器融合训练完整配置规范,涵盖 V0~V11 版本迭代演进、网络架构、奖励函数设计及关键超参数影响分析。

G1-23dof 强化学习策略部署架构

详解 G1-23dof 强化学习策略从训练到真机部署的完整流程,包括模型导出、FSM 架构、状态切换及关节控制参数配置。

G1-23dof Velocity 任务训练配置规范

G1-23dof 人形机器人 Velocity 任务完整配置规范,包含环境配置、观测空间、奖励函数、超参数及 Curriculum 设计。

G1-23dof 强化学习超参数系统调优指南

系统性分析 G1-23dof 强化学习训练中各类超参数的影响机制、调参策略及实战经验总结。

G1-23dof Following 目标跟随任务配置规范

G1-23dof 人形机器人 Following 目标跟随任务配置规范,详解目标观测空间设计、距离/朝向奖励函数及与 Velocity 任务的差异分析。

Hello World — 我的第一篇博客

这是我的个人网站的第一篇文章,记录建站过程和一些想法。