技术见解、项目记录与日常思考
深入解析 G1-23dof 强化学习系统的核心网络模块:FusionActorCritic、CrossAttentionFusion、MultiCriticPPO、FusionVecEnvWrapper 等完整前向传播流程。
G1-23dof Blind-Teacher 盲教师任务配置规范,详解 V0~V2 版本演进、地形自适应抬脚高度、命令自适应 Curriculum 设计。
G1-23dof 人形机器人 CPG-Flat 任务完整配置规范,详解 CPG 振荡器原理、CPG-Residual 动作接口、奖励函数设计及超参数影响分析。
Phase 1 文档阶段总结,包含 Velocity、CPG-Flat、Fusion 三大任务配置的完整索引及核心要点速查。
整理自 V1→V2 真实训练过程中的关键决策、失败排查、Curriculum 演进及 NaN 崩溃根因分析,凝结 18000+ iterations 的实战经验。
G1-23dof 人形机器人 Fusion 多传感器融合训练完整配置规范,涵盖 V0~V11 版本迭代演进、网络架构、奖励函数设计及关键超参数影响分析。
详解 G1-23dof 强化学习策略从训练到真机部署的完整流程,包括模型导出、FSM 架构、状态切换及关节控制参数配置。
G1-23dof 人形机器人 Velocity 任务完整配置规范,包含环境配置、观测空间、奖励函数、超参数及 Curriculum 设计。
系统性分析 G1-23dof 强化学习训练中各类超参数的影响机制、调参策略及实战经验总结。
G1-23dof 人形机器人 Following 目标跟随任务配置规范,详解目标观测空间设计、距离/朝向奖励函数及与 Velocity 任务的差异分析。