简介 近况 科研与项目 实习经历 技术能力 教育与荣誉

郭一泽 | Yize Guo

郭一泽个人照片

我是中国科学技术大学信息科学技术学院 AIR Lab 2026 届人工智能硕士研究生,师从秦家虎教授。 我的研究主要围绕具身智能、Vision-Language-Action 模型、模仿学习、机器人运动规划与强化学习展开。

我比较关心的问题不仅仅是单一模型指标,而是如何把训练策略、模型架构和真实机器人系统部署串成一个完整闭环。 因此,除了算法设计,我也持续参与双臂平台搭建、底层控制、遥操作数据优化增广、训练管线构建以及实机推理部署。

目前的工作重点包括:多任务 VLA 训练与后训练、基于 flow matching 的模仿学习、多任务策略切换与深度信息对齐、 Franka 机械臂的可控接触运动规划,以及四足机器人强化学习与 sim2real 部署。

研究兴趣:具身智能、VLA / 模仿学习、机器人规划与控制、强化学习与真实系统部署。
联系邮箱:guoyz221@mail.ustc.edu.cn


近况

科研与项目

AGIBOT WORLD CHALLENGE 2026 @ ICRA 智元具身智能挑战赛

VLA 多任务训练 / 深度信息对齐 / Multi-LoRA / RL 后训练 / 数据飞轮

面向十类涵盖长程与精细操作的真实机器人任务,基于 ACOT-VLA 搭建多任务训练与后训练框架。

  • 针对数据量不均衡问题,设计带权重的训练采样策略,使模型得分从 6.2 提升至 7.04。
  • 针对负迁移和策略干扰,设计单任务 LoRA 微调与 Multi-LoRA 动态切换策略,将切换延迟从 100ms+ 压缩到 1ms 内,得分提升至 7.42。
  • 引入 VGGT 做深度信息对齐并重构训练流程,使训练速度提升 2x+;结合 flow matching 初始噪声优化与 rule-based 纠偏,最终将综合得分提升至 8.09。

CT-VAM:面向高效视觉运动控制的轻量机器人策略模型(CoRL 2026 在投)

Jiacheng Li*, Yize Guo*, Jiabin Guo*, Qingchen Liu, Jiahu Qin. CT-VAM: A Cerebello-Thalamic-Inspired Vision-Action Model for Efficient Visuomotor Control. arXiv:2606.09572, 2026.

提出受小脑 - 丘脑机制启发的视觉 - 动作模型,将高层任务意图和低层高频视觉反馈控制解耦,用于轻量化闭环机器人操作。

  • 设计 TARS 流分离条件注意力模块,分别建模动作、视觉、本体状态和任务条件信息,缓解密集视觉 token 对任务条件的干扰。
  • 提出 Flow-Consistent Inpainting 异步动作块生成机制,在执行当前动作块时预测下一动作块,并通过重叠约束保证动作连续性。
  • 在 LIBERO 仿真基准中以 68M 参数达到 82.1% 平均成功率,并在 OpenArm 与 Jetson Orin NX 上完成真实平台验证。

DG-ACMP:障碍物密集环境下面向可控接触的机械臂运动规划(IEEE RA-L 2026)

Yize Guo, Jiacheng Li, Qingchen Liu, Weiming Fu, Jiahu Qin, Yu Kang. DG-ACMP: Deformation-Guided Motion Planning With Acceptable Contacts for Manipulators in Cluttered Environments. IEEE Robotics and Automation Letters, 11(6):7046-7053, 2026.

研究拥挤 / 可变形环境中的机械臂运动规划,允许“安全、可控”的接触以提升可达性和任务成功率。

  • 提出 ACMP 框架,将接触视为可控代价而非绝对禁止,提高狭窄空间中的可行性。
  • 使用变形场和粘弹接触模型获得连续可导的接触代价与梯度,并构建结合高斯过程先验的因子图 MAP 轨迹优化方法。
  • 在仿真与 Franka 实机上完成验证,相比传统优化方法在成功率、求解时间与接触代价等指标上综合表现更优。

基于 flow matching 的模仿学习多模态约束研究

研究主流 flow matching 模型在顺序约束任务中的模态不可控与计算效率问题。

  • 采用 streaming flow matching 替代传统扩散范式,将扩散过程放在状态维度,支持“边生成边执行”,降低推理延迟。
  • 设计模态引导网络,提升多模态轨迹生成的可控性,并解决 streaming 生成中的轨迹拼接稳定性问题。

实习经历

科大讯飞研究院 · 研究算法实习生

主要参与端到端语音识别降噪适配优化与流式语音识别热词增强框架搭建。

  • 针对 EAA-Net 降噪后端到端语音模型错误率不降反增的问题,构建原始数据与降噪数据的混合训练集,并采用 layer-wise learning rate 衰减策略进行微调,使噪声测试集 WER 从 31.03% 降至 30.01%。
  • 搭建热词增强框架,引入 efficient conformer、业务数据训练与浅融合方案,将整体 WER 从 9.508% 降至 8.228%,关键词 BWER 从 34.224% 降至 20.822%。
  • 设计热词过滤网络替换原有过滤策略,使单次处理速度提升 6.2 倍。

技术能力

模型与学习

  • VLA / 模仿学习训练策略、模型架构改进与实机部署经验。
  • 具备 spatial-forcing、DSRL、Multi-LoRA、RL 后训练等实操经验。
  • 掌握 DQN、PPO 等强化学习方法,具备四足机器人策略训练和迁移部署经历。

机器人系统与规控

  • 具身机器人系统全栈落地经验,包括双臂硬件搭建、底层控制、遥操作数采、训练与实机推理。
  • 熟悉 IK、重力补偿、机器人运动学与动力学,具备 Franka 机械臂实机部署经验。
  • 掌握 LQR、iLQR / DDP、MPC、GPMP,以及 A*、RRT、Dijkstra 等规划算法。
VLA Imitation Learning Flow Matching Franka Unitree Go2 MPC GPMP Isaac Gym

教育与荣誉

教育背景

  • 中国科学技术大学,信息科学技术学院,人工智能硕士研究生,2023.08 - 2026.06(2026 届),导师:秦家虎教授
  • 河海大学,人工智能与自动化学院,自动化本科,2019.08 - 2023.06,保研,绩点排名前 10%,导师:王冰教授

竞赛与成果

  • AGIBOT WORLD CHALLENGE 2026 @ ICRA 具身智能挑战赛前十名(10/79)。
  • 美国大学生数学建模竞赛特等奖提名(前 2%)。
  • 中科大一等学业奖学金、江苏省优秀毕业设计、安徽省重大专项机械臂规控方向主要参与人。