EI-生物启发

基于进化的运动,基于神经振荡器的运动,感觉-运动互连结构

Biologically-inspired robot locomotion

人类最伟大的发明之一是轮子,但你可能会发现一个有趣的现象:大自然在几十亿年的进化中,从未在任何动物身上“长”出过轮子。
轮子在平坦的柏油马路上效率极高,可一旦进入布满碎石的山地、错综复杂的树林或柔软的沙地,轮子就会打滑甚至卡死。因此,工程师们把目光投向了生物界,试图让机器人像动物一样用腿走、用肚子爬、用翅膀飞。

这个领域的终极目标是:研究生物是如何利用身体结构与复杂的物理世界互动的,并将其转化为机械工程设计。 这不仅仅是“照猫画虎”把机器人做成动物的外观,而是要提取生物运动背后的物理和生物力学原理

一、 四大仿生运动流派

为了适应地球上千奇百怪的地形,工程师们几乎把动物界“抄”了个底朝天:

运动流派 模仿对象 核心优势 典型应用
多足行走 (Legged) 狗、猎豹、昆虫 能跨越非连续的复杂地形(如楼梯、乱石) 波士顿动力机器狗、RHex 六足机器人
无肢蛇行 (Limbless) 蛇、蠕虫 身体横截面小,能在极度狭窄的废墟中穿梭 震后搜救机器蛇、工业管道巡检机器人
扑翼飞行 (Flapping) 蜜蜂、蝙蝠、鸟类 在微小尺度下(微型无人机)提供极高的机动性 哈佛 Robobee (微型机器蜂)
流体游动 (Swimming) 鱼类、水母 利用水流旋涡高效推进,对水下生态干扰小 海洋勘探机器金枪鱼、柔性机器鳐鱼

仿生运动往往在“平地绝对速度”上比不过纯机械设计,但它的地形容错率是无可比拟的。

二、 仿生运动的“硬件细节”

只会迈开腿还不够,真正的生物在运动时充满了精妙的细节。目前的仿生机器人正在攻克以下几个关键的物理细节:

  1. 柔顺性与人工肌肉 (Compliance & Artificial Muscles)
    传统的工厂机械臂是由刚性金属和齿轮组成的,碰撞一下就会损坏。而生物的关节里有关节软骨、肌腱和韧带,像弹簧一样可以吸收冲击力。现在的高级仿生机器人会使用软体材料 (Soft Robotics) 或者串联弹性驱动器。比如,仿生跳跃机器人落地时,腿部的弹性结构会先被压缩,吸收冲击力并储存能 量,然后像真正的袋鼠一样,把这些能量用于下一次弹跳,极大地节省了电量。

  2. 躯干协同 (Trunk & Spine Biomechanics)
    以前的机器狗,躯干是一块死板的铁疙瘩,只有四条腿在动。但生物学家发现,猎豹在高速奔跑时,脊柱的剧烈弯曲和伸展贡献了极大的步幅和爆发力。因此,现在的仿生运动研究开始给机器人加入“柔性脊柱”,让全身参与到运动的动力链中。

  3. 被动动力学行走 (Passive Dynamics)
    人类走路其实是一个“不断向前倒又不断接住自己”的过程,在这个过程中很大一部分力量来自于重力(像钟摆一样),而不是肌肉发力。仿生学家设计出了一种“被动行走机 器人”,在有微小坡度的地面上,它完全不需要任何电机驱动,仅靠重力和精妙的机械结构,就能像人一样自然地迈步走下去。

Evolutionary-based Locomotion

简单来说,它的核心理论不仅仅是“让机器人试错”,而是一套关于“如何用数学和算法模拟生命演化,来解决极其复杂的控制问题”的完整学科。

1. 具身认知与协同进化理论 (Co-evolution of Morphology and Control)

传统机器人学认为:先造好躯体(硬件),再写代码(大脑)。但进化理论认为这违背了自然规律。
在自然界中,长颈鹿的脖子和控制脖子的神经是同时进化出来的。因此,进化算法不仅要进化机器人的“大脑”,还要进化它的“身体”。

系统会将机器人的形态参数(比如腿的长度、关节的数量、重心的位置)和控制参数(神经网络的连线)打包在同一条虚拟 DNA 中。在成千上万代的繁衍中,算法会自动发现最优搭配。
工程师经常会看到令人震惊的结果:系统为了让机器人走得快,并没有优化腿部控制,而是直接在进化中把机器人的腿“拉长”,或者演化出类似四肢不对称但极度平衡的奇葩形态。这种“大脑与身体不可分割”的思想,正是具身智能(Embodied AI)的灵魂所在。

2. 适应度地形理论 (Fitness Landscape Theory)

在进化算法中,机器人如何知道自己走在“正确”的进化道路上?这就依赖于适应度地形理论。你可以把它想象成一片被浓雾笼罩的连绵山脉。

  • 坐标系: 在这片山脉中,地面的经纬度坐标代表机器人的“基因配置”(比如关节转速、电机力量)
  • 海拔高度: 对应的海拔高度就是“适应度评分(Fitness Score)”。海拔越高,说明这种基因配置下机器人走得越好
  • 算法目标: 进化的过程,就是一群蒙着眼睛的机器人在山脉里乱逛,试图找到“全局最高峰(Global Optimum)”
  • 局部最优陷阱(Local Optimum): 这是该理论最大的难题。有时候机器人爬上了一座小山包,以为这就是最高点,进化就停滞了。比如,系统要求机器人“尽可能向前移动”,机器人可能会进化出“直直向前摔倒”的策略,因为摔倒能让它瞬间向前移动两米,算法误以为它学会了“走”。工程师必须不断微调地形,逼迫机器人学会真正的步行

3. 适应度函数的数学构建理论 (Mathematical Fitness Formulation)

我们通常使用类似下面的数学公式(适应度函数)来给机器人的表现打分:

$$F = w_1 \cdot \Delta x - w_2 \cdot \int_{0}^{T} \sum_{i=1}^{n} |\tau_i \cdot \dot{\theta}i| dt - w_3 \cdot P{\text{fall}}$$

在这个公式中,$F$ 代表最终的适应度得分,得分越高的基因越容易被保留:

  • $w_1 \cdot \Delta x$(距离奖励): $\Delta x$ 代表机器人在特定时间内向前移动的距离。走得越远,得分越高
  • $w_2 \cdot \int_{0}^{T} \sum_{i=1}^{n} |\tau_i \cdot \dot{\theta}_i| dt$(能量消耗惩罚): 这部分计算的是所有关节电机输出的力矩与转速的乘积积分,即总能耗。这个理论极其重要:它逼迫机器人不仅要走,还要走得“省力”、走得“优雅”,从而淘汰掉那些虽然走得快但疯狂抽搐、耗电极快的步态
  • $w_3 \cdot P_{\text{fall}}$(稳定性惩罚): 如果机器人躯干高度低于某个阈值(摔倒了),就会被扣除极大的分数

4. 现实鸿沟理论 (The Reality Gap)

想象一下:你戴着 VR 眼镜,在一个没有风、没有阻力、重力永远精确为 $9.8 \text{ m/s}^2$ 的赛车游戏里苦练了十年,拿了世界冠军。然后,别人把你塞进一辆真实的 F1 赛车里,结果你刚踩下油门就因为轮胎打滑撞墙了。

在具身智能中,因为用真实的机器人去“试错”成本太高(摔坏一个几十万就没了,且物理时间太慢),所以 99.9% 的进化算法和神经网络都是在计算机的物理模拟器(Simulator)中训练出来的。但由于模拟器无法100%完美复刻真实宇宙的物理法则,导致在虚拟世界中表现完美的“天才”机器人,下载到物理机身上后,往往连站都站不稳。

1. 物理动态的“盲区” (Unmodeled Dynamics)

模拟器里的物理公式是理想化的,但现实世界充满了非线性的混乱。

  • 摩擦力不是恒定的: 模拟器通常假设地面摩擦系数是一个固定值(比如 0.8)。但在现实中,灰尘、地毯纹理的走向、甚至是脚掌落地瞬间的微小形变,都会让摩擦力剧烈波动。
  • 柔软的现实: 模拟器里的金属零件通常被假设为绝对刚体(不会形变)。但现实中,机械腿在受力时会发生肉眼看不见的弯曲,这种微小的弹性如果没被计算在内,积少成多就会导致共振摔倒。

2. 硬件的“谎言” (Hardware Imperfections)

虚拟的传感器和电机是完美的,但真实的硬件会“撒谎”和“迟到”。

  • 传感器噪音: 虚拟陀螺仪能告诉你绝对准确的角度。但真实陀螺仪传回来的数据是带着雪花般电磁噪音的。
  • 电机延迟 (Latency): 在模拟器里,网络发出“输出 10 牛顿米力矩”的指令,电机瞬间达到 10Nm。但在现实中,电流建立磁场需要时间,齿轮之间存在机械间隙(Backlash),指令传达到最终动作往往有几十到上百毫秒的延迟。这足以让一个在极限边缘平衡的机器人摔倒。

3. 算法的“作弊” (Exploiting Simulator Bugs)

进化算法极其聪明,但也极其“鸡贼”。它不是在学习如何走路,而是在寻找模拟器代码的漏洞
比如,如果物理引擎在计算关节碰撞时存在一个极其微小的数学精度误差,进化算法就会让机器人的两个关节以某种疯狂的频率互相敲击,凭空“借力”飞起来。在虚拟世界里它飞得很高,拿到满分;到了现实中,一敲就骨折了。

4. 域随机化 (Domain Randomization)

既然模拟器不够准确,那就干脆故意让模拟器变得混乱不堪
工程师不会给机器人提供一个完美的训练环境,而是在每一代进化时,随机疯狂地更改所有的物理参数:

  • 第一代:重力变成火星重力,地面像冰面一样滑。
  • 第二代:左腿电机的力量比右腿小 20%,传感器延迟增加 50 毫秒。
  • 第三代:给视觉传感器加上强烈的像素噪点,甚至突然遮挡一半视野。

核心逻辑: 如果一个神经网络能够在重力时大时小、关节时常失灵、地面忽软忽硬的地狱级混沌环境中生存下来并学会走路,那么当它来到真实地球时,它只会觉得:“哇,这个世界的物理规律好稳定,太简单了!”真实世界的误差,完全被覆盖在了它见识过的随机范围之内。

5. 系统辨识 (System Identification)

如果说域随机化是“蒙着眼练神功”,那么系统辨识就是“精雕细琢”。工程师会通过大量现实实验来获取真实硬件的数据。
比如,他们会给真实的电机发送各种频率的电流,记录下它的真实延迟和摩擦力曲线,然后用数学模型(或者另一个神经网络)把这些“瑕疵”一丝不苟地写进模拟器里,让模拟器无限逼近真实。

6. 在线适应/元学习 (Online Adaptation / Meta-Learning)

与其在家里把所有情况都准备好,不如让机器人具备极强的“临场应变”能力。
在模拟器中,算法并不是教机器人“怎么走”,而是教机器人“如何在发现不对劲时,在几秒钟内光速调整参数”。这种机器人落地后,走前两步可能踉踉跄跄,但在第三步时,它的神经网络已经根据刚踩过地面的质感,在线重写了自己的部分控制策略,瞬间走稳。

Neurooscillator-based Locomotion Generation

在传统机器人工程中,要让机器狗走一步,计算机必须极其精确地计算每一毫秒下,每个关节的电机应该转动多少度。这被称为基于轨迹的控制(Trajectory-based control),非常消耗算力且死板。

1. 生物学基石:中枢模式发生器理论 (CPG Theory)

你在跑步时,大脑绝不会去下达“左腿抬高30度、小腿肌肉收缩”这种指令。生物学发现,高等动物的节律性运动(呼吸、咀嚼、行走、游泳)是由脊髓中一种特殊的神经网络控制的,被称为中枢模式发生器(Central Pattern Generator, CPG)

CPG 的神奇之处在于:即使切断大脑的控制,只要给脊髓一个简单的、持续的刺激信号,CPG 就能自动产生复杂的、有节奏的肌肉收缩信号。
例如著名的“去大脑猫实验”中,切断大脑与脊髓连接的猫,只要被放在履带上并给予微弱的电刺激,它依然能完美地完成行走和奔跑。在机器人学中,我们就是要用数学公式凭空捏造出这个“CPG 脊髓”。

2. 核心数学模型:Matsuoka 振荡器理论

怎么用代码写出一个能自己产生节律的“细胞”?最经典的理论是日本学者松冈清隆(Kiyotaka Matsuoka)提出的相互抑制神经网络模型(Mutually Inhibiting Neurons)

自然界中没有孤立的振荡器,振荡通常来自于“对抗”。Matsuoka 模型模拟了两个相互竞争的神经元(比如一个控制伸肌,一个控制屈肌)。当一个兴奋时,就会抑制另一个;但由于神经元存在“疲劳机制”,它兴奋一会儿后会自己衰减,另一个神经元就会趁机抬起头来,如此反反复复,就形成了震荡。

它的核心数学表达是一组非线性微分方程:

$$ \tau \dot{x}_1 = -x_1 - w y_2 - \beta v_1 + u_0 $$

$$ \tau \dot{x}_2 = -x_2 - w y_1 - \beta v_2 + u_0 $$

  • $x_i$:神经元的内部电位(它有多想动)
  • $y_i$:神经元的实际输出(发送给电机的指令)
  • $w y_j$相互抑制项(对面神经元对我的压制力)
  • $\beta v_i$自适应/疲劳项(自己累了,电位开始下降)
  • $u_0$大脑下达的持续指令(只要这个值存在,系统就会持续振荡;设为0,机器人就停下)

3. 步态演化理论:相位耦合 (Phase Coupling)

如果你造了一只四足机器狗,它有四条腿,每条腿配备一个振荡器。这四个振荡器如果各跳各的,机器人瞬间就会散架。如何让它们协同?这依赖于耦合振荡器理论

工程师会用数学公式把多个振荡器“连”在一起,强制它们之间保持特定的相位差(Phase Difference, $\Delta \phi$)

  • Walk(慢走): 四个振荡器的相位依次相差 $90^\circ$($T/4$ 周期),四条腿轮流落地,极其平稳
  • Trot(小跑): 左前腿和右后腿的振荡器相位一致($0^\circ$),并与另外两条腿相差 $180^\circ$(半个周期),呈对角线交替运动
  • Bound(跳跃): 前面两腿相位一致,后面两腿相位一致,前后相差 $180^\circ$

4. 动力学抗扰理论:极限环吸引子 (Limit Cycle Attractor)

你可能会问:既然都是输出波浪形信号,我直接给电机写一个 sin(t) 的正弦波代码不就行了吗?为什么非要费劲解微积分方程?

答案在于“抗干扰与自恢复”。这就是 CPG 被奉为神明的原因——它在数学上具备极限环(Limit Cycle)的特性。

如果机器人在用纯 sin(t) 代码走路时被石头绊了一下,机械腿被卡住0.5秒,代码的波形就会和实际物理位置发生错位,机器人会因为指令冲突而直接摔倒。
而基于神经振荡器的系统是一个动态反馈循环。如果腿被绊住,传感器会把阻力信号反馈给微分方程。方程的波形会瞬间被打乱,但由于“吸引子”的数学特性,一旦阻力消失,振荡器会自动平滑地将波形重新收敛回原本的完美节律,这就和生物被绊了一下后能自己调整步伐恢复平衡一模一样。

Evolving a sensory-motor interconnection structure

“演化感觉-运动互连结构”的核心目的是:让机器人自己“长出”连接传感器(眼睛、触觉、陀螺仪)运动引擎(CPG / 电机)的神经网络回路,从而实现对复杂地形的瞬间反射和适应。

1. 感觉-运动闭环反馈理论 (Sensory-Motor Closed-Loop Theory)

在没有感觉互连时,CPG 是一个“开环(Open-loop)”系统:脊髓只管发信号,不管脚踩到了什么。而引入互连结构后,系统变成了“闭环(Closed-loop)”。
这里的“互连结构”本质上是一个人工神经网络(ANN)

  • 输入端(感觉): 接收来自物理世界的实时数据。比如脚底压力传感器的值、关节当前的实际弯曲角度(本体感觉)、甚至是身体的倾斜度(姿态传感器)
  • 处理层(神经连线): 神经网络根据传入的信号强度进行计算
  • 输出端(运动): 重点来了!这个网络的输出,通常不是直接去控制电机,而是去“拨动”CPG振荡器里的数学参数
  • 效果: 比如机器人左脚踩空(压力传感器骤降),信号瞬间传回网络,网络输出一个指令,临时调大左腿 CPG 振荡器的频率和抬腿高度。在0.1秒内,机器人自动完成了一次“跨步救场”

2. 拓扑增强的神经演化理论 (NEAT 算法)

既然需要一个神经网络来连接感觉和运动,这个网络该有几层?需要多少个神经元?传统的人工智能(比如 GPT 或图像识别)是人类预先定好网络结构的。但在具身智能中,人类根本不知道面对复杂地形需要什么样的脑回路。

这时候,统治该领域的理论算法出场了:NEAT(Neuroevolution of Augmenting Topologies,拓扑增强神经演化)。它不光进化神经元之间的权重,还直接进化大脑的结构本身

  1. 极简开局: 一开始,机器人的“大脑”是最原始的。比如只有2个传感器直接连着2个电机,没有中间思考过程(无隐藏层)

  2. 结构突变(长脑子): 在进化繁衍时,除了改变连接强度(权重),算法会发生两种奇妙的突变:

    • 增加连接(Add Link): 在两个原本毫无关系的神经元之间突然连一根线
    • 增加节点(Add Node): 在一根连线中间,突然“塞”进一个新的神经元,形成更复杂的逻辑链条
  3. 物种形成(Speciation): 为了防止刚进化出复杂脑回路的“天才婴儿”因为初期表现不稳定而被淘汰,NEAT 算法引入了物种隔离机制,保护新奇的拓扑结构有时间慢慢发育

3. 具身协同与形态计算理论 (Morphological Computation)

在纯软件的人工智能里,所有的计算都在 CPU/GPU 里完成。但在具身智能中,机器人的物理躯体也承担了计算任务

当你演化出一个感觉-运动互连结构时,你会发现网络往往比预想的要简单得多。为什么?
因为地面的摩擦力、机械腿的弹性、重力等物理法则,本身就提供了“免费的计算”。比如,当带有弹性的机械腿踩到石头时,弹簧的物理压缩瞬间完成了“缓冲”这个动作,传感器只需要把“被压缩”这个结果告诉网络即可。

科学家把这称为具身夹带(Embodied Entrainment):神经网络不需要去精确计算每一次碰撞,它只需要顺应机器人物理身体的自然共振频率,传感器反馈就像是一个节拍器,把 CPG 的数学振荡与现实世界的物理规律“锁定”在了一起。

4. 突触可塑性演化理论 (Evolution of Lifetime Learning)

大自然不仅让动物出生时就带着一套神经网络,还赋予了它们“在有生之年继续学习”的能力(比如小马驹出生后几分钟内学会站立)。

科学家在演化互连结构时,引入了赫布学习法则(Hebbian Learning)——即“一起激发的神经元,连线会变得更紧密”。

  • 在进化中,算法不直接决定神经元连线是强是弱,而是决定哪两条连线具备“可塑性”
  • 这样进化出来的机器人,刚被扔进模拟器时可能连路都走不稳,但当它挣扎了几分钟后,它的感觉和运动网络会因为实际的反馈而实时调整连线强度。这就是让机器人具备了“活到老、学到老”的能力
Author

Aloento

Posted on

2026-05-20

Updated on

2026-06-16

Licensed under

CC BY-NC-SA 4.0

Your browser is out-of-date!

Update your browser to view this website correctly.&npsb;Update my browser now

×