EI-生物启发

基于进化的运动,基于神经振荡器的运动,感觉-运动互连结构

Biologically-inspired robot locomotion

人类最伟大的发明之一是轮子,但你可能会发现一个有趣的现象:大自然在几十亿年的进化中,从未在任何动物身上“长”出过轮子。
轮子在平坦的柏油马路上效率极高,可一旦进入布满碎石的山地、错综复杂的树林或柔软的沙地,轮子就会打滑甚至卡死。因此,工程师们把目光投向了生物界,试图让机器人像动物一样用腿走、用肚子爬、用翅膀飞。

这个领域的终极目标是:研究生物是如何利用身体结构与复杂的物理世界互动的,并将其转化为机械工程设计。 这不仅仅是“照猫画虎”把机器人做成动物的外观,而是要提取生物运动背后的物理和生物力学原理

一、 四大仿生运动流派

为了适应地球上千奇百怪的地形,工程师们几乎把动物界“抄”了个底朝天:

运动流派 模仿对象 核心优势 典型应用
多足行走 (Legged) 狗、猎豹、昆虫 能跨越非连续的复杂地形(如楼梯、乱石) 波士顿动力机器狗、RHex 六足机器人
无肢蛇行 (Limbless) 蛇、蠕虫 身体横截面小,能在极度狭窄的废墟中穿梭 震后搜救机器蛇、工业管道巡检机器人
扑翼飞行 (Flapping) 蜜蜂、蝙蝠、鸟类 在微小尺度下(微型无人机)提供极高的机动性 哈佛 Robobee (微型机器蜂)
流体游动 (Swimming) 鱼类、水母 利用水流旋涡高效推进,对水下生态干扰小 海洋勘探机器金枪鱼、柔性机器鳐鱼

仿生运动往往在“平地绝对速度”上比不过纯机械设计,但它的地形容错率是无可比拟的。

二、 仿生运动的“硬件细节”

只会迈开腿还不够,真正的生物在运动时充满了精妙的细节。目前的仿生机器人正在攻克以下几个关键的物理细节:

  1. 柔顺性与人工肌肉 (Compliance & Artificial Muscles)
    传统的工厂机械臂是由刚性金属和齿轮组成的,碰撞一下就会损坏。而生物的关节里有关节软骨、肌腱和韧带,像弹簧一样可以吸收冲击力。现在的高级仿生机器人会使用软体材料 (Soft Robotics) 或者串联弹性驱动器。比如,仿生跳跃机器人落地时,腿部的弹性结构会先被压缩,吸收冲击力并储存能 量,然后像真正的袋鼠一样,把这些能量用于下一次弹跳,极大地节省了电量。

  2. 躯干协同 (Trunk & Spine Biomechanics)
    以前的机器狗,躯干是一块死板的铁疙瘩,只有四条腿在动。但生物学家发现,猎豹在高速奔跑时,脊柱的剧烈弯曲和伸展贡献了极大的步幅和爆发力。因此,现在的仿生运动研究开始给机器人加入“柔性脊柱”,让全身参与到运动的动力链中。

  3. 被动动力学行走 (Passive Dynamics)
    人类走路其实是一个“不断向前倒又不断接住自己”的过程,在这个过程中很大一部分力量来自于重力(像钟摆一样),而不是肌肉发力。仿生学家设计出了一种“被动行走机 器人”,在有微小坡度的地面上,它完全不需要任何电机驱动,仅靠重力和精妙的机械结构,就能像人一样自然地迈步走下去。

Evolutionary-based Locomotion

简单来说,它的核心理论不仅仅是“让机器人试错”,而是一套关于“如何用数学和算法模拟生命演化,来解决极其复杂的控制问题”的完整学科。

1. 具身认知与协同进化理论 (Co-evolution of Morphology and Control)

传统机器人学认为:先造好躯体(硬件),再写代码(大脑)。但进化理论认为这违背了自然规律。
在自然界中,长颈鹿的脖子和控制脖子的神经是同时进化出来的。因此,进化算法不仅要进化机器人的“大脑”,还要进化它的“身体”。

系统会将机器人的形态参数(比如腿的长度、关节的数量、重心的位置)和控制参数(神经网络的连线)打包在同一条虚拟 DNA 中。在成千上万代的繁衍中,算法会自动发现最优搭配。
工程师经常会看到令人震惊的结果:系统为了让机器人走得快,并没有优化腿部控制,而是直接在进化中把机器人的腿“拉长”,或者演化出类似四肢不对称但极度平衡的奇葩形态。这种“大脑与身体不可分割”的思想,正是具身智能(Embodied AI)的灵魂所在。

2. 适应度地形理论 (Fitness Landscape Theory)

在进化算法中,机器人如何知道自己走在“正确”的进化道路上?这就依赖于适应度地形理论。你可以把它想象成一片被浓雾笼罩的连绵山脉。

  • 坐标系: 在这片山脉中,地面的经纬度坐标代表机器人的“基因配置”(比如关节转速、电机力量)
  • 海拔高度: 对应的海拔高度就是“适应度评分(Fitness Score)”。海拔越高,说明这种基因配置下机器人走得越好
  • 算法目标: 进化的过程,就是一群蒙着眼睛的机器人在山脉里乱逛,试图找到“全局最高峰(Global Optimum)”
  • 局部最优陷阱(Local Optimum): 这是该理论最大的难题。有时候机器人爬上了一座小山包,以为这就是最高点,进化就停滞了。比如,系统要求机器人“尽可能向前移动”,机器人可能会进化出“直直向前摔倒”的策略,因为摔倒能让它瞬间向前移动两米,算法误以为它学会了“走”。工程师必须不断微调地形,逼迫机器人学会真正的步行

3. 适应度函数的数学构建理论 (Mathematical Fitness Formulation)

我们通常使用类似下面的数学公式(适应度函数)来给机器人的表现打分:

$$F = w_1 \cdot \Delta x - w_2 \cdot \int_{0}^{T} \sum_{i=1}^{n} |\tau_i \cdot \dot{\theta}i| dt - w_3 \cdot P{\text{fall}}$$

在这个公式中,$F$ 代表最终的适应度得分,得分越高的基因越容易被保留:

  • $w_1 \cdot \Delta x$(距离奖励): $\Delta x$ 代表机器人在特定时间内向前移动的距离。走得越远,得分越高
  • $w_2 \cdot \int_{0}^{T} \sum_{i=1}^{n} |\tau_i \cdot \dot{\theta}_i| dt$(能量消耗惩罚): 这部分计算的是所有关节电机输出的力矩与转速的乘积积分,即总能耗。这个理论极其重要:它逼迫机器人不仅要走,还要走得“省力”、走得“优雅”,从而淘汰掉那些虽然走得快但疯狂抽搐、耗电极快的步态
  • $w_3 \cdot P_{\text{fall}}$(稳定性惩罚): 如果机器人躯干高度低于某个阈值(摔倒了),就会被扣除极大的分数

4. 现实鸿沟理论 (The Reality Gap)

由于进化需要经历几万代的试错,在真实的物理世界中是不可能完成的(电机会烧毁,金属会磨损)。所以进化100%都是在计算机的物理模拟器(Simulator)中进行的。

模拟器里的物理法则是不完美的。模拟器里的摩擦力、空气阻力、电机响应延迟与现实世界存在微小差异。
一个在模拟器里进化出完美步态的虚拟机器人,一旦将它的“基因”下载到现实世界的物理机器人身上,往往会直接摔倒抽搐。这就是“现实鸿沟”。

为了跨越这个鸿沟,理论界提出了域随机化(Domain Randomization)技术。在虚拟进化时,工程师会故意给模拟器加入随机的“噪音”:每一代机器人的地面摩擦力一会儿大一会儿小,重力甚至也会微调。只有在这种极端混乱的虚拟环境中进化出“抗干扰能力极强”的步态,才能最终成功迁移到现实世界。

通过形态协同进化、适应度地形寻优、严谨的数学打分机制以及跨越现实鸿沟的技术,进化运动学让机器人摆脱了人类有限的想象力,真正依靠算力“长”出了行走的能力。

Neurooscillator-based Locomotion Generation

在传统机器人工程中,要让机器狗走一步,计算机必须极其精确地计算每一毫秒下,每个关节的电机应该转动多少度。这被称为基于轨迹的控制(Trajectory-based control),非常消耗算力且死板。

1. 生物学基石:中枢模式发生器理论 (CPG Theory)

你在跑步时,大脑绝不会去下达“左腿抬高30度、小腿肌肉收缩”这种指令。生物学发现,高等动物的节律性运动(呼吸、咀嚼、行走、游泳)是由脊髓中一种特殊的神经网络控制的,被称为中枢模式发生器(Central Pattern Generator, CPG)

CPG 的神奇之处在于:即使切断大脑的控制,只要给脊髓一个简单的、持续的刺激信号,CPG 就能自动产生复杂的、有节奏的肌肉收缩信号。
例如著名的“去大脑猫实验”中,切断大脑与脊髓连接的猫,只要被放在履带上并给予微弱的电刺激,它依然能完美地完成行走和奔跑。在机器人学中,我们就是要用数学公式凭空捏造出这个“CPG 脊髓”。

2. 核心数学模型:Matsuoka 振荡器理论

怎么用代码写出一个能自己产生节律的“细胞”?最经典的理论是日本学者松冈清隆(Kiyotaka Matsuoka)提出的相互抑制神经网络模型(Mutually Inhibiting Neurons)

自然界中没有孤立的振荡器,振荡通常来自于“对抗”。Matsuoka 模型模拟了两个相互竞争的神经元(比如一个控制伸肌,一个控制屈肌)。当一个兴奋时,就会抑制另一个;但由于神经元存在“疲劳机制”,它兴奋一会儿后会自己衰减,另一个神经元就会趁机抬起头来,如此反反复复,就形成了震荡。

它的核心数学表达是一组非线性微分方程:

$$ \tau \dot{x}_1 = -x_1 - w y_2 - \beta v_1 + u_0 $$

$$ \tau \dot{x}_2 = -x_2 - w y_1 - \beta v_2 + u_0 $$

  • $x_i$:神经元的内部电位(它有多想动)
  • $y_i$:神经元的实际输出(发送给电机的指令)
  • $w y_j$相互抑制项(对面神经元对我的压制力)
  • $\beta v_i$自适应/疲劳项(自己累了,电位开始下降)
  • $u_0$大脑下达的持续指令(只要这个值存在,系统就会持续振荡;设为0,机器人就停下)

3. 步态演化理论:相位耦合 (Phase Coupling)

如果你造了一只四足机器狗,它有四条腿,每条腿配备一个振荡器。这四个振荡器如果各跳各的,机器人瞬间就会散架。如何让它们协同?这依赖于耦合振荡器理论

工程师会用数学公式把多个振荡器“连”在一起,强制它们之间保持特定的相位差(Phase Difference, $\Delta \phi$)

  • Walk(慢走): 四个振荡器的相位依次相差 $90^\circ$($T/4$ 周期),四条腿轮流落地,极其平稳
  • Trot(小跑): 左前腿和右后腿的振荡器相位一致($0^\circ$),并与另外两条腿相差 $180^\circ$(半个周期),呈对角线交替运动
  • Bound(跳跃): 前面两腿相位一致,后面两腿相位一致,前后相差 $180^\circ$

4. 动力学抗扰理论:极限环吸引子 (Limit Cycle Attractor)

你可能会问:既然都是输出波浪形信号,我直接给电机写一个 sin(t) 的正弦波代码不就行了吗?为什么非要费劲解微积分方程?

答案在于“抗干扰与自恢复”。这就是 CPG 被奉为神明的原因——它在数学上具备极限环(Limit Cycle)的特性。

如果机器人在用纯 sin(t) 代码走路时被石头绊了一下,机械腿被卡住0.5秒,代码的波形就会和实际物理位置发生错位,机器人会因为指令冲突而直接摔倒。
而基于神经振荡器的系统是一个动态反馈循环。如果腿被绊住,传感器会把阻力信号反馈给微分方程。方程的波形会瞬间被打乱,但由于“吸引子”的数学特性,一旦阻力消失,振荡器会自动平滑地将波形重新收敛回原本的完美节律,这就和生物被绊了一下后能自己调整步伐恢复平衡一模一样。

Evolving a sensory-motor interconnection structure

“演化感觉-运动互连结构”的核心目的是:让机器人自己“长出”连接传感器(眼睛、触觉、陀螺仪)运动引擎(CPG / 电机)的神经网络回路,从而实现对复杂地形的瞬间反射和适应。

1. 感觉-运动闭环反馈理论 (Sensory-Motor Closed-Loop Theory)

在没有感觉互连时,CPG 是一个“开环(Open-loop)”系统:脊髓只管发信号,不管脚踩到了什么。而引入互连结构后,系统变成了“闭环(Closed-loop)”。
这里的“互连结构”本质上是一个人工神经网络(ANN)

  • 输入端(感觉): 接收来自物理世界的实时数据。比如脚底压力传感器的值、关节当前的实际弯曲角度(本体感觉)、甚至是身体的倾斜度(姿态传感器)
  • 处理层(神经连线): 神经网络根据传入的信号强度进行计算
  • 输出端(运动): 重点来了!这个网络的输出,通常不是直接去控制电机,而是去“拨动”CPG振荡器里的数学参数
  • 效果: 比如机器人左脚踩空(压力传感器骤降),信号瞬间传回网络,网络输出一个指令,临时调大左腿 CPG 振荡器的频率和抬腿高度。在0.1秒内,机器人自动完成了一次“跨步救场”

2. 拓扑增强的神经演化理论 (NEAT 算法)

既然需要一个神经网络来连接感觉和运动,这个网络该有几层?需要多少个神经元?传统的人工智能(比如 GPT 或图像识别)是人类预先定好网络结构的。但在具身智能中,人类根本不知道面对复杂地形需要什么样的脑回路。

这时候,统治该领域的理论算法出场了:NEAT(Neuroevolution of Augmenting Topologies,拓扑增强神经演化)。它不光进化神经元之间的权重,还直接进化大脑的结构本身

  1. 极简开局: 一开始,机器人的“大脑”是最原始的。比如只有2个传感器直接连着2个电机,没有中间思考过程(无隐藏层)

  2. 结构突变(长脑子): 在进化繁衍时,除了改变连接强度(权重),算法会发生两种奇妙的突变:

    • 增加连接(Add Link): 在两个原本毫无关系的神经元之间突然连一根线
    • 增加节点(Add Node): 在一根连线中间,突然“塞”进一个新的神经元,形成更复杂的逻辑链条
  3. 物种形成(Speciation): 为了防止刚进化出复杂脑回路的“天才婴儿”因为初期表现不稳定而被淘汰,NEAT 算法引入了物种隔离机制,保护新奇的拓扑结构有时间慢慢发育

3. 具身协同与形态计算理论 (Morphological Computation)

在纯软件的人工智能里,所有的计算都在 CPU/GPU 里完成。但在具身智能中,机器人的物理躯体也承担了计算任务

当你演化出一个感觉-运动互连结构时,你会发现网络往往比预想的要简单得多。为什么?
因为地面的摩擦力、机械腿的弹性、重力等物理法则,本身就提供了“免费的计算”。比如,当带有弹性的机械腿踩到石头时,弹簧的物理压缩瞬间完成了“缓冲”这个动作,传感器只需要把“被压缩”这个结果告诉网络即可。

科学家把这称为具身夹带(Embodied Entrainment):神经网络不需要去精确计算每一次碰撞,它只需要顺应机器人物理身体的自然共振频率,传感器反馈就像是一个节拍器,把 CPG 的数学振荡与现实世界的物理规律“锁定”在了一起。

4. 突触可塑性演化理论 (Evolution of Lifetime Learning)

大自然不仅让动物出生时就带着一套神经网络,还赋予了它们“在有生之年继续学习”的能力(比如小马驹出生后几分钟内学会站立)。

科学家在演化互连结构时,引入了赫布学习法则(Hebbian Learning)——即“一起激发的神经元,连线会变得更紧密”。

  • 在进化中,算法不直接决定神经元连线是强是弱,而是决定哪两条连线具备“可塑性”
  • 这样进化出来的机器人,刚被扔进模拟器时可能连路都走不稳,但当它挣扎了几分钟后,它的感觉和运动网络会因为实际的反馈而实时调整连线强度。这就是让机器人具备了“活到老、学到老”的能力
Author

Aloento

Posted on

2026-05-20

Updated on

2026-05-27

Licensed under

CC BY-NC-SA 4.0

Your browser is out-of-date!

Update your browser to view this website correctly.&npsb;Update my browser now

×