EI-生物启发
基于进化的运动,基于神经振荡器的运动,感觉-运动互连结构
Biologically-inspired robot locomotion
人类最伟大的发明之一是轮子,但你可能会发现一个有趣的现象:大自然在几十亿年的进化中,从未在任何动物身上“长”出过轮子。
轮子在平坦的柏油马路上效率极高,可一旦进入布满碎石的山地、错综复杂的树林或柔软的沙地,轮子就会打滑甚至卡死。因此,工程师们把目光投向了生物界,试图让机器人像动物一样用腿走、用肚子爬、用翅膀飞。
这个领域的终极目标是:研究生物是如何利用身体结构与复杂的物理世界互动的,并将其转化为机械工程设计。 这不仅仅是“照猫画虎”把机器人做成动物的外观,而是要提取生物运动背后的物理和生物力学原理。
一、 四大仿生运动流派
为了适应地球上千奇百怪的地形,工程师们几乎把动物界“抄”了个底朝天:
| 运动流派 | 模仿对象 | 核心优势 | 典型应用 |
|---|---|---|---|
| 多足行走 (Legged) | 狗、猎豹、昆虫 | 能跨越非连续的复杂地形(如楼梯、乱石) | 波士顿动力机器狗、RHex 六足机器人 |
| 无肢蛇行 (Limbless) | 蛇、蠕虫 | 身体横截面小,能在极度狭窄的废墟中穿梭 | 震后搜救机器蛇、工业管道巡检机器人 |
| 扑翼飞行 (Flapping) | 蜜蜂、蝙蝠、鸟类 | 在微小尺度下(微型无人机)提供极高的机动性 | 哈佛 Robobee (微型机器蜂) |
| 流体游动 (Swimming) | 鱼类、水母 | 利用水流旋涡高效推进,对水下生态干扰小 | 海洋勘探机器金枪鱼、柔性机器鳐鱼 |
仿生运动往往在“平地绝对速度”上比不过纯机械设计,但它的地形容错率是无可比拟的。
二、 仿生运动的“硬件细节”
只会迈开腿还不够,真正的生物在运动时充满了精妙的细节。目前的仿生机器人正在攻克以下几个关键的物理细节:
柔顺性与人工肌肉 (Compliance & Artificial Muscles)
传统的工厂机械臂是由刚性金属和齿轮组成的,碰撞一下就会损坏。而生物的关节里有关节软骨、肌腱和韧带,像弹簧一样可以吸收冲击力。现在的高级仿生机器人会使用软体材料 (Soft Robotics) 或者串联弹性驱动器。比如,仿生跳跃机器人落地时,腿部的弹性结构会先被压缩,吸收冲击力并储存能 量,然后像真正的袋鼠一样,把这些能量用于下一次弹跳,极大地节省了电量。躯干协同 (Trunk & Spine Biomechanics)
以前的机器狗,躯干是一块死板的铁疙瘩,只有四条腿在动。但生物学家发现,猎豹在高速奔跑时,脊柱的剧烈弯曲和伸展贡献了极大的步幅和爆发力。因此,现在的仿生运动研究开始给机器人加入“柔性脊柱”,让全身参与到运动的动力链中。被动动力学行走 (Passive Dynamics)
人类走路其实是一个“不断向前倒又不断接住自己”的过程,在这个过程中很大一部分力量来自于重力(像钟摆一样),而不是肌肉发力。仿生学家设计出了一种“被动行走机 器人”,在有微小坡度的地面上,它完全不需要任何电机驱动,仅靠重力和精妙的机械结构,就能像人一样自然地迈步走下去。
Evolutionary-based Locomotion
简单来说,它的核心理论不仅仅是“让机器人试错”,而是一套关于“如何用数学和算法模拟生命演化,来解决极其复杂的控制问题”的完整学科。
1. 具身认知与协同进化理论 (Co-evolution of Morphology and Control)
传统机器人学认为:先造好躯体(硬件),再写代码(大脑)。但进化理论认为这违背了自然规律。
在自然界中,长颈鹿的脖子和控制脖子的神经是同时进化出来的。因此,进化算法不仅要进化机器人的“大脑”,还要进化它的“身体”。
系统会将机器人的形态参数(比如腿的长度、关节的数量、重心的位置)和控制参数(神经网络的连线)打包在同一条虚拟 DNA 中。在成千上万代的繁衍中,算法会自动发现最优搭配。
工程师经常会看到令人震惊的结果:系统为了让机器人走得快,并没有优化腿部控制,而是直接在进化中把机器人的腿“拉长”,或者演化出类似四肢不对称但极度平衡的奇葩形态。这种“大脑与身体不可分割”的思想,正是具身智能(Embodied AI)的灵魂所在。
2. 适应度地形理论 (Fitness Landscape Theory)
在进化算法中,机器人如何知道自己走在“正确”的进化道路上?这就依赖于适应度地形理论。你可以把它想象成一片被浓雾笼罩的连绵山脉。
- 坐标系: 在这片山脉中,地面的经纬度坐标代表机器人的“基因配置”(比如关节转速、电机力量)
- 海拔高度: 对应的海拔高度就是“适应度评分(Fitness Score)”。海拔越高,说明这种基因配置下机器人走得越好
- 算法目标: 进化的过程,就是一群蒙着眼睛的机器人在山脉里乱逛,试图找到“全局最高峰(Global Optimum)”
- 局部最优陷阱(Local Optimum): 这是该理论最大的难题。有时候机器人爬上了一座小山包,以为这就是最高点,进化就停滞了。比如,系统要求机器人“尽可能向前移动”,机器人可能会进化出“直直向前摔倒”的策略,因为摔倒能让它瞬间向前移动两米,算法误以为它学会了“走”。工程师必须不断微调地形,逼迫机器人学会真正的步行
3. 适应度函数的数学构建理论 (Mathematical Fitness Formulation)
我们通常使用类似下面的数学公式(适应度函数)来给机器人的表现打分:
$$F = w_1 \cdot \Delta x - w_2 \cdot \int_{0}^{T} \sum_{i=1}^{n} |\tau_i \cdot \dot{\theta}i| dt - w_3 \cdot P{\text{fall}}$$
在这个公式中,$F$ 代表最终的适应度得分,得分越高的基因越容易被保留:
- $w_1 \cdot \Delta x$(距离奖励): $\Delta x$ 代表机器人在特定时间内向前移动的距离。走得越远,得分越高
- $w_2 \cdot \int_{0}^{T} \sum_{i=1}^{n} |\tau_i \cdot \dot{\theta}_i| dt$(能量消耗惩罚): 这部分计算的是所有关节电机输出的力矩与转速的乘积积分,即总能耗。这个理论极其重要:它逼迫机器人不仅要走,还要走得“省力”、走得“优雅”,从而淘汰掉那些虽然走得快但疯狂抽搐、耗电极快的步态
- $w_3 \cdot P_{\text{fall}}$(稳定性惩罚): 如果机器人躯干高度低于某个阈值(摔倒了),就会被扣除极大的分数
4. 现实鸿沟理论 (The Reality Gap)
由于进化需要经历几万代的试错,在真实的物理世界中是不可能完成的(电机会烧毁,金属会磨损)。所以进化100%都是在计算机的物理模拟器(Simulator)中进行的。
模拟器里的物理法则是不完美的。模拟器里的摩擦力、空气阻力、电机响应延迟与现实世界存在微小差异。
一个在模拟器里进化出完美步态的虚拟机器人,一旦将它的“基因”下载到现实世界的物理机器人身上,往往会直接摔倒抽搐。这就是“现实鸿沟”。
为了跨越这个鸿沟,理论界提出了域随机化(Domain Randomization)技术。在虚拟进化时,工程师会故意给模拟器加入随机的“噪音”:每一代机器人的地面摩擦力一会儿大一会儿小,重力甚至也会微调。只有在这种极端混乱的虚拟环境中进化出“抗干扰能力极强”的步态,才能最终成功迁移到现实世界。
通过形态协同进化、适应度地形寻优、严谨的数学打分机制以及跨越现实鸿沟的技术,进化运动学让机器人摆脱了人类有限的想象力,真正依靠算力“长”出了行走的能力。
Neurooscillator-based Locomotion Generation
在传统机器人工程中,要让机器狗走一步,计算机必须极其精确地计算每一毫秒下,每个关节的电机应该转动多少度。这被称为基于轨迹的控制(Trajectory-based control),非常消耗算力且死板。
1. 生物学基石:中枢模式发生器理论 (CPG Theory)
你在跑步时,大脑绝不会去下达“左腿抬高30度、小腿肌肉收缩”这种指令。生物学发现,高等动物的节律性运动(呼吸、咀嚼、行走、游泳)是由脊髓中一种特殊的神经网络控制的,被称为中枢模式发生器(Central Pattern Generator, CPG)。
CPG 的神奇之处在于:即使切断大脑的控制,只要给脊髓一个简单的、持续的刺激信号,CPG 就能自动产生复杂的、有节奏的肌肉收缩信号。
例如著名的“去大脑猫实验”中,切断大脑与脊髓连接的猫,只要被放在履带上并给予微弱的电刺激,它依然能完美地完成行走和奔跑。在机器人学中,我们就是要用数学公式凭空捏造出这个“CPG 脊髓”。
2. 核心数学模型:Matsuoka 振荡器理论
怎么用代码写出一个能自己产生节律的“细胞”?最经典的理论是日本学者松冈清隆(Kiyotaka Matsuoka)提出的相互抑制神经网络模型(Mutually Inhibiting Neurons)。
自然界中没有孤立的振荡器,振荡通常来自于“对抗”。Matsuoka 模型模拟了两个相互竞争的神经元(比如一个控制伸肌,一个控制屈肌)。当一个兴奋时,就会抑制另一个;但由于神经元存在“疲劳机制”,它兴奋一会儿后会自己衰减,另一个神经元就会趁机抬起头来,如此反反复复,就形成了震荡。
它的核心数学表达是一组非线性微分方程:
$$ \tau \dot{x}_1 = -x_1 - w y_2 - \beta v_1 + u_0 $$
$$ \tau \dot{x}_2 = -x_2 - w y_1 - \beta v_2 + u_0 $$
- $x_i$:神经元的内部电位(它有多想动)
- $y_i$:神经元的实际输出(发送给电机的指令)
- $w y_j$:相互抑制项(对面神经元对我的压制力)
- $\beta v_i$:自适应/疲劳项(自己累了,电位开始下降)
- $u_0$:大脑下达的持续指令(只要这个值存在,系统就会持续振荡;设为0,机器人就停下)
3. 步态演化理论:相位耦合 (Phase Coupling)
如果你造了一只四足机器狗,它有四条腿,每条腿配备一个振荡器。这四个振荡器如果各跳各的,机器人瞬间就会散架。如何让它们协同?这依赖于耦合振荡器理论。
工程师会用数学公式把多个振荡器“连”在一起,强制它们之间保持特定的相位差(Phase Difference, $\Delta \phi$)。
- Walk(慢走): 四个振荡器的相位依次相差 $90^\circ$($T/4$ 周期),四条腿轮流落地,极其平稳
- Trot(小跑): 左前腿和右后腿的振荡器相位一致($0^\circ$),并与另外两条腿相差 $180^\circ$(半个周期),呈对角线交替运动
- Bound(跳跃): 前面两腿相位一致,后面两腿相位一致,前后相差 $180^\circ$
4. 动力学抗扰理论:极限环吸引子 (Limit Cycle Attractor)
你可能会问:既然都是输出波浪形信号,我直接给电机写一个 sin(t) 的正弦波代码不就行了吗?为什么非要费劲解微积分方程?
答案在于“抗干扰与自恢复”。这就是 CPG 被奉为神明的原因——它在数学上具备极限环(Limit Cycle)的特性。
如果机器人在用纯 sin(t) 代码走路时被石头绊了一下,机械腿被卡住0.5秒,代码的波形就会和实际物理位置发生错位,机器人会因为指令冲突而直接摔倒。
而基于神经振荡器的系统是一个动态反馈循环。如果腿被绊住,传感器会把阻力信号反馈给微分方程。方程的波形会瞬间被打乱,但由于“吸引子”的数学特性,一旦阻力消失,振荡器会自动平滑地将波形重新收敛回原本的完美节律,这就和生物被绊了一下后能自己调整步伐恢复平衡一模一样。
Evolving a sensory-motor interconnection structure
“演化感觉-运动互连结构”的核心目的是:让机器人自己“长出”连接传感器(眼睛、触觉、陀螺仪)和运动引擎(CPG / 电机)的神经网络回路,从而实现对复杂地形的瞬间反射和适应。
1. 感觉-运动闭环反馈理论 (Sensory-Motor Closed-Loop Theory)
在没有感觉互连时,CPG 是一个“开环(Open-loop)”系统:脊髓只管发信号,不管脚踩到了什么。而引入互连结构后,系统变成了“闭环(Closed-loop)”。
这里的“互连结构”本质上是一个人工神经网络(ANN)。
- 输入端(感觉): 接收来自物理世界的实时数据。比如脚底压力传感器的值、关节当前的实际弯曲角度(本体感觉)、甚至是身体的倾斜度(姿态传感器)
- 处理层(神经连线): 神经网络根据传入的信号强度进行计算
- 输出端(运动): 重点来了!这个网络的输出,通常不是直接去控制电机,而是去“拨动”CPG振荡器里的数学参数
- 效果: 比如机器人左脚踩空(压力传感器骤降),信号瞬间传回网络,网络输出一个指令,临时调大左腿 CPG 振荡器的频率和抬腿高度。在0.1秒内,机器人自动完成了一次“跨步救场”
2. 拓扑增强的神经演化理论 (NEAT 算法)
既然需要一个神经网络来连接感觉和运动,这个网络该有几层?需要多少个神经元?传统的人工智能(比如 GPT 或图像识别)是人类预先定好网络结构的。但在具身智能中,人类根本不知道面对复杂地形需要什么样的脑回路。
这时候,统治该领域的理论算法出场了:NEAT(Neuroevolution of Augmenting Topologies,拓扑增强神经演化)。它不光进化神经元之间的权重,还直接进化大脑的结构本身。
极简开局: 一开始,机器人的“大脑”是最原始的。比如只有2个传感器直接连着2个电机,没有中间思考过程(无隐藏层)
结构突变(长脑子): 在进化繁衍时,除了改变连接强度(权重),算法会发生两种奇妙的突变:
- 增加连接(Add Link): 在两个原本毫无关系的神经元之间突然连一根线
- 增加节点(Add Node): 在一根连线中间,突然“塞”进一个新的神经元,形成更复杂的逻辑链条
物种形成(Speciation): 为了防止刚进化出复杂脑回路的“天才婴儿”因为初期表现不稳定而被淘汰,NEAT 算法引入了物种隔离机制,保护新奇的拓扑结构有时间慢慢发育
3. 具身协同与形态计算理论 (Morphological Computation)
在纯软件的人工智能里,所有的计算都在 CPU/GPU 里完成。但在具身智能中,机器人的物理躯体也承担了计算任务。
当你演化出一个感觉-运动互连结构时,你会发现网络往往比预想的要简单得多。为什么?
因为地面的摩擦力、机械腿的弹性、重力等物理法则,本身就提供了“免费的计算”。比如,当带有弹性的机械腿踩到石头时,弹簧的物理压缩瞬间完成了“缓冲”这个动作,传感器只需要把“被压缩”这个结果告诉网络即可。
科学家把这称为具身夹带(Embodied Entrainment):神经网络不需要去精确计算每一次碰撞,它只需要顺应机器人物理身体的自然共振频率,传感器反馈就像是一个节拍器,把 CPG 的数学振荡与现实世界的物理规律“锁定”在了一起。
4. 突触可塑性演化理论 (Evolution of Lifetime Learning)
大自然不仅让动物出生时就带着一套神经网络,还赋予了它们“在有生之年继续学习”的能力(比如小马驹出生后几分钟内学会站立)。
科学家在演化互连结构时,引入了赫布学习法则(Hebbian Learning)——即“一起激发的神经元,连线会变得更紧密”。
- 在进化中,算法不直接决定神经元连线是强是弱,而是决定哪两条连线具备“可塑性”
- 这样进化出来的机器人,刚被扔进模拟器时可能连路都走不稳,但当它挣扎了几分钟后,它的感觉和运动网络会因为实际的反馈而实时调整连线强度。这就是让机器人具备了“活到老、学到老”的能力