如今,无东谈主机饰演已成为一种备受接待的“大型灯光秀”。在饰演中,成百上千架无东谈主机按照编程设定好的旅途飘零,在太空中共同勾画出复杂妍丽的步地和图案。当一切按筹划进行时,无东谈主机饰演局面颇为壮不雅,但是,一朝有一架或多架无东谈主机出现故障则可能会对大地不雅众组成严重阻碍,比如近期在佛罗里达、纽约等地发生的事故。
据爆料称,新版本的“通行证”将更接近传统意义上的战斗通行证,更加注重直接获取奖励。
无东谈主机饰演事故的发生让东谈主们领会到在“多智能体系统”中保险安全依然面对挑战。多智能体系统由多个互相和谐、迷惑并经过狡计机编程的智能体组成,常见的比如无东谈主机、和自动驾驶汽车等。
如今,麻省理工学院的工程师团队设立出一种针对多智能体系统的历练方法,好像确保这些系统即便在拥堵复杂的环境中也能安全早先。辩论东谈主员发现,哄骗这种方法历练少许智能体后,它们学到的安全领域和限度计策不错自动彭胀应用到更多的智能体上,进而升迁统统系统的安全性。
在骨子演示进程中,该团队历练了几架小型无东谈主机得胜完成不同任务,比如在飘零进程中同期变换位置并降落在挪动的机器东谈主上头。在模拟履行里,相同的方法在几架无东谈主机上历练后,不错复制并彭胀到数千架无东谈主机,使大领域系统好像安全地完成任务。
(开首:MIT News)
“对于任何需要多智能体迷惑的应用场景,比如搜索转圜无东谈主机、仓库机器东谈主以及自动驾驶汽车等,这种方法齐有望成为行业步调。这就像是构筑了通盘‘安全樊篱’,能让每个智能体在实行任务的同期保险安全。”麻省理工学院航空航天学副种植范楚楚暗意(她曾入选《麻省理工科技挑剔》2021 年度亚太地区“35 岁以下科技编削 35 东谈主” 榜单)。
当今这项辩论效果如故发表在IEEE Transactions on Robotics上,该论文的共同作家还包括麻省理工学院辩论生 Songyuan Zhang、Oswin So,以及亚利桑那州立大学助理种植 Kunal Garg。
在联想多智能体系统的安全机制时,辩论东谈主员通常需要琢磨每个智能体相对于系统中其他智能体的潜在通顺道径,这种两两之间的旅途打算不仅耗时且狡计资本漂后。即便如斯,也无法十足确保安全。
“在无东谈主机饰演中,每架无东谈主机齐被事先设定好了特定轨迹,包括一系列旅途和时间点,然后它们就‘闭上眼睛’按照这个筹划飘零。由于它们只知谈需要我方的既定旅途,一朝发生不测情况就不知谈该若何进行调度。”这项辩论的主要作家 Songyuan Zhang 指出。
与传统方法不同,麻省理工学院团队尝试设立一种新的方法,先历练少许智能体安全早先,然后让这种安全计策能灵验彭胀到系统中的通盘智能体。更要道的是,这种方法不再为单个智能体打算具体旅途,而是让它们好像捏续‘绘图’我方的安全领域(即一朝超出就可能不安全的区域领域)。这么一来,智能体独一永恒处于安全领域范围内,就不错聘请猖狂旅途完成任务。
从某种进程上来说,团队建议的这种方法和东谈主们在浅近生涯中直不雅地导航周围环境很相似。“念念象一下,你身处一个东谈主许多的购物中心,为了安全行走且不撞到别东谈主,你通常只会钟情我方周围数米范围内的东谈主,而不会去照管相距更远的东谈主,咱们的辩论领受的即是雷同的局部方法。”Oswin So 阐发注解谈。
在这项新辩论中,团队建议了一种名为 “GCBF+” 的方法,即 “图限度樊篱函数(Graph Control Barrier Function)”。在机器东谈主工夫领域,樊篱函数是一个数学想法,用于狡计安全领域,一朝智能体跨越这个领域就很可能变得不安全。在多智能体系统中,由于智能体的挪动,对于任何一个智能体而言,其安全区域随时齐可能发生变化。
通常情况下,联想东谈主员在狡计多智能体系统中某个智能体的樊篱函数时,需要琢磨它与系统中通盘其他智能体的潜在旅途和交互情况。但麻省理工学院团队的方法不同,他们只狡计少数智能体的安全区域,而且狡计花式敷裕精准,好像响应系统中更多智能体的动态变化。
“狡计出少数智能体的樊篱函数后,咱们不错将其复制并应用到每个智能体上,这么就能快速获得适用于系统中猖狂数目智能体的安全区域图。”Oswin So 暗意。
在狡计智能体的樊篱函数时,团队当先琢磨了智能体的 “感知半径”,即凭据其传感器好像不雅察到的环境范围。就像在购物中心的例子里,辩论东谈主员假定智能体只需照管其感知半径内的其他智能体,就能保证安全并幸免碰撞。
接下来,团队哄骗狡计机模子模拟智能体的特定机械材干和为止,联想出一个“限度器”,也即是一组对于智能体过甚相似个体应该若何挪动的辅导。然后,他们让多个智能体按照特定轨迹挪动并进行模拟,记载它们之间是否发生碰撞或其他交互情况。
“有了这些轨迹数据,咱们就能狡计出一些最小化的律例,比如刻下限度器中出现了若干次安全违法情况,然后据此更新限度器,升迁安全性。”Songyuan Zhang 暗意。
通过这种花式,限度器不错被编程到智能体中,让智能体在即时环境中感知其他智能体信息,捏续绘图我方的安全区域,并在安全区内挪动来完成任务。
“咱们的限度用具有及时反应材干。它不会提前打算好固定旅途,而是不断网络无东谈主机的行进地方、速率,以过甚他无东谈主机的速率等信息,哄骗这些信息及时生成筹划,况兼每次齐会重新打算旅途。是以,一朝环境发生变化,它好像赶快响应调度,确保安全。”范楚楚暗意。
团队在一个由 8 架小型四旋翼无东谈主机组成的系统中对 GCBF + 方法进行了演示。这些无东谈主机的任务是在空中飘零并变换位置。淌若无东谈主机直接沿最短路告成线飘零,细则会相撞,但在经过团队方法历练后,无东谈主机好像在飘零进程中及时调度,互相避开,永恒保捏在各自的安全区域内,得胜在空中完成了位置切换。
雷同地,团队还让无东谈主机飘零并降落在特定的轮式机器东谈主上,这个机器东谈主捏续绕着大圈行驶,无东谈主机在降落进程中也能幸免互相碰撞。
“使用咱们的框架,只需要告诉无东谈主机它们的主义地,而不是统统无碰撞的旅途轨迹,无东谈主机就能我方找出若何到达主义地而不发生碰撞。”范楚楚暗意。她设念念,这种方法不错应用到任何多智能体系统中来保险安全,比如无东谈主机饰演、仓库机器东谈主、自动驾驶汽车以及无东谈主机配送系统等。
这项辩论部分获得了好意思国国度科学基金会、麻省理工学院林肯履行室特技飘零轨制安全(SAFR)筹划,以及新加坡国防科学工夫局的撑捏。
https://news.mit.edu/2025/mit-engineers-help-multirobot-systems-stay-safety-zone-013