一个专业的论文、出书、专利服务平台

品质、专业的

论文指导服务

基于非对称高斯函数的个人/群组动态舒适空间建模

时间:2021-04-26分类:应用电子技术

  摘 要:设计了一种基于非对称高斯函数的动态可变舒适空间模型.首先利用人的运动状态信息来确定不同速度下的个人舒适空间的形状.然后考虑到性别、年龄等个人社会属性特征的差异性,提出一个可扩展的模糊推理框架来定义个性化的舒适空间大小.在对单人的舒适空间建模的基础上,提出了共同关注区域的概念并通过最小覆盖圆算法对行人群组进行分析,构建群组的舒适空间.在实验部分对所提出动态舒适空间模型进行了定性与定量的分析与评价,验证了该模型的合理性.

基于非对称高斯函数的个人/群组动态舒适空间建模

  本文源自周磊; 张森; 赵英利; 胡郑希; 刘景泰, 机器人 发表时间:2021-04-25《机器人》是经中华人民共和国新闻出版总署批准,由中国科学院主管,中国科学院沈阳自动化研究所、中国自动化学会共同主办的科技类核心期刊,主要报道中国在机器人学及相关领域具有创新性的、高水平的、有重要意义的学术进展及研究成果,由中国科学出版社出版。

  关键词:共融机器人;非对称高斯函数;个人舒适空间;模糊推理;共同关注区域;群组舒适空间

  1 引言(Introduction)

  新一代机器人特别是服务机器人大多工作在人机共存的环境中,需要与人进行频繁的接触和交互,这对机器人在人机空间共享与自然交互方面提出了更高的功能需求[1-2].而传统的移动机器人在工作中多是将人视为普通障碍物,没有考虑到人的舒适需求.

  由于人与机器人的交互日益深入,机器人在工作中如何考虑人的舒适感受逐渐成为机器人研究领域中的热点问题.例如,欧盟的 Mummer 项目[3] 使用软银公司的 Pepper 机器人为主要平台,面向大型购物中心等公共场所,构建了一个包括视听传感、社交信号处理、对话交互、视角捕捉、几何推理和运动规划的系统,旨在与用户进行自然而灵活的互动.Pepper 机器人的社交信号处理模块中配置了文本情感分析器来检测人的情感类别与强度.与此不同的是,很多研究人员[4] 从空间关系学的角度对人在环境中的舒适感受进行研究.

  个人舒适空间:个人主动在周围维持的一个区域,其他人的侵入会导致不适.

  目前,用于描述个人舒适空间的模型主要分为 2 种:一种是基于几何图形划分的个人舒适空间;另一种是基于势场的行人舒适空间,一般由连续的函数组成.

  基于几何图形的舒适空间主要由椭圆、半椭圆、半圆以及整圆组合而成,图 1 展示了几种典型的用于描述舒适空间的几何形状,包括圆形、水滴形、椭圆形以及非对称形.

  圆形:圆形舒适空间的划分依据来自于 Helbing 的空间关系学理论 [5],该理论研究了人们对周围空间的利用,描述了人在社交活动中关于不同对象的偏好距离.空间关系学理论根据与人之间的距离大小将人周围的空间划分为 4 个区域:私密空间、个人空间、社交空间以及公共空间.各个空间的距离参数一般定义为:

  • 公共空间:> 3.6 m • 社交空间:1.2 m~3.6 m • 个人空间:0.45 m~1.2 m • 私密空间:6 0.45 m

  本文仅关注个人空间和私密空间所构成的个人舒适空间部分,因此在图 1(a) 中仅画出了个人舒适空间部分.

  蛋形:蛋形空间又称水滴形空间,Hayduk 等[6] 认为人的舒适空间的大小受视野的约束,人对前方空间有着更高的关注度,正面空间的侵入使人产生不适,因此人前方应该有更大的空间.Lam [7] 将行人舒适空间构造为一个前半部分是与速度相关的半椭圆,后半部分为一个半圆的蛋形结构.

  椭圆形:Huang [8] 提出人的运动方向不会突变,因此不需要像蛋形空间一样在后半部分维持一个固定的半圆,直接将个人舒适空间构建为一个椭圆. Huang 将人的位置作为椭圆的焦点,长半轴是一个与速度相关的变量,速度越高,前面的舒适空间就越大,短轴是一个由空间关系学确定的定值.

  非对称形:Higuchi [9] 将人周围的空间分为 2 个区域,一个区域是手可到达的,一个区域是手不可到达的,在手可到达的区域中人占有主导地位.该模型认为当存在障碍物或者人的舒适空间不对称时,人在占主导地位一侧的舒适空间较小.

  基于势场的行人舒适空间,通常使用高斯函数构造.通过将人的位置设置成高斯函数的中心,为人周围的空间指定一个代价值来描述这个区域接受其他人进入的程度.这种舒适空间建模方法通常与机器人导航中的代价地图结合,如 Svenstrup [10] 在使用高斯函数生成的具有社会属性的代价地图上应用 RRT(快速扩展随机树)算法生成了一条考虑行人舒适度的轨迹;Patompak [11-12] 使用高斯函数对行人舒适空间建模,然后利用强化学习方法对高斯函数进行参数调整,由此学习到一张全局代价地图,最后应用 T-RRT(transition based RRT)算法来寻找一条最优轨迹;Papadakis[13] 基于高斯函数构建了个人舒适空间,然后使用 KPCA(核主成分分析)算法对环境中所有行人构成的代价等高线进行学习.此后,Papadakis[14] 还将个人的姿态、手势信息引入高斯函数中构造个人舒适空间.

  个人舒适空间量化了个人的心理感受.然而,由于个人的差异性,不同人的舒适感受是不同的,舒适空间形状大小也不是固定不变的.上文所提方法构造的个人舒适空间的大小形状多是固定不变的,没有充分考虑环境中个人的差异性.为此,本文提出了一种动态舒适空间的构造方法,其中考虑了个人的差异性,将个人的状态与社会属性特征作为影响舒适空间的重要因素整合进非对称高斯函数,实现舒适空间的个性化构造.

  2 动态舒适空间(Dynamic comfort space)

  动态舒适空间:个人舒适空间受到多种内外因素的影响,需要根据内外因素的变化自动对大小形状进行调整.

  现有关于舒适空间的模型 [8-9,14] 针对人的速度、姿态、视角、手势等个人的状态信息都给出了相应的解决方法,这些工作将状态上的约束转化为舒适空间中某个方向上的距离变化,来调整舒适空间的形状以表示对相应区域的舒适感受的偏向度.

  但是,很少有研究关注人自身所具有的社会属性特征对舒适空间的影响.很多个人自身的因素影响着个人舒适空间的大小,典型的包括个人的性别和年龄.Aiello [15] 调查发现男性比女性使用更大的舒适空间,成年人的舒适空间比儿童的更大.

  本文对个人状态信息与社会属性特征进行综合考虑,提出了如图 2 所示的动态个人舒适空间推理框架.该框架从个人自身角度出发,构建基于非对称高斯函数的动态个人舒适空间.该框架首先利用人的状态信息,包括位置、速度、朝向角,来确定不同速度下的个人舒适空间的形状;然后基于模糊推理的思想将人的性别、年龄等社会属性通过模糊推理系统定义个性化的舒适空间大小.该框架具有很强的扩展性,除了本文关注的行人自身因素外,其他的外部因素也可以通过模糊推理系统影响个人舒适空间的大小.本文在深入讨论动态个人舒适空间推理架构之前,先对非对称高斯函数进行描述.

  2.1 非对称高斯函数

  行人状态在个人舒适空间的构造上发挥了重要作用,它提供了人的基本空间信息和时间信息.图 3 显示了人在世界坐标系下的位置及运动状态,除了基本的空间信息外,本文还需要行人的性别、年龄等社会属性信息.因此将人的符号表达分为两部分:一部分是人的状态信息,表示为 hs,其中 (xi ,yi) 表示行人 i 在世界坐标系下的位置,θi 是行人相对于世界坐标系的朝向角,vxi 和 vyi 分别表示当前时刻行人 i 沿 x 轴、y 轴的速度;另一部分是行人的社会属性特征,表示为 hf,包括性别和年龄这 2 个基本社会特征.

  如图 3 所示,对于位置为 (xi , yi)、朝向角为 θi 的行人 i,构造了行人本体坐标系 x ′o ′ y ′,并将其朝向与 x ′ 轴对齐,其周围的舒适空间可以表示为

  A 表示高斯函数的幅度,在本文中 A 的取值为 1,d 是周围环境点与人中心的距离,θ 是周围环境点与世界坐标系 x 轴的夹角,σx、σy 为沿行人本体坐标系 x 轴、y 轴的方差.由上式可以看出,行人的舒适空间的形状大小主要由参数 σx、σy 和 A 决定,而 σx、σy 的大小可以通过人的状态和社会属性特征决定。

  标准的高斯函数沿 x 轴、y 轴都是对称的,由于本文采用非对称高斯函数对人的舒适空间建模,因此需要对高斯函数进行重新设计.本文将整个舒适空间分为 4 个高斯函数的组合,来产生非对称高斯函数.对于这个组合的非对称高斯函数,其各个方向上的方差如下定义: θi:函数的旋转方向 σF:沿 θi 方向的方差 σB:沿 θi 反方向的方差 σL:沿 θi 正方向左侧的方差 σR:沿 θi 方向右侧的方差

  由于相邻的函数在分割线有着共同的方差,所以整个非对称高斯函数是连续光滑的.

  算法 1 展示了行人的非对称舒适空间的构建流程.文 [16] 提出,当人与其他人共处有限空间内时,人的舒适空间会因受到挤压而产生形变.算法 1 中将舒适空间分为 4 个象限而不是分为前后 2 个部分计算,就是考虑到人的舒适空间可能在某些情况下侧边受到挤压,在这种情况下舒适空间不仅前后不对称,左右也是不对称的.

  2.2 考虑个人状态的动态舒适空间

  个人的舒适空间并不是固定不变的,研究[17] 显示,个人的舒适空间会随速度的变化而变化.大多数之前的工作将关注点聚集在行人前方的舒适空间与速度的关系,如 Vega [18] 提出行人前方区域的舒适空间会随速度的变化而改变,但是他们忽视了人后方的舒适空间并直接将后方的舒适空间大小设置为一个定值.本文认为,在运动过程中,随着速度的增大,人会更加关注前方区域,因此前方和两侧的舒适空间也会随之而增大,而后方的舒适空间会随关注度的下降而减小,因此本文将 4 个方向上的高斯函数方差定义为如下形式:

  其中,v 表示线速度, fF、 fB、 fL、 fR 是 4 个比例系数,表示了 4 个方差随速度变化的程度,在本文中其取值分别为 1, 1, 0.5, 0.5,其中 σ 是人的初始舒适空间的大小,它受到多种因素的影响.后文主要从个人自身的社会属性特征出发对其取值进行了分析.

  根据算法 1,分别计算了静态和动态情况下的舒适空间.图 4 是静止状态下的个人舒适空间,图 5 是以 1.0 m/s 的速度沿 y 轴运动的个人的舒适空间,其中箭头表示行人朝向角,箭头的长度与速度呈正相关.对比图 4 与图 5 可以发现,运动状态下人的舒适空间比静态个人的舒适空间要大.

  2.3 考虑个人社会属性特征的动态舒适空间

  影响个人舒适空间大小的社会因素很多,比如人与人之间关系的远近,亲密熟悉的人之间舒适空间会比较小,陌生人之间的舒适空间会相对较大;舒适空间的大小也与所处环境有关,课题组之前的工作 [16] 显示,在拥挤狭小的环境中人的舒适空间会受到环境与周围人的挤压而变小.本文从个人自身社会属性出发,将年龄和性别作为影响个人舒适空间大小的关键自身社会因素,借鉴模糊控制中模糊推理的思想将这些社会特征量化为舒适空间的大小.

  2.3.1 社会属性特征模糊化

  在模糊推理系统中,输入变量的值可以通过隶属函数转化为模糊值(MF),来描述输入变量隶属于某语言术语的程度.这些 MF 是根据实验数据设计的,显示了一个域与另一个域之间的关系.

  个人舒适空间大小与性别有关,男性比女性需要更大的舒适空间.语言变量“性别”定义 M (男)、Fe(女)2 个语言值,其隶属度函数是一个关于 M、Fe 的二值化函数.

  其中 g 是输入的性别,对应的隶属度函数曲如图 6 所示.

  个人舒适空间的大小也与个人的年龄、性别有关,而成年人通常有着更加完整的个人空间感,相比于儿童和老人需要使用更大的个人空间.在语言变量“年龄”上定义 child(儿童)、youth (青年)、 mid(中年)、old(老年)这 4 个语言值,使用三角形函数作为隶属度函数:

  其中三角形曲线的 3 个参数分别表示三角形的 “脚”“峰”“脚”.本文考虑的年龄范围是 6~80 岁,根据各个年龄层的实际年龄划分,上述公式中的参数被设置为

  根据空间关系学理论,个人舒适空间的范围是 0.45 m~1.2 m,本文将这个区域也就是本文对应的 σ 分为 4 个模糊集:个人空间(PS)、近个人空间(NPS)、近社交空间(NSS)、社交空间(SS),这 4 个模糊集都分别给定了不同舒适空间的大小 σ.4 个高斯函数被用来表示舒适空间大小在每个区域中的变化.

  各个隶属度函数的参数根据空间关系学理论被设置为

  在当前参数下,输出隶属度函数的曲线如图 8 所示.

  2.3.2 模糊推理规则建立及模糊推理

  本文从个人自身属性出发,将个人性别、年龄特征作为输入模糊子集,个人舒适空间的大小作为输出模糊子集,每种对应一条模糊规则,构建表 1 所示的模糊规则.

  采用 Mamdani 的模糊推理方法,以及最大-最小的模糊逻辑推理合成规则,并通过最大隶属度法实现去模糊化,利用 Matlab 软件中的模糊控制工具箱得到了如图 9 所示的模糊推理系统.

  将模糊推理系统的输出应用于非对称高斯函数来确定舒适空间的大小,得到了不同性别、不同年龄阶段条件下具有个人特征的舒适空间.如图 10 所示,30 岁的年轻人相对于儿童与老人有着更大的舒适空间,而同年龄阶段条件下男性所需的舒适空间大于女性.

  除了本文所提的性别、年龄之外,还有很多其他的个人属性特征影响个人舒适空间的大小,如:个人的社会地位,Alessandra [19] 提出富有的个人期望掌握更大的个人空间;个人的人格特质,Dinesh Manocha 课题组 [20-21] 指出,外倾性人格的人有着更大的个人空间.这些个人属性特征都可以整合进模糊推理系统,来实现个人舒适空间的个性化定义,使得机器人能够面对差异化的人群环境.

  3 群组舒适空间(Group comfort space)

  环境中 70% 的人是以群组的形式出现的 [22], Kendon [23] 指出群组会维持一个比个人更大的舒适空间,因此对群组的舒适空间进行单独研究是很有必要的.在对群组舒适空间的研究当中,最有名的 2 种方法是 O-Space 与 F-formation [24],其中 Fformation 关注的是由 2 个人组成的群组,根据 2 个人的空间位置以及朝向,两人群组被分为 N-shape、 vis-a-vis ` 、V-shape、L-shape、C-shape 和 side-by-side 这几类.O-Space 理论对于多于 2 人的多人群组的空间分布进行了研究,该理论认为多个人在进行交互时可以通过 O-Space 确定一个群组的交互区域,这个区域是群组中个体进行群体交互的中心.上述这 2 种方法都只研究了静态情况下群组的空间分布特征,无法用于处理动态的行人舒适空间,并且空间中行人的分布并不完全遵从 O-Space 与 F-formation 方法.本文继承了 O-Space 理论中所提出的交互区域概念,认为构成群组的行人存在一个共同关注区域,其他人闯入这个共同关注区域会引起群组内所有人的不适,并且设计了基于最小覆盖圆的共同关注区域检测算法,能够同时检测静态、动态群组的共同关注区域.

  3.1 共同关注区域检测

  环境中的行人大部分是以群组形式出现的,群组检测是机器人不可缺少的一项能力.近些年来,研究人员提出了多种群组检测方法,如 Setto [25] 提出了 GCFF(graph-cut for F-formation),使用 F-formation 进行群组检测;Vega-Magro [26] 提出了一种基于高斯聚类的算法进行群组检测.本文的研究重点并非群组检测,而是直接使用文 [26] 提出的群组检测算法.将检测到的群组表示为 gn = {h1,h2,··· ,hm} = {(h1s,h1f),(h2s,h2f),··· ,(hms ,hmf)},其中 gn 表示第 n 个群组,其中包含 m 个成员,成员信息由状态信息和社会属性信息组成.

  在获取准确的群组信息的基础上,本文提出群组共同关注区域的概念,将共同关注区域描述为一种与行人舒适空间类似的结构,表示为 Fsa,与行人舒适空间不同的是后方区域不会随速度的变化而变化.算法 2 为一个共同关注区域检测算法,算法首先使用一个最小圆覆盖算法来检测群组的共同关注区域中心,然后将群组内成员的平均速度和平均朝向角作为共同关注区域的朝向角,最后采用上节提出的非对称高斯函数来表示这个共同关注区域.

  3.2 扩展混合高斯模型

  混合高斯模型(GMM)被用来将单个人的舒适空间合成为群组的舒适空间 [18,27],本文对其进行了扩展,认为群组的舒适空间不是个人空间的简单线性组合,在群组内部存在各群组成员都关注的一个共同关注区域,在维护个人舒适空间的同时群组内的成员也在维护共同关注区域的舒适度,排斥他人进入这个共同关注区域.因此,在完成共同关注区域的检测后,使用扩展混合高斯模型(EGMM)将共同关注区域与个人舒适空间结合,构成群组的舒适空间 Fgn.

  其中 fhi (x,y) 表示个人的舒适空间,wm、wsa 表示群组内各个个体以及共同关注区域所占的权重,例如在一个存在成年人与儿童的群组当中,大部分情况下成年人在群组中占据着主导地位,应该占有较高的权重.这些权重可以通过机器学习或者其他参数估计算法进行计算,本文没有对其进行深入研究,将这些权重设置为一个相等的定值.

  图 11(a) 从左到右分别展示了“2 人相对交谈”“2 人并排行走”“3 人并排行走”“3 人相对交谈”这 4 种典型的行人交互模式,图中行人由内圈为深红色圆形、外圈为浅红色椭圆的椭圆表示,箭头表示行人的朝向角;图 11(b) 展示的是直接使用 GMM 构建的群组舒适空间;蓝色内圈和浅红色椭圆构成的图形表示检测出来的共同关注区域中心;图 11(c) 用一个由蓝色圆形与浅红色椭圆构成的虚拟人来表示检测出来的共同关注区域中心;图 11(d) 为使用本文提出的 EGMM 构建的群组舒适空间,对比可以看出本文方法构建的群组舒适空间更加符合人的直观判断.

  4 仿真与分析(Simulation and analysis)

  为了验证本文方法的有效性,首先使用问卷调查的方式对所提方法进行了定性的评价,然后通过仿真实验对所提方法进行了定量分析.

  4.1 调查问卷评价

  人的舒适度是一个带有个人色彩的主观性指标,关于个人舒适空间的建模方式也多种多样,本文通过线上调查问卷的形式对本文所提速度与个人舒适空间的合理性进行了统计验证.由于 Aiello [15] 已经证明过个人舒适空间大小与年龄和性别的关系,而且之前的工作已经对群组舒适空间的存在进行了广泛的证明,因此本文不再重复验证.

  问卷对舒适空间形状与速度变化的关系进行了调查.问卷首先对舒适空间的定义进行了描述,然后在第 1 个问题当中对参与调查者是否仔细地阅读过定义进行了考察,没有仔细阅读过定义的调查问卷被当作无效问卷.大部分参与者是在校学生,共有 168 人参与问卷调查,有效问卷 126 份,其中男性 79 人,女性 47 人,调查参与者的年龄 88.1% 集中在 20~40 岁之间.问卷结果如表 2 所示,关于舒适空间形状与速度的关系,83.33% 以上的参与者选择了本文所提的随着速度增大,行人的注意力会集中在前方和两侧,行人前方和两侧的舒适空间会增大,而后方的舒适空间会减小,本文所提模型更加符合大多男女的直观感受,具有一定的合理性.

  4.2 仿真研究

  为了验证所提动态可变舒适空间的有效性,将动态可变舒适空间应用于运动规划算法中.构建了如图 11 所示的分辨率为 240 × 240 的 12 m × 12 m 仿真环境,为了消除环境中其他障碍物因素对所生成路径的影响,在仿真环境中没有添加除人以外的障碍物.在该仿真场景中,设置了几种典型的行人分布情况,包括 2 人相对交谈、2 人并排行走、3 人并排行走、3 人相对交谈.

  表 3 列出了参与人员的具体信息,包含状态信息以及社会属性.

  根据参与实验的行人的具体信息,基于本文方法分别计算了单人和群组的舒适空间,并将其归一化到 0~255,从而构成全局代价地图.A* 算法是一个传统的机器人路径规划算法,能够在复杂环境中找到一条最优路径,本文利用该算法在所构建的代价地图中生成一条路径.设置了 4 种对比实验:

  1) 将行人当作静态障碍物 2) 对称舒适空间 + GMM 3) 非对称舒适空间 + GMM 4) 可变非对称舒适空间 + EGMM

  在实验 1) 当中,没有考虑行人的舒适感受并且直接将其设置为半径为 0.3 m 的静态障碍物;在实验 2) 中,σF = σB = σL = σR =1.2 m,使用对称个人舒适空间和 GMM 模型构建行人舒适空间;在实验3) 中,使用了文 [18] 提出的方法,采用参数固定的个人舒适空间和 GMM 模型构建行人舒适空间;实验 4) 则使用了本文提出的可变舒适空间与 EGMM 模型对行人的舒适空间建模.

  为了定量评估所提模型在规划算法当中的有效性,本文使用了不适度指标 DCI(discomfort index).根据本文所定义的舒适空间,该指标描述了使用规划算法生成路径对行人舒适空间的侵入程度,也就是生成路径的累计代价:

  其中,L 是规划算法规划出的整条路径,(xi ,yi) 表示规划出的路径点.

  在图 12(a) 中,行人被设置为半径为 0.3 m 的静态障碍物,机器人在规划路径时没有考虑行人的舒适感受,以及行人之间的交互状态,直接从正在交谈的两人中间穿行过去;在图 12(b) 中,在不考虑行人速度、使用对称舒适空间时,机器人会根据最短路径的原则从行人运动前方穿过,增加了碰撞风险,会使人产生不适;对比图 12(c) 和图 12(d) 可以看出,2 种方法生成了相似的路径,都能规避掉行人的可能前进区域,降低碰撞风险,减少闯入行人舒适空间的现象.但是由表 4 的指标可以看出,本文方法能够生成更低代价值也就是更高舒适度的路径,减少侵入行人的舒适空间.

  4.3 应用于基于强化学习的社交导航

  在 最 新 的 基 于 强 化 学 习 的 社 交 导 航 方 法如 CADRL(collision avoidance with deep RL) [28]、 LSTM-RL(long short-term memory RL)[29]、SARL (social aware RL) [30] 当中,通过设置相应的回报函数,机器人获得具有行人感知能力的导航策略.但是在训练过程中行人都被设置为半径固定的同质智能体,并没有考虑行人的舒适性与差异性.

  通过将动态舒适空间引入基于强化学习的社交导航框架,可以训练出考虑行人舒适感受的运动策略.本课题组在这方面进行了部分探索,将基于紧张空间的社交压力模型引入回报函数并提出了一个考虑社交压力的值函数网络,该网络利用考虑舒适感受的人机交互特征去估计机器人的状态值,从而获得了考虑行人心理感受的导航策略.

  5 结论(Conclusion)

  针对个人舒适空间建模问题,从个人自身特征出发,设计了一种基于非对称高斯函数的动态可变舒适空间模型.该模型首先利用人的运动状态信息来确定不同速度下的个人舒适空间的形状;然后基于模糊控制的思想将人的性别、年龄等社会属性特征量化为个性化的舒适空间大小.该模型具有很强的扩展性,除了本文提到的个人社会属性因素外,外部的环境因素也可以通过该模型决定舒适空间的大小.基于该模型,提出了基于最小覆盖圆的群组共同关注区域检测算法,并将共同关注区域与群组内个体的舒适空间通过 EGMM 模型结合构成群组舒适空间.最后,对所提可变舒适空间的合理性进行了问卷调查以及仿真实验,通过定性定量的分析可以发现本文所提的舒适模型更加符合行人的主观感受,在导航过程中能够产生令人更加舒适的路径.文中对该模型与基于深度强化学习的社交导航方法的结合进行了描述.

获取免费资料

最新文章