首页 > 汽车技术 > 正文

汽车智能座舱分级与综合评价白皮书

2024-11-23 14:26:12·  来源:智驾社  
 
3.2.3 面向产品的客观测试评价方法

在面向产品的评价体系中,主要使用客观测试评价方法,在将量化的测试结果统一转化为可对比的分数后,不同产品各自的特点能被更加直观地体现。智能座舱的客观测试评价方法主要包括静态测试、实车模拟驾驶平台测试、实际道路测试等。

静态测试指在车辆保持静止且车机系统正常运行的状态下对其进行测试,期间驾驶员无需进行驾驶相关的活动,智能座舱的大部分功能都可以在静态时完整使用。静态测试需要由专业素质较高的测试员执行,同时也可以使用专业测试设备来进一步提高结果的标准化程度。在测试座舱的语音交互能力时,使用符合相关标准的人工声源能够准确且不间断地说出语音指令,避免可能的人为误差。对于触屏相关测试任务,借助仿真机械手不但能重复、标准地进行测试, 还能通过编写程序实现一定程度的自动化,进一步优化测试流程。静态测试需要的专业测试设备还可能包括专业相机等,其目的都是为了提高测试效率,降低测试成本,以及保证测试结果的准确和可靠。

实车模拟驾驶平台测试是专门面向驾驶次任务的测试方法,能够全面、高效地测试真实车辆的人机交互系统。其中包括了视听仿真系统、驾驶仿真系统、实验系统接口、数据采集系统、测评管理系统。与自然驾驶相比, 在模拟驾驶环境中可以设计标准化的任务和事件,并由计算机来进行精确地触发,避免了自然驾驶研究中事件发生的随机性问题和安全隐患。模拟驾驶环境也方便控制环境变量,以避免实路测试中阳光角度、路面起伏等对测试员行为造成的潜在影响。这种新型的驾驶模拟测试方法既能够采集丰富的实时驾驶行为数据,又能够在评价中充分考虑真实车辆的人机交互布局和设计因素。该方法主要针对评价体系中的操作安全指标,其评价结果主要来自于对测试员驾驶行为数据和交互行为数据的综合交叉分析。

实际道路测试指测试车辆行驶于规定的实际道路上时的系统功能和表现,主要针对驾驶辅助类任务、导航类任务、驾驶员检测、语音交互等需要车辆在实际驾驶状态下才能够实现的功能。此外,智能座舱中还有在特定场景下才会被激发的智能功能,如远途自动规划加油站/充电站、到达目的地主动推荐兴趣点等,对于这类功能的评价也需要在实际道路测试中才能完成。

3.3 面向用户体验的评价体系

3.3.1 高效维度评价指标体系

高效维度的指标主要参考“ISO-9241-210 人机系统交互工效学标准”交互可用性中的绩效(effectiveness)和效率(efficiency)。其中,绩效包含准确性和完整性,效率包含用户完成任务所需资源。因此, 将高效维度的指标分为主要采用客观评价的操作绩效和可同时采用主观和客观评价的感知绩效,操作绩效和感知绩效两个二级指标分别对应上述标准中的绩效和效率,二者又可以同时作为彼此的补充和验证指标。

操作绩效主要包括任务完成程度、任务完成速度、任务完成准度。任务完成程度即任务完成的完整性,用户成功完成任务的数量或百分比可作为该方面的客观评价指标,反之,用户在完成任务过程中的失败数量或百分比也可作为评价指标。任务完成速度即完成任务所需时间资源,常用任务的持续时间、手指移动距离等作为评价指标,一般还会对任务的交互模式或功能等加以限制以便量化处理。任务完成准度即任务完成的准确性,这是对误差的量化评价,这种误差根据不同的交互任务有不同的量化指标,包括空间精度误差、信息检索误差、完成任务过程中的非必要操作步骤数等。

感知绩效主要包括易感知、易理解、易学习。易感知的主观评价反映了用户能否有效发现完成系统交互任务所需的关键元素、信息、功能入口。 感知是用户对交互体验过程中视觉、听觉等所有模态的信息的获取阶段。如座舱交互主要涉及到的视觉感知中,用户在不同注视点之间的眼跳数据,可以反映在执行任务过程中,用户在界面中搜索查找所需信息眼球移动的轨迹,可作为易感知的客观评价指标。易理解的主观评价反映了用户在执行任务过程中的认知努力。在操作任务中,一般认为,目标信息被注视的时间越长,说明用户需要花费更多的认知资源对其进行加工处理,注视持续时间可用于测量用户的认知理解过程。注视持续时间越长,用户理解效率越低,交互系统的易理解性越差。易学习的主观评价体现在用户快速掌握并使用交互系统完成任务的能力,客观评价可包括用户学习时间、次数、眼动、脑电等行为生理指标。

图片

图片

表 3-3  高效维度评价指标

3.3.2 愉悦维度评价指标体系

愉悦维度的评价主要围绕驾乘人员的体验感受展开评测。用户在使用产品过程中产生的愉悦感具有多个来源,既包含了生理感官层面上的直接感受,又包含了用户心理层面的体验。在指标划分上, 对应用户在使用产品过程中不同层次的愉悦感体验,使用舒适和满意作为二级指标。在愉悦维度的测试评价中, 以主客 观结合的方式以确保真实、准确反映用户使用座舱产品的愉悦程度。

舒适主要反映用户在使用座舱产品过程中和过程后产生的情绪体验,可划分为信任度、趣味度、认同度和推荐度等三级指标。信任度是用户在使用座舱系统功能或模式时的信赖程度。趣味度是用户在使用座舱系统功能或模式时感受到的趣味程度,包括对功能本身、操作方式和交互内容等多方面的趣味认可程度。认同度主要反映用户对于整个座舱产品和品牌的认同程度。推荐度能够反映用户向他人推荐系统中某项功能、应用、模式的意向程度。

满意是用户综合体验的关键评价指标,反映用户在使用座舱产品过程中和过程后对于感官、功能和操作三个方面的满意程度。按照愉悦感来源, 满意度可主要划分为感官满意度、功能满意度、操作满意度。感官满意度是用户在感官层面上对于座舱内各界面的满意程度,主要考察用户的视觉、听觉、肤觉、嗅觉和体感的体验,对座舱空间、造型、色彩材质工艺(CMF)、灯光、温度、湿度、声音、气味等多个方面进行多维度评价。功能满意度是用户使用座舱产品提供的功能满足自身需求时,对于特定功能执行效果的满意程度。操作满意度是用户在执行交互任务时对于交互中操作过程的满意程度。功能满意度指标和操作满意度指标能够在静态满意度测评的基础上对用户在交互过程中的动态满意度进行评价。

图片

图片

表 3-4  愉悦维度评价指标

注:视觉满意度包括亮度、色温、空间、造型、CMFUI/UX……;听觉满意度包括隔音水平、行驶噪声、车载媒体声音/交互音量…… ;肤觉满意度包括座椅舒适度、座舱内温度、湿度、空气风速……;嗅觉满意度包括空气质量、香氛……

3.3.3 面向用户体验的主客观测试评价方法

1 .主观测试评价方法

主观评价是用户根据自己对智能座舱功能交互体验感受的自我报告。主观测 评方法主要有用于整体评估智能座舱的系统可用性量表(SUS)、李克特五级满 意度问卷量表、SAE 十级满意度和接受度量表、技术接受模型(TAM)等,有用 于智能座舱各功能交互任务评估的场景后问卷(ASQ)评价与深度访谈等,还有 用于用户完成交互任务过程中心理负荷评估的 NASA  任务负荷指数(NASA- TLX)等。鉴于个体差异, 用户可能会出现对体验感受表达的偏差,所以需要用 户体验客观数据进行有效性检验。

2 .客观测试评价方法

客观测试评价主要用于对用户完成交互任务过程中认知活动、动作行为和生理变化的客观量化评价,包括眼动分析、肢体动作分析、面部表情分析、生理变化分析、脑活动分析等。认知活动可以根据不同交互模态采用不同的客观数据来源,如对中控屏界面信息交互的眼动分析主要包括分析眼动注视轨迹、注视热点图、瞳孔直径等数据。动作行为可采集用户交互操作数据,如用户对中控屏交互 界面进行触控操作时,对用户在执行触摸交互任务过程中的操作指尖总移动距离、操作指尖方向变化频率、操作时间、操作步骤数等。生理状态分析主要包括分析用户执行任务过程中的心率、呼吸频率、肌电等生理表征变化的数据。无明显外部表征的脑活动分析则主要分析用户执行任务过程中或体验过程中的脑电信号或近红外脑功能成像数据。脑部活动所产生的情绪状态外露,即面部表情分析主要分析用户对产品产生的高兴、惊讶等情绪。

3 .主客观结合的测试评价方法

主客观结合的测试评价方法,是将主观评价可分级、可分类量化的优点和客观评价准确性和客观性的优点相结合,从而构建更科学、有效、准确的智能座舱用户体验主客观相结合的测试评价方法。该方法的核心思想是;(1)对用户交互体验主观评价问卷数据进行筛选和客观验证处理,得到有效的功能满意度、接受 度主观评价数据,以及用户满意度、接受度分级分类评价分布;(2)对客观评价数据进行去噪和特征提取,形成客观评价数据;(3)将各功能对应的主客观评价数据进行相关性分析,若主客观评价数据存在相关性,则认为用户的主客观评价数据是有效的,可用于智能座舱功能交互体验评价;若主客观评价数据不存在相关性,则表示主客观测评结果不一致,不纳入最终评价结果;(4)主客观相结合的测试评价方法可用于分析、揭示用户对智能座舱交互过程中产生不同满意度等的原因,提出有针对性的改进建议。此外,主客观结合的测试评价也应考虑年龄、性别等用户特征。

四、总结与展望

4.1 总结

本项报告联合了来自国内外重点整车企业、上下游生态企业、科研院所等方面的超过 100 家单位的 200 余位专家,从汽车智能座舱的定义、技术分级、综合评价体系和方法进行了系统全面的研究,并达成了广泛共识。

本项报告研究提出了汽车智能座舱的定义;以技术引领和应用规范为目标,从人-机-环融合的角度对智能座舱进行分级,确定从“功能座舱”到“全面认知智能座舱”的五个级别;初步提出了汽车智能座舱“三横三纵”技术架构;并描绘了发展蓝图。

本项报告研究同时提出了汽车智能座舱综合评价指标体系与评价方法。评价体系从产品和用户体验两个角度综合考虑,包括安全、智能、高效和愉悦四个一级指标。安全和智能主要用于评价座舱的产品先进性, 高效和愉悦主要用于评价用户体验。本评价体系为智能座舱测评提供了方向性、框架性的参考和指引,对三级及以下指标保持开放性,做到可持续迭代升级。

汽车智能座舱分级与综合评价是智能座舱基础性工作的两项独立任务。智能座舱综合评价不是对智能座舱分级的评价。

4.2 展望

经多轮专家研讨与评审,部分内容仍未达成统一,有待进一步商榷,具体如下:智能座舱定义与分级部分:(1)场景需进一步明确(比如场景类别,划分思路与方法,识别与理解等);(2)在分级中,舱驾融合是否需要作为一个指标充分考虑,需进一步讨论,在分级的早期版本中曾将舱驾融合作为其中一个指标;(3)颠覆性技术(特别是虚拟现实与元宇宙相关技术)的涌现会改变未来智能座舱形态(特别是L3 和L4 级智能座舱)及蓝图;(4)未来几年智能座舱体系性研究可能会对分级思路有新的启发,后续修订版本会考虑这些因素并相应更新定义、分级与蓝图;(5)该版本主要适用于乘用车智能座舱,未来考虑进行商用车和特种车辆智能座舱的深入研究。汽车智能座舱综合评价部分:(1)现有的指标主要面向屏幕等视觉交互产品的评价,随着新技术(如虚拟现实与元宇宙相关技术)的不断发展,智能座舱场景下的用户角色(从驾驶员到乘员)及其需求会发生变化,相应新产品的出现可能会导致现有三级及以下指标不能很好的适应新产品的评价,后续修订版本会在保持现有框架稳定的前提下,对三级及以下指标做到可持续升级;(2)现有版本尚未阐述各指标的权重,具体的测量计算方法,后续修订版本将会考虑这些因素进行更新;(3)基于智能座舱测试评价任务复杂、评价对象多元等特点, 智能座舱测试评价工具开发亟待进行,主要包括在线测试评价数据分析平台、自然的数据采集软硬件设备等;(4)该版本主要适用于乘用车智能座舱,未来考虑进行商 用车和特种车辆智能座舱的深入研究。

同时,专家建议后续在学术研究、产业研究、人才培养、国际合作等方面及时开展工作。

学术研究:基于智能座舱多学科交叉融合的特点,开展智能座舱理论体系研究,包括智能座舱场景-功能理论体系(类别、划分、识别与理解等),智能座舱系统设计理论体系(静态系统设计理论、动态系统设计理论等),智能座舱多模态人机交互理论体系,智能座舱虚拟现实设计理论体系(虚拟呈现设计理论、人机虚实交互理论等),智能座舱智能化评价理论体系等。

产业研究:组织梳理智能座舱相关标准需求;梳理和提炼智能座舱基础科学问题与共性关键技术,组织力量协同攻关。

人才培养:组织梳理智能座舱专业技术人才需求、课程设置与培养方案。国际合作:推动智能座舱定义、分级与评价体系的国际化。

分享到:
 
反对 0 举报 0 收藏 0 评论 0
沪ICP备11026917号-25