
·前言
「 使用 E4 通过机器学习方法测量压力强度
Using the E4 to measure stress intensity through Machine Learning methods 」
这篇文章由芬兰奥卢大学仿生学和智能系统小组的兼职教授 Pekka Siirtola 客座撰写。他的研究兴趣涉及人工智能、机器学习,以及如何使用这些来寻找健康和福祉相关研究问题的答案。这篇文章基于他于 2020 年 8 月发表的研究“用户无关和个人压力检测的回归和分类模型的比较”。
工作幸福感和工作效率密切相关。致幸福感和工作效率下降的主要因素之一是压力。为了有效地研究压力的原由,我们需要首先建立测量压力的方法。
通过将机器学习和人工智能方法应用于使用腕戴式可穿戴设备收集的传感器数据,可以非常准确地检测到压力。这些研究的局限性在于它们大多只能识别一个人是否有压力;换句话说,它们基于对离散目标变量进行分类。然而,与其他情绪类似,压力并不是一种离散现象:一个人的压力水平可以高也可以低,或者介于两者之间。因此,应根据连续的目标值对其进行分析。这意味着当数据具有离散目标变量时,不应使用分类方法,而应使用回归方法分析数据,因为它们是为连续目标变量设计的。
在大多数研究中使用离散目标变量而不是连续目标变量的一个明显原因是,为训练数据定义连续目标值比使用离散目标值要困难得多。因此,由于难以收集连续的目标值,已经在数据收集阶段做出了通过将连续现象转换为离散现象来简化研究现象的决定。
压力检测模型是否会从连续的目标变量中受益?收集连续的目标变量是否浪费时间?研究人员在 Sensors(巴塞尔)发表的文章 Siirtola & Röning (2020) 中继续了这个话题,如果回归方法确实优于分类方法,则将用于压力检测的回归和分类模型与实验进行比较。
·数据
本研究基于名为 AffectiveROAD 的公开数据集。该数据较初用于 Haouij 等人。al (2018) 之后,它被公开了。这个高质量的数据集包含来自九名参与者的数据,这些参与者在人们驾驶汽车时使用 Empatica E4 进行测量。事实上,参与者在两个手腕上都佩戴了该设备。Empatica E4 包括加速度计 (ACC),以及用于测量皮肤温度 (ST)、皮肤电活动 (EDA)、血容量脉搏 (BVP)、心率 (HR) 和心率变异性的传感器 (心率变异性);因此,它包含的传感器比市场上任何其他腕戴式设备都多。较重要的是,Empatica 提供的原始数据质量很高。因此,Empatica E4 常用于与压力和影响状态识别相关的研究。
在数据收集环节,参与者被要求在双腕上佩戴 E4 设备,并在正常交通中与其他司机一起驾驶汽车。会议以休息时间开始,研究对象只是坐在车里休息,闭上眼睛,发动机运转。实际任务包括在两种类型的道路和交通条件下行驶:在市中心低速行驶,在高速公路上高速行驶。在两种类型的道路上行驶的原因是城市驾驶被认为是有压力的,因为它包含红绿灯、大量车辆、行人和自行车。另一方面,高速公路是平坦的道路,假设在那里行驶压力较小。这样,就有可能获得数据集的变化,因此数据不会只包含一种类型和水平的压力。在训练中,应该能够检测任何类型压力的机器学习模型时,这种变化很重要。
这个数据集的特别之处在于它包括连续的主观压力预计,其中包含有关驾驶时主观压力预计的信息。这些估计值是由坐在后座的实验者在研究对象开车时收集的。此外,司机在会议结束后验证了这些猜想。估计的范围是从 0(=无压力)到 1(=较大压力)。因此,该数据集不仅假设在市中心驾驶时的压力高而在高速公路上压力低;因此,基于这些数据,可以训练预测压力水平的回归模型。
为了比较回归和分类模型,从 E4 数据中提取了一组不同的特征,例如统计特征。这些用于训练二元随机森林分类器和基于袋装树的集成回归模型。两人都使用留一人的方法进行训练,这意味着反过来,一个人的数据用于测试,而其他人的数据用于训练。分类模型需要离散的目标值,因此,对于分类模型,目标值被转换为 1 和 0,因此来自基线的数据被标记为 0,来自驾驶的数据被标记为 1。但是,回归模型是使用连续训练的目标值。另一方面,由于回归模型的输出也是连续值,它们被转换为离散的,以便将它们与随机森林分类器的结果进行比较。这是通过为每个人找到一个较佳阈值来将输出划分为压力和非压力以较大限度地提高准确性来完成的。其实这个对比说明了回归模型的分类算法。例如,当预测基于 BVP 和 ST 特征时,分类模型的平均平衡精度为 74.1%,回归模型的平均平衡精度为 82.3%。同样,当使用回归模型而不是分类模型时,灵敏度和特异性值更高。此比较显示回归模型分类算法。例如,当预测基于 BVP 和 ST 特征时,分类模型的平均平衡精度为 74.1%,回归模型的平均平衡精度为 82.3%。同样,当使用回归模型而不是分类模型时,灵敏度和特异性值更高。此比较显示回归模型分类算法。例如,当预测基于 BVP 和 ST 特征时,分类模型的平均平衡精度为 74.1%,回归模型的平均平衡精度为 82.3%。同样,当使用回归模型而不是分类模型时,灵敏度和特异性值更高。
这些结果表明压力检测受益于连续的目标值。这是预料之中的,因为一个人的压力水平可以高或低或介于两者之间,因此,研究的问题是回归问题而不是分类问题。
虽然回归模型在压力检测方面优于分类模型,但回归模型的真正好处在于,与分类不同,它们可用于估计压力水平。然而,根据我们的实验,这个预测不是很准确,它对一些研究对象很有效,但对所有研究对象并不适用。
「EMPATICA E4 腕带式生理信号监测仪现实世界和学术研究的传统行业标准」
