
消费者神经科学(或神经营销学)对客观神经测量的需求不断增加,以量化消费者的主观评价并预测对营销活动的反应。但脑电图的特性给这些目标带来了困难:小数据集、高维度、复杂的手动特征提取、内在噪声和受试者之间的差异。
而且,众所周知,脑机接口(BCI)、脑电图或神经营销社区都没有发布包含脑电图记录的数据集以及相应的适合深度学习规模的产品连续估值。也就是说,一个数据集将包括大样本量和每个参与者的多次试验。
该篇文章的主要目标是通过结合深度学习网络 (DLN) 的独特技术来克服这些限制,同时为神经科学和决策洞察提供可解释的结果。
该项研究开发了一个深度学习网络(DLN),根据受试者的脑电图数据预测他们的支付意愿 (WTP)。在每次试验中,213 名受试者观察了 72 种可能产品中的产品图像,然后报告了他们对该产品的 WTP。DLN 利用产品观察的脑电图记录来预测相应报告的 WTP 值。
结果显示,在预测高与低 WTP 方面,测试均方根误差为 0.276,测试准确率为 75.09%,优于其他模型和手动特征提取方法。网络可视化提供了神经活动的预测频率、头皮分布和关键时间点,揭示了评估所涉及的神经机制。
研究表明 DLN 可以执行基于脑电图的预测,是超越其他模型和手动特征提取方法,这对决策研究人员和营销从业者来说都是有利的。网络可视化提供了神经活动的预测频率、头皮分布和关键时间点,揭示了评估所涉及的神经机制。
EEG 记录被下采样 2 倍(从 500 赫兹到 250 赫兹)并划分为单独的时期,以便产品观察期间的每个记录都充当数据集中的单个样本。下采样不是强制性的,但建议用于更紧凑的网络,只要它不损害访问相关频率范围即可。一个纪元包括 3.5 秒的产品观察和 1 秒的前一个 ITI,模型将其用作基线。EEG 传感器可以拾取与将鼠标光标移动到选定的WTP值相关的皮层活动,因此从数据中删除此运动信息可确保研究模型只会识别与值相关的信息。因此,希望最大限度地减少任何手动预处理和过滤,可以为模型提供最接近原始信号的数据,并让模型在其中执行任何预处理。研究进行的唯一预处理步骤:首先,在 0.5 赫兹到 100 赫兹(二阶巴特沃斯)之间单独对每个电极的整个实验记录应用带通滤波器(在划分为纪元之前);然后,减去每个电极每个样本的平均信号。应用带通为模型注入了领域知识,即要搜索的相关频段位于该频段的范围内。减去平均值是常见的标准化做法,因此梯度不会失控。
由于网络的架构,将第一层解释为带通频率滤波器,并将随后的卷积解释为特定频带的空间滤波器。(A)来自经过训练的网络的前 3 个过滤器示例;底部 - 每个滤波器的傅里叶变换。(B)来自网络的所有 sinc 带通滤波器的聚合。每条水平线代表一个带通滤波器,使得该线在滤波器的截止频率处开始和结束。不透明灰色的直方图显示了所有滤波器中每个频率的总体比例。
第二层权重的插值空间分布绘制每个 sinc 带通滤波器有五个空间滤波器,每列从左到右代表一个相应的sinc滤波器,如图 3所示。根据来自前一层的带通滤波器,网络第二层的空间权重被分为各自的频带(或最近的频带)。然后,对每个频带内的所有空间权重进行平均,以产生每个频带八个最终权重。研究选择通过对每个标准 EEG 频带范围内的空间权重进行平均来对这些滤波器进行整体解释。这些表明,平均而言,在除 Alpha 之外的所有频段中,网络利用来自额叶电极 FPZ 的信息最多。此外,额叶 Delta、Beta 和 Gamma 对预测的巨大积极贡献。同时,Alpha带在平均权重方面表现出半球不对称性,使得右半球与正预测呈正相关,而左半球与负相关。
图 4显示了所有受试者和试验的权重分布(为了更好的可视化而在 0 和 1 之间归一化)及其中位数(表示为蓝线)。在时间点-1到0秒(红色区域)之间,受试者观看黑屏(ITI);因此,这些时间点的重要性较低。在刺激开始后 0.9−1.3 秒的时间点(橙色区域),我们可以看到重要性的增加,这可能意味着刺激值的初始处理。当输入到达注意力层时,它由 75 个时间点组成(由于平均池化),每个时间点都有每个输入生成的单独权重。研究将所有样本传递到最终网络并保存所有权重。在此基础上,每个时间点所有权重的小提琴分布以生成权重分布图。在时间点 –1 到 0 秒(红色区域)之间,受试者观看黑屏,在刺激开始后 0.9–1.3 秒(橙色区域)之间,重要性略有增加,从时间点 2.5 开始,可以观察到重要性大幅增加(绿地面积)。
对每个WTP 四分位进行平均后,跨受试者和产品的电极 FPz (A)、F7 (B)和 Cz (C)的 EEG 记录。产品图片在零时间出现,标志着试验的开始。线周围的不透明边界表示每个数据点的 SEM。显然,每个电极记录了不同的响应,并且需要不同的特征提取程序,进一步证明了优化和自动特征提取的需要。阴影区域标记了支付意愿四分位数之间未发现差异的时间点。虚线分别表示 150、220 和 300 毫秒标记。请注意,除了通过识别的三个分量(N150、P220 和 N300)捕获的特征之外,四分位数之间的信号的许多其他特征可能有所不同。
如图 6A所示,在刺激出现后 0.5 秒左右,较低频率范围 (0.5−10 Hz) 的顶部和底部平均频谱图之间存在显着差异。这由该时间点深蓝色大倾角周围的粉红色圆圈表示,其对数 PSD 差异接近 -0.2。重要的是,不同时间点的附加频率在高 WTP 值和低 WTP 值之间存在差异,如深红色和蓝色所示,分别代表近 0.1 和 -0.2 PSD 的对数差异。(A)顶部和底部平均频谱图四分位数的平均频谱图之间的差异。(B)中高和中低平均频谱图四分位数的平均频谱图之间的差异。产品图片在零时间出现,标志着试验的开始。粉色虚线圆圈围绕着对数 PSD 的显着差异。
为了避免脑电图研究中经常需要的复杂的手动特征提取,研究将完整的脑电图数据输入到 DLN 中,几乎没有任何预处理、伪影剔除或过滤,并设计其层以通过训练“自动”执行所有特征提取。这些层本质上取代了(实验认为是任意的)选择“经典”频率带通滤波器(alpha、beta、gamma、delta 和 theta)的标准做法。并且,某些层充当空间滤波器,用于识别电极上的最佳权重,而其他层则识别时域中的重要组成部分(Bi-LSTM 和注意力),而不是任意定义分析的时间窗口。
在这项研究中,使用最先进的 DLN,可以根据同一受试者在观察产品图像时记录的脑电图来预测受试者对产品的 WTP 值。独特的网络架构,特别适合脑电图解码和解释,以及实验使用的元处理,在预测高于和低于中位 WTP 值时达到了 75.09% 的准确率,AUC 为 0.832。在预测连续 WTP 值时,网络还实现了 0.276 RMSE。在所有情况下,该研究的网络都比其他深度学习网络更好,超过了利用手动特征提取的机器学习方法的结果,并大幅超过了随机结果(洗牌标签)。
感谢您的阅览,如有EEG信号采集设备产品采购或渠道合作,请联系我们!