基于COSMIN方法的环境恢复性量表测量性能系统评价
摘要:遵循“基于共识的健康测量工具选择标准”(COSMIN),对14个基于注意力恢复理论中恢复性四因素发展的自评式环境恢复性量表的测量性能进行系统评价,形成推荐等级并讨论基于研究情境的量表决策路径。14个量表在结构效度、内部一致性、稳定性和跨文化效度方面整体表现一般,并普遍缺乏内容效度研究。在不考虑间接风险的条件下,仅RCS达到直接推荐等级,PRCS-C与PRS-23(CH)未达到推荐等级,其余11个量表归为暂时推荐等级,总体质量欠佳,亟须加强内容效度研究、规范研究方法、深化理论模型。
基金项目:国家自然科学基金面上项目“基于高压人群身心健康的工作环境绿色空间体系研究”(编号51978364)、福建省社会科学规划项目“基于计算机视觉的城市绿道宜跑品质评价方法研究”(编号FJ2021C069)和福建省中青年教师教育科研项目“大学校园道路景观恢复性品质关联物质空间特征研究”(编号JAS21067)共同资助
1背景与目的
20世纪80年代,斯蒂芬·卡普兰(S.Kaplan)与蕾切尔·卡普兰(R.Kaplan)提出注意力恢复理论(AttentionRestorationTheory,
ART)[1-2],认为某些环境具有一种可感知的抽象特征,可以使个体进入被动注意模式,使主动注意(或称定向注意)从疲劳中恢复,而后者被认为对机体健康有重要意义。这种可感知的特征即环境恢复性,被认为包含4个基本因素①:1)吸引(fascination),在注意力恢复理论中意同“被动注意”,指人不自觉地被环境吸引并产生兴趣和代入感,是环境恢复性体验产生的先决条件;2)远离(beingaway),指人在精神层面远离了那些需要消耗主动注意的对象,如工作、学习、日常琐事等,远离感是注意模式转换的前提;3)延展(extent),指环境要素在结构上连接有序,在形式和内容上和谐统一(coherence),使人感到环境在空间或时间维度上能够不断延展至一个足够的范围(scope),形成“一个完整的世界”;4)相容(compatibility),指环境与使用者的特质和行为相匹配,并能为使用者提供与行为相关的信息。
近年来,以四因素为结构原型发展出了诸多环境恢复性测量量表,迅速推动了环境恢复性研究的发展。为了系统性提高该领域研究质量,有必要对环境恢复性量表的测量性能进行系统评价,为研究工具的选择提供基础性依据。
2材料与方法
“基于共识的健康测量工具选择标准”(Consensus-basedStandardsfortheSelectionofHealthMeasurementInstrument,COSMIN)是当前以自评式健康测量工具为对象,实施系统评价与形成选择意见的共识标准[3-4],流程包括纳入量表、评价量表测量性能和形成量表推荐等级3个阶段。
2.1纳入量表
2.1.1检索策略
1)一次检索:选择WebofScience(WOS)、Scopus、中国知网(CNKI)为数据库进行高级检索。在WOS中使用检索式:TI=("environmentalrestorativeness"OR"restorativeenvironment"OR"perceivedenvironmentalrestorativeness"OR"perceivedrestorativeness"OR"perceivedrestoration"OR"restorativecomponent"OR"restorativequality")ANDTI=(scaleORmeasur*ORassess*ORevaluat*);在Scopus中将“TI=”替换成“TITLE”;在CNKI中使用检索式:TI='环境恢复性'+'恢复性环境'+'环境复愈性'+'复愈性环境'+'恢复性感知'+'感知恢复性'+'恢复性成分'+'恢复性品质'+'恢复性'+'复愈性'ANDTI='量表'+'测量工具'+'测量'+'评价'+'评估'。2)二次检索:对一次检索中符合纳入标准的文献使用雪球法查找其参考文献和施引文献中的相关文献,直至饱和。检索时不限文献发表时间。
2.1.2纳入标准
检索到的文献、量表和研究符合以下标准的将被纳入系统评价:1)以开发或效验量表为目的的研究,如果一篇文献既包含量表的开发效验研究,也包含以该量表为工具的其他目的研究,则只纳入前者;
2)量表所测构念(construct)是注意力恢复理论所定义的环境恢复性;
3)量表的结构或内容发展以经典四因素为原型;
4)量表测量的是视觉环境的恢复性,不是其他对象(如声音、活动)的恢复性;
5)文献中含量表正文,且量表的发表语言与施测语言一致;
6)每个分量表包含不少于3个项目;
7)考虑本文受众,只纳入以英文或中文发表的文献、英文或中文施测的量表;
8)同一量表的不同语言版本视为不同量表,分别纳入;
9)不限制量表人群对象和环境对象的亚类。
2.1.3筛选流程
首先合并2个英文数据库的检索记录并用NoteExpress软件删除重复题录;之后对英文文献、中文文献分别依次进行题目阅读、摘要阅读、全文阅读,排除不符合纳入标准的文献、量表、研究;再后对二次检索到的文献进行全文阅读筛选。2名评价员独立完成筛选过程后合议(图1)。
2.2评价量表测量性能
2.2.1提取信息
1)提取量表设置与施测信息。
提取量表施测语言、分量表、项目与选项设置、量表施测的人群对象和环境对象特征,以及环境呈现方式等信息。
2)提取待评测量性能信息。
内容效度、结构效度、内部一致性的评价结果是形成COSMIN推荐等级的必要条件,因此选择其作为主要评价项;部分量表效验了稳定性和跨文化效度,因此选择它们作为辅助评价项。由于缺乏金标准(GoldStandard)和构念相关关系假设集,无法在COSMIN框架下评价校标效度和构念效度,另外环境恢复性量表主要用于横向研究,一般不包含基于纵向方法的测量误差和反应度研究,因此不予评价。
2.2.2评价测量性能质量
1)内容效度。
基于开发研究结果、内容效度研究结果、评价者评分三方面证据,使用《COSMIN内容效度评价手册》评价量表内容的相关性、全面性和可理解性。相关性指项目内容是否与所测构念、目标人群等相关;全面性指量表内容是否全面反映所测构念;可理解性指量表的项目、选项、指导语的表述是否可被目标人群理解。三者均良好则总评良好(+),三者均不良则总评不良(-),三者评级不一致则总评为不一致(±)[5]。
2)其他性能。
使用《COSMIN良好测量性能标准》评价结构效度、内部一致性、稳定性和跨文化效度,达到标准则评为良好(+),反之不良(-),当信息不足或存在不一致时可被评为不确定(?)。结构效度良好的标准是结构方程模型的RMSEA<0.06,或SRMR<0.08,或CFI>0.95,或提取的因素解与理论预设基本一致且累计方差贡献率≥60%②;内部一致性良好的标准是在至少有低等级的证据证明结构效度良好的前提下,Cronbach'sα值≥0.7;稳定性良好的标准是组内相关系数(ICC)或加权Kappa值≥0.7;跨文化效度良好的标准是在多组分析(MGCFA)中没有发现重要差异[4]。
2.2.3证据定级
COSMIN方法要求在报告测量性能质量评价结果的同时报告其可信性,即证据等级。证据等级有4级:高(H)、中(M)、低(L)、很低(VL)。先将证据等级定为“高”,再根据以下风险大小进行降级:1)偏倚风险,使用《COSMIN偏倚风险评价清单》[6]评价性能研究的方法学质量,结果包含很好(V)、合格(A)、存疑(D)、不合格(I)4个等级,汇总同一性能的所有研究的方法学质量评价结果,确定偏倚风险;2)不一致风险,即同一性能不同研究结果评级不一致;3)不精确风险,性能研究总样本<100时,存在误差大、结果不精确的风险;4)间接风险,量表开发的施测情境与拟研究情境差异较大时,存在间接风险。
2.3形成量表推荐等级
汇总各量表各性能的质量评价结果及其证据等级。COSMIN规定当有任意等级的证据表明量表的内容效度良好,且有低等级以上证据表明内部一致性良好时,归为A类(推荐);当有高等级证据表明量表存在不良的测量性能时,归为C类(不推荐);无法归至A类或C类时即为B类(暂时推荐)。