1,631
Views
4
CrossRef citations to date
0
Altmetric
Basic Research Article

Cross-cultural validity and psychometric properties of the International Trauma Questionnaire in a clinical refugee sample

Validez transcultural y propiedades psicométricas del Cuestionario Internacional de Trauma (ITQ) en una muestra clínica de refugiados

临床难民样本中国际创伤问卷 (ITQ) 的跨文化有效性和心理测量特性

ORCID Icon, ORCID Icon, ORCID Icon, ORCID Icon, ORCID Icon & ORCID Icon
Article: 2172256 | Received 18 Aug 2022, Accepted 04 Jan 2023, Published online: 14 Feb 2023
 

ABSTRACT

Background: The ICD-11 post-traumatic stress disorder (PTSD) and complex PTSD diagnoses have been examined in several studies using the International Trauma Questionnaire (ITQ). The cross-cultural validity of the ITQ has not previously been studied using item responses theory methods focused on the issue of equal item functioning and thus comparability of scores across language groups.

Objective: To investigate the cross-cultural validity of the ITQ scales considering specifically local independence of items and differential item functioning (DIF) in a cross-cultural sample of refugees.

Method: Data from 490 treatment-seeking refugees were included, covering Danish, Arabic, and Bosnian languages and different levels of interpreter-assisted administration. Rasch and graphical log-linear Rasch models were used.

Results: There was strong local dependence among items from the same symptom clusters in the PTSD and disorders in self-organization (DSO) scales, except between affective dysregulation items. Weak local dependence was discovered between an item from the affective dysregulation cluster and an item from the disturbed relationship cluster. There was no evidence of DIF related to language or interpreter assistance. There was evidence of DIF for two PTSD items relative to gender and time since the traumatic event. The targeting of the scales to the study population was not optimal. Reliability varied from 0.55 to 0.78 for subgroups.

Conclusions: The PTSD and the DSO scales have stable psychometric properties across the Danish, Arabic, and Bosnian language versions and different levels of assisted administration. Scores are comparable across these groups. However, DIF relative to gender and time since trauma introduces considerable measurement bias. DIF-adjusted summed scale scores or estimated person parameters should be used to avoid measurement bias. Future research should investigate whether scales including more and/or alternative items that require higher levels of PTSD and DSO to be endorsed will improve targeting and measurement precision for refugee populations.

HIGHLIGHTS

  • A first cross-cultural validity study of the ITQ using IRT.

  • PTSD and DSO subscales functioned invariantly across Danish, Arabic, and Bosnian, and also across degrees of interpreter assistance. Two PTSD items did not function invariantly across gender and time since trauma.

  • The Danish, Arabic, and Bosnian ITQ can be used for screening treatment-seeking refugees, taking into account the item bias in the PTSD subscale, and suboptimal targeting and reliability, which require extensions or modification of items.

Antecedentes: El Trastorno de Estrés Postraumático (TEPT) de la CIE-11 y los diagnósticos de TEPT complejo se han examinado en varios estudios utilizando el Cuestionario Internacional de Trauma (ITQ). La validez transcultural del ITQ no se ha estudiado previamente utilizando métodos de teoría de respuesta al ítem centrados en el tema del funcionamiento igualitario de los ítems y, por lo tanto, tampoco la comparabilidad de las puntuaciones entre los grupos lingüísticos.

Objetivo: Investigar la validez transcultural de las escalas de ITQ considerando específicamente la independencia local de los ítems y el funcionamiento diferencial de los ítems (DIF en su sigla en inglés) en una muestra transcultural de refugiados.

Método: Se incluyeron datos de 490 refugiados que buscaban tratamiento, que abarcaban los idiomas danés, árabe y bosnio y diferentes niveles de administración asistida por intérpretes. Se utilizaron modelos de Rasch y de Rasch loglineal gráfico.

Resultados: Hubo una fuerte dependencia local entre los elementos de los mismos grupos de síntomas en las escalas de TEPT y Trastornos de la autoorganización (DSO en su sigla en inglés), con la excepción de los dos elementos de desregulación afectiva en la escala DSO. Además, se descubrió una dependencia local débil entre el elemento c2 del grupo de desregulación afectiva y el elemento c5 del grupo de relaciones interpersonales alteradas. No hubo evidencia de DIF en relación con el idioma ni al grado de asistencia del intérprete. Hubo evidencia de DIF para dos ítems de TEPT relacionados con el género (p6; sentirse nervioso o sobresaltarse fácilmente) y el tiempo desde el evento traumático (p2; imágenes o recuerdos poderosos que a veces vienen a su mente en los que siente el evento). La orientación de las escalas a la población de estudio no fue óptima y la confiabilidad varió de 0.55 a 0.78 para los subgrupos.

Conclusión: Las escalas TEPT y DSO tienen propiedades psicométricas estables en las versiones en danés, árabe y bosnio y en diferentes niveles de administración asistida, y las puntuaciones son comparables entre estos grupos. Sin embargo, el DIF en relación con el género y el tiempo transcurrido desde el trauma introduce un sesgo de medición considerable. Por lo tanto, se deben usar puntajes de escala sumados ajustados por DIF o parámetros de persona estimados para evitar el sesgo de medición. La investigación futura debe investigar si las escalas que incluyen más ítems y/o ítems alternativos que requieren niveles más altos de TEPT y DSO para ser respaldados mejorarán la precisión de la focalización y la medición para las poblaciones de refugiados.

背景:几项使用国际创伤问卷 (ITQ) 的研究考查了ICD-11 创伤后应激障碍 (PTSD) 和复杂性 PTSD 的诊断。以前没有使用条目反应理论方法研究ITQ 的跨文化有效性,该方法侧重于平等条目功能问题以及跨语言组分数的可比性。

目的:在跨文化的难民样本中考查 ITQ 量表的跨文化有效性,特别考虑条目的局部独立性和差异条目功能 (DIF)。

方法:包括来自 490 名寻求治疗难民的数据,涵盖丹麦语、阿拉伯语和波斯尼亚语以及不同级别的口译员协助管理。 使用 Rasch 和图形对数线性 Rasch 模型。

结果:除了 DSO 量表中的两个情感失调条目外,PTSD 和自组织障碍 (DSO) 量表中来自相同症状簇的条目之间存在强烈的局部依赖性。 此外,在来自情感失调簇的条目 c2 和来自不安关系簇的条目 c5 之间发现了弱的局部依赖性。 没有与语言或口译协助程度相关的 DIF 证据。 有两个 PTSD 条目与性别(p6;感觉神经过敏或容易受惊)和创伤事件发生后的时间(p2;强大的图像或记忆有时会出现在你的脑海,让你在感受到处于事件中)的 DIF 证据。 量表对于研究人群的目标并不是最佳的,亚组的可靠性从 0.55 到 0.78 不等。

结论:PTSD 和 DSO 量表在丹麦语、阿拉伯语和波斯尼亚语版本以及不同级别的协助管理中具有稳定的心理测量特性,并且这些组之间的分数具有可比性。 然而,与性别和创伤后时间相关的 DIF 引入了相当大的测量偏差。 因此,应使用调整了DIF的总量表分数或估计人员参数来避免测量偏差。 未来的研究应该考查包括更多和/或替代条目、需要更高水平的 PTSD 和 DSO 才能背书的量表,是否可以提高难民群体的定位和测量精度。

Acknowledgements

We thank the patients and interpreters who participated in the study.

Authors' contributions

TN and AE planned the study. SBN and MAH acquired the data. TN conducted the analyses. All authors contributed to the first draft of the article and all authors contributed to and approved the revisions.

Disclosure statement

No potential conflict of interest was reported by the authors.

Data availability statement

Data can be made available for research purposes upon reasonable request to the corresponding author.

Notes

1 Uniform/non-uniform refers to the way in which items depend on either exogenous variables (in the case of DIF) or other items (in the case of LD), i.e. uniform implies that this dependence is the same across all levels of the latent variable, while non-uniform implies that it is not.

2 As we did not have complete information for the degree of assistance by the interpreter or clinician (n = 457), the tests of overall invariance and DIF relative to this were conducted after the final models had been established in the main analyses.