Optimierung des Beck-Depression-Inventars

Originalinstument

Das Depressionsinventar von Beck gehört zu den weltweit am häufigsten verwendeten Depressionsmaßen. In der aktuellen Originalversion (Beck & Steer, 1987) und der entsprechenden deutschen Version von Hautzinger, Bailer, Worall und Keller (1994) werden 21 Symptome der klinischen Depression abgefragt. Die Intensitätsskalierung geschieht in Form von vier Aussagen zunehmender Schwierigkeit je Symptom. Die Messeigenschaften des BDI sind gut untersucht (Beck, Steer & Garbin, 1988; Lukesch, 1974; Richter, Werner & Bastine, 1994; Röhrle, 1988). Die Reliabilität des BDI ist hoch, seine Validität gilt als belegt (Richter, 1991).

Optimierungsvorschlag

Optimierbar erscheint die Nützlichkeit des BDI. Die Schwierigkeitsskalierung durch vier Items je Symptom ist unökonomisch. In der Einzelfalldiagnose mag Nützlichkeit eine geringe Rolle spielen. In epidemiologischen Screenings und multivariaten Fragebogenstudien an großen Stichproben ist Ökonomie jedoch ein wichtiges Gütekriterium. Der Versuch einer Vereinfachung des BDI erscheint deshalb lohnend.

Ein Vereinfachungsversuch wurde von Schmitt und Maes (2000) im Rahmen eines DFG-geförderten Längsschnittprojekts Gerechtigkeit als innerdeutsches Problem unternommen.

Zwei Kürzungsmöglichkeiten standen zur Wahl. In Anlehnung an Beck (1978) und Kammer (1983) hätte die Symptomzahl verringert werden können. Dadurch hätte sich die Itemzahl aber höchstens halbieren lassen. Eine weitere Reduktion hätte sich aus inhaltlichen Gründen (unzureichende Repräsentativität der Symptome) und zur Wahrung der Reliabilität verboten. Deshalb wurde die Zahl der Items pro Symptom verringert.

Die 21 Symptome wurden bis auf den Gewichtsverlust, der die geringste Trennschärfe besitzt (Hautzinger et al., 1994; Kammer, 1983), beibehalten und durch eine Aussage operationalisiert. Dies bedeutet eine Kürzung von 84 auf 20 Items. Die Symptomstärke wird über das Antwortformat skaliert. Verwendet wird eine sechsstufige Häufigkeitsskala mit numerischer Stufenverankerung und zusätzlicher sprachlicher Verankerung der Extremwerte (0/nie-1-2-3-4-5/fast immer). Itemzahl und Antwortskala ergeben einen möglichen Wertebereich von 0 bis 100. Die Items werden mit "Wie ist Ihr gegenwärtiges Lebensgefühl?" überschrieben und durch folgende Instruktion eingeleitet: "In diesem Fragebogen geht es um Ihr gegenwärtiges Lebensgefühl. Bitte geben Sie zu jeder Frage an, wie häufig Sie die genannte Stimmung oder Sichtweise erleben." Die 20 Items lauten:

(1) Ich bin traurig.
(2) Ich sehe mutlos in die Zukunft.
(3) Ich fühle mich als Versager(in).
(4) Es fällt mir schwer, etwas zu genießen.
(5) Ich habe Schuldgefühle.
(6) Ich fühle mich bestraft.
(7) Ich bin von mir enttäuscht.
(8) Ich werfe mir Fehler und Schwächen vor.
(9) Ich denke daran, mir etwas anzutun.
(10) Ich weine.
(11) Ich fühle mich gereizt und verärgert.
(12) Mir fehlt das Interesse an Menschen.
(13) Ich schiebe Entscheidungen vor mir her.
(14) Ich bin besorgt um mein Aussehen.
(15) Ich muss mich zu jeder Tätigkeit zwingen.
(16) Ich habe Schlafstörungen.
(17) Ich bin müde und lustlos.
(18) Ich habe keinen Appetit.
(19) Ich mache mir Sorgen um meine Gesundheit.
(20) Sex ist mir gleichgültig.

Messeigenschaften des vereinfachten BDI (BDI-V)

Die Messeigenschaften des BDI-V wurden von Schmitt und Maes (2000) an einer Stichprobe von 2500 Probanden untersucht. Die interne Konsistenz der Skala beträgt = .90. Latent-State-Trait-Analysen ergeben eine sehr gute Reliabilität des Summenwertes (.95), eine hohe Trait-Konsistenz über einen Zeitraum von zwei Jahren (.64), eine deutliche Messgelegenheitsspezifität (.26) sowie eine geringe Methodenspezifität (.05). Korrelationen des BDI-V mit anderen Indikatoren des Wohlbefindens, mit demographischen Variablen, mit der objektiven und subjektiven Qualität der eigenen beruflichen Situation, mit dem Glauben an eine gerechte und eine ungerechte Welt, mit Kontrollierbarkeitsüberzeugungen und mit Einschätzungen der beruflichen Lebensqualität in Deutschland sprechen für eine gute Konstruktvalidität. Die Korrelation mit sozialer Erwünschtheit (-.34) ist psychologisch mehrdeutig und bedeutet nicht zwangsläufig eine validitätsmindernde Verfälschungsanfälligkeit des BDI-V.

In einer weiteren Studie von Schmitt, Beckmann, Dusi, Maes, Schiller und Schonauer (2003) wurden die Messeigenschaften des BDI-V an einer demographisch heterogenen Gelegenheitsstichprobe (n = 200) und drei klinischen Stichproben (Major Depressive Disorder, n = 60; Angst- und Essstörungen, n = 11; Schizophrenie, n = 40) vertiefend untersucht. Homogenität und Reliabilität des BDI-V übersteigen jene des Original-BDI (BDI-O) und jene weiterer vier Depressionsskalen. BDI-V und BDI-O konvergieren auf der Ebene einzelner Symptome (durchschnittliche Korrelation in der Gesamtstichprobe = .70) und auf der Ebene des Summenwertes (r = .91 in der Gesamtstichprobe). Beide BDI-Versionen korrelieren in ähnlicher Höhe mit anderen Selbstbeschreibungsmaßen der Depression (durchschnittliche Korrelation = .70) und einem Expertenrating (Hamilton-Skala, r = .50). BDI-V und BDI-O differenzieren ähnlich gut zwischen klinisch unauffälligen Personen und Patienten mit einer depressiven Primär- oder Sekundärsymptomatik. Vergleichbar gut gelingt mit beiden Versionen auch die Differenzierung klinischer Gruppen. Eine konfirmatorische Faktorenanalyse ergab in der klinisch unauffälligen Stichprobe eine geringfügige Abweichung von perfekter Messäquivalenz (1.00 < r < .95). Diese Abweichung ist für die diagnostische Praxis unbedeutend. Mit dem vereinfachten BDI steht ein Instrument zur Verfügung, das gleich gute Messeigenschaften aufweist wie das Original, diesem in seiner Messökonomie aber deutlich überlegen ist und sich deshalb insbesondere für epidemiologische Screenings an großen Stichproben eignet.

Normierung

Anhand einer Stichprobe von N = 4494 Personen (2418 Männer, 2076 Frauen) wurden von Schmitt, Altstötter-Gleich, Hinz, Maes und Brähler (2006) Normwerte (Prozentränge, T-Werte, z-Werte) für das BDI-V ermittelt. In Varianzanalysen mit den Faktoren Alter und Geschlecht waren die beiden Haupteffekte und die Interaktion signifikant. Alle drei Effekte waren klein. Das Geschlecht erklärt 1.5% der BDI-V-Varianz, das Alter je nach Gruppierung zwischen 0.6% und 2.3%, die Interaktion je nach Altersgruppierung zwischen 0.4% und 2.1%. Wegen des signifikanten und in allen Altersgruppen konsistenten Geschlechtsunterschieds wurden außer unspezifischen Normen auch getrennte Normen für Männer und Frauen ermittelt. Auf eine altersspezifische Normierung wurden wegen zu geringer Größen geschlechtsspezifischer Altersgruppen verzichtet. Basierend auf den Stichproben der Untersuchung von Schmitt et al. (2003) wurden die Sensitivität und die Spezifität des BDI-V für verschiedene cut-off-Werte geschätzt. Bei einem BDI-V-Wert von 35 und mehr liegt mit ungefähr 90%iger Sicherheit eine klinisch relevante Depression vor, bei Werten unter 35 kann mit ähnlich hoher Sicherheit eine klinisch relevante Depression ausgeschlossen werden. Somit gewährleistet dieser kritische Wert von 35 den besten Kompromiss zwischen Sensitivität und Spezifität. Er entspricht in der Normierungsstichprobe einem Prozentrang von .85. Bei BDI-V-Werten von 35 und mehr sollte nach zwei Wochen eine Messwiederholung vorgenommen und bei unverändert starker Symptombelastung eine klinischen Abklärung der Gefahr einer depressiven Erkrankung erfolgen.

Desiderate

Weiterführende Untersuchungen zum BDI-V sind wünschenswert. Drei Forschungsziele halten wir besonders wichtig:

(1) Da in der Überschrift des Verfahrens vom „gegenwärtigen Lebensgefühl“ die Rede ist und in der Instruktion kein zeitlicher Rahmen zur Beurteilung der Symptomhäufigkeit vorgegeben wird, könnte der Zeitrahmen, den Personen bei der Beantwortung der Items vor Auge haben, Varianz erzeugen. Zwar impliziert die Antwortskala durch die gewählte Bezeichnung der Pole eine zeitliche Standardisierung, Schwankungen in der Symptomkonzentration könnten sich aber niederschlagen. Trotz gleicher Symptombelastung werden Personen, die an Zeiträume erhöhter Symptomhäufigkeit denken, höhere BDI-V-Werte erzielen als Personen, die Phasen geringer Symptombelastung erinnern. Es wäre deshalb wichtig, den Einfluss unterschiedlicher Zeitvorgaben in der Instruktion zu untersuchen.

(2) Angesichts der begrenzten Koinzidenz depressiver Symptome könnte der Verdacht aufkommen, dass die Homogenität und die interne Konsistenz des BDI-V künstlich erhöht sind. Für diese Überlegung sprechen Befunde zum sequentiellen Priming (Duckworth, Bargh, Garcia & Chaiken, 2002) und zur Stimmungskongruenz des Urteils (Mayer, Gaschke, Braverman, & Evans, 1992). Die Beantwortung der Frage zur Häufigkeit eines Symptoms A kann die Erinnerung an ein Symptom B erleichtern, wenn beide Symptome im semantischen Netzwerk verknüpft sind. Weiterhin kann sich die Frage nach depressiven Symptomen stimmungsverändernd auswirken und dadurch wiederum die Zugänglichkeit stimmungskongruenter Gedächtnisinhalte beeinflussen. Beide Prozesse könnten die Itemkorrelationen künstlich in die Höhe treiben und die Validität des BDI-V gefährden. Allerdings sind alle anderen hier verwendeten Selbstbeschreibungsmaße von der gleichen Artefaktproblematik betroffen, so dass eine spezifische Artefaktanfälligkeit des BDI-V nicht anzunehmen ist. Dennoch verdient das Argument eine empirische Untersuchung über die verteilte (statt massierte) Vorgabe der Items. Voraktivierungseffekte und Stimmungseffekte sind relativ kurzlebig. Sie sollten keine Rolle mehr spielen, wenn die Itemsequenz des BDI-V durch unverwandte Füllitems unterbrochen wird. Wenn eine solche Untersuchung die hohe interne Konsistenz des BDI-V bestätigt, sollte diese zum Anlass genommen werden, die Itemzahl zugunsten einer weiteren Steigerung der Messökonomie zu reduzieren? Wir würden von einer solchen Kürzung abraten, um die Äquivalenz der beiden BDI-Versionen nicht zu gefährden. Außerdem würde eine weitere Kürzung des Instruments im Vergleich zum Gewinn an Ökonomie, der durch die Vereinfachung des BDI-O zum BDI-V erzielt wurde, nur unbedeutend zu Buche schlagen.

(3) Zur weiteren Validierung des BDI-V bietet sich ein Vergleich von BDI-V-Selbsteinschätzungen mit BDI-V-Fremdeinschätzungen an. Angehörigen und Freunden bleiben depressive Symptome in der Regel nicht verborgen. Selbstbericht-Fremdbericht-Korrelationen sollten deshalb eine Höhe erreichen, wie sie für Persönlichkeitsskalen typischerweise gefunden werden (Funder, 1999).

Literaturverzeichnis

Beck, A.T. (1978). The depression inventory. Philadelphia: Center for Cognitive Therapy.

Beck, A.T. & Steer, R.A. (1987). Beck Depression Inventory (BDI). San Antonio: The Psychological Corporation Inc.

Beck, A.T., Steer, R.A. & Garbin, M.G. (1988). Psychometric properties of the Beck Depression Inventory: Twenty-five years of evaluation. Clinical Psychology Review, 8, 77-100.

Duckworth, K. L., Bargh, J. A., Garcia, M., & Chaiken, S. (2002). The automatic evaluation of novel stimuli. Psychological Science, 13, 513-519.

Funder, D. C. (1999). Personality judgment: A realistic approach to person perception. San Diego, CA: Academic Press.

Hautzinger, M., Bailer, M., Worall, H. & Keller, F. (1994). Beck-Depressions-Inventar (BDI). Bern: Huber.

Kammer, D. (1983). Eine Untersuchung der psychometrischen Eigenschaften des deutschen Beck-Depressionsinventars (BDI). Diagnostica, 29, 48-60.

Lukesch, H. (1974). Testkriterien des Depressionsinventars von A.T. Beck. Psychologische Praxis, 18, 60-78.

Mayer, J. D., Gaschke, Y. N., Braverman, D. L., & Evans, T. W. (1992). Mood-congruent judgment is a general effect. Journal of Personality & Social Psychology, 63, 119-132.

Richter, P. (1991). Zur Konstruktvalidität des Beck-Depressionsinventars bei der Erfassung depressiver Verläufe. Regensburg: Roderer.

Richter, P., Werner, J. & Bastine, R. (1994). Psychometrische Eigenschaften des Beck-Depressionsinventars (BDI): Ein Überblick. Zeitschrift für Klinische Psychologie, 23, 3-19.

Röhrle, B. (1988). Fragebogen zur verhaltenstherapeutischen Diagnostik depressiver Störungen. Ein Kompendium. Tübingen: DGVT.

Schmitt, M. & Maes, J. (2000). Vorschlag zur Vereinfachung des Beck-Depressions-Inventars (BDI). Diagnostica, 46, 38-46.

Schmitt, M., Beckmann, M., Dusi, D., Maes, J., Schiller, A. und Schonauer, K. (2003). Messgüte des vereinfachten Beck-Depressions-Inventars (BDI-V). Diagnostica, 49, 147-156.

Schmitt, M., Altstötter-Gleich, C., Hinz, A., Maes, J. & Brähler, E. (2006). Normwerte für das Vereinfachte Beck-Depressions-Inventar (BDI-V) in der Allgemeinbevölkerung. Diagnostica, 52, 51-59.