Mein Plädoyer für die wissenschaftliche Methode

Ich habe eine sehr interessante und durchaus berechtigte Frage unter meinem letzten Youtube-Video erhalten und so eben eine Antwort dazu verfasst, die ich vor allem denen nicht vorenthalten möchte, die sich selten bis gar nicht in Kommentarspalten aufhalten. Außerdem nutze ich meinen Blog bereits seit einiger Zeit nahezu ausschließlich zum Verbreiten meiner Videos und vielleicht gibt es ja den einen oder anderen, der sich auch mal wieder über einen kurzen Text freuen würde. Darum ohne weiteres Vorgeplänkel direkt zur Frage des Kommentators:

Ich habe da mal eine wirklich ernstgemeinte Frage: Meinst Du/meint Ihr, dass Fakten bzw. wissenschaftliche Forschungen objektiv sind?

(Nur noch eine kurze Erläuterung zum Kontext der Frage: In meinem Video ging es unter anderem darum, ob faktenbasierte Argumentationen überhaupt erfolgreich sein können, wenn sich so viele Menschen doch so stark von Emotionen in ihren Entscheidungen beeinflussen lassen.)

Nun zu meiner Antwort:

Ich glaube, dass wir zuerst etwas Grundsätzliches klarstellen müssen: Niemand behauptet, dass wissenschaftliche Forschung oder wissenschaftlich, d.h. empirisch, erhobene Daten zu 100% objektiv sind. Daten müssen immer aufbereitet und interpretiert werden, wodurch persönlicher Bias, d.h. Subjektivität, Einfluss nehmen kann. Auch die Erhebung der Daten selbst kann subjektiven Einflüssen und einem Bias unterliegen, niemand bestreitet das.

Aber gerade weil wir wissen, dass Menschen diese Wahrnehmungs- und Interpretationsfehler besitzen und/oder eine Agenda verfolgen können, ist die wissenschaftliche Methode die derzeitig beste Möglichkeit, um die Realität zu untersuchen und zu beschreiben. Das bedeutet jedoch nicht, dass Wissenschaft unfehlbar ist, ganz im Gegenteil. Die Qualität wissenschaftlicher Untersuchungen hängt davon ab, wie sehr sich der jeweilige Wissenschaftler an die Regeln der wissenschaftlichen Methode hält. Dabei ist es egal, ob es um quantitative oder qualitative Messmethoden geht oder ob jemand statistische Auswertungen vornimmt.

Das Grundproblem lautet: Shit in, shit out. Wenn ich meine Fragestellung oder meine Stichprobe bereits so designe, dass ich nur noch die richtigen Daten erheben muss, um zu meiner bereits vorher festgelegten Konklusion zu gelangen, dann ist die wissenschaftliche Forschung, die ich dafür durchführe, keinen einzigen Cent wert. Ebenso kann ich korrekt erhobene Daten so hinbiegen, dass am Ende das gewünschte Ergebnis herauskommt. Die wissenschaftliche Methode ist ein Werkzeug und es kann korrekt oder falsch verwendet werden.

Im Umkehrschluss bedeutet das jedoch nicht, dass, nur weil es wissenschaftliche Untersuchungen gibt, die ziemlicher Müll sind, automatisch jede andere wissenschaftliche Untersuchung in Verruf gerät. Eine Kuration von guten bzw. korrekt durchgeführten Studien wird ja bereits durch die entsprechenden Wissenschaftsjournals vorgenommen. Jedes gute Journal hat ein Peer-Review-Verfahren in der einen oder anderen Form. Natürlich bestehen auch hier wieder Lücken und Probleme, die ausgenutzt werden können. Letztendlich bleibt immer nur eines: Das kritische Denken.

Studien führen in der Regel detailgenau auf, welche Methoden verwendet wurden. Wie wurden die Daten erhoben? Was für eine Stichprobe wurde verwendet? Mit welchen statistischen Tests wurde gearbeitet? Immer häufiger gibt es auch Zugriff auf die Rohdaten der Studie oder sonstige Informationen (z.B. die sogenannten Supplements), um die Validität selbst beurteilen zu können. Die Aufgabe der Prüfung obliegt also auch immer dem Einzelnen.

Wenn ich einen Artikel über eine Studie lese und ich auch nur den kleinsten Funken an Skepsis verspüre, dann ignoriere ich erst einmal alles was im Artikel steht. Stattdessen schaue ich mir (die hoffentlich korrekt verlinkte) Originalstudie an, lese mir zuerst das Abstract durch, dann die Diskussion und dann, wenn ich immer noch skeptisch bin, schaue ich mir die verwendeten Methoden und die erhobenen Daten/Ergebnisse an. Erst dann treffe ich die Entscheidung, ob ich den Aussagen der Studie Glauben schenken möchte. Ich verwende den Begriff Glaube hier umgangssprachlich, weil es sich in dem Fall eigentlich nicht mehr um eine Form des Glaubens handelt. Es würde nur noch eine weitere Stufe der Gewissheit geben, nämlich dann, wenn ich die Studie selbst durchgeführt hätte. Das ist aber eine vollkommen unrealistische Forderung und daher habe ich auch kein Problem damit, wenn man beim vorherigen Schritt bereits zu einem gefestigten Entschluss kommt und sich auf dieser Basis eine Meinung bildet. Natürlich kostet es Zeit und Arbeit eine solche Prüfung vorzunehmen, daher ist es auch vollkommen verständlich, wenn man sich dieser Aufgabe nicht stellt. Dann empfehle ich jedoch, den besagten Artikel und dessen Aussage wieder aus dem Gedächtnis zu streichen, so als hätte man ihn gar nicht erst gelesen.

Aber jetzt zur guten Nachricht: Die deutliche Mehrheit der veröffentlichen Studien wird korrekt, und vor allem nachprüfbar korrekt, durchgeführt. Man muss also nicht für jede einzelne Studie eine intensive Einzelprüfung vornehmen. Es empfiehlt sich aber grundsätzlich in die Originalstudie hineinzuschauen, wenn einem etwas unklar ist oder man den präsentierten Ergebnissen oder Interpretationen skeptisch gegenübersteht.

Unabhängig von diesen ganzen Einschränkungen bleibt jedoch eine Gewissheit bestehen: Es gibt derzeit keine bessere Methode zur Untersuchung, Erklärung und Beschreibung der Realität, als die wissenschaftliche Methode.

Aus diesem Grund ist eine faktenbasierte Argumentation auf Grundlage wissenschaftlicher Untersuchung unstreitbar einer emotionsbasierten Argumentation überlegen. Zumindest dann, wenn es um den Aspekt der akkuraten und validen Realitätsbeschreibung geht. Dummerweise ist unser Neocortex, und damit unser bewusstes und rationales Ich, eine verhältnismäßig neue Entwicklung. Unsere Amygdala und alle damit zusammenhängenden Emotionsverarbeitungszentren unseres Gehirns sind evolutionär deutlich älter und haben einen starken, unbewussten Einfluss auf unser Handeln und Denken. Darum versagt eine faktenbasierte Argumentation in so manchen Fällen darin zu überzeugen, während eine emotionsbasierte Argumentation die Massen im Sturm erobern kann.

Daraus lässt sich jedoch nicht schließen, dass Fakten und Emotionen gleichwertig wären oder dass es gerechtfertigt ist emotional zu argumentieren. Letzteres stellt nämlich nur ein Manipulationswerkzeug dar, welches unsere inhärenten kognitiven/menschlichen Fehler ausnutzen möchte und mit dem sich der Verwender einen persönlichen Vorteil verschaffen will. Aus diesem Grund ist ein Mittelweg zwischen Fakten und Emotionen auch nicht automatisch eine korrekte Vorgehensweise. Emotionen sind Teil unseres menschlichen Wesens und müssen als solche akzeptiert werden. Sie sind aber keine Rechtfertigung oder ein Beleg für eine Behauptung über die wahrnehmbare Realität. Niemals.

Advertisements

Laut und dämlich – No Hate Speech.de

Hate Speech (dt. Hassrede). Dieser Begriff geistert bereits seit einigen Jahren durch die angloamerikanische Online- und Offlinesphäre. Bezeichnet wird damit oft ein Spektrum verschiedenartiger, als grenzüberschreitend wahrgenommener, verbaler Äußerungen. Die Breite dieses Spektrums reicht von gezielten Belästigungen von Einzelpersonen, bis hin zum Trollen (über dessen „Gefahr“ sich sicherlich ausgiebig streiten lässt) und vollkommen legitimer, aber unerwünschter Kritik. Auffallend hierbei: Auf eine eindeutige Definition wird (vermutlich bewusst) verzichtet. Ein nicht zu vernachlässigender Punkt, denn schließlich kann der Vorwurf der Verwendung von Hate Speech im schlimmsten Fall vor Gericht enden.

Und wie fast jeder neue, hippe „Trend“ schwappt natürlich auch die No Hate Speech-Bewegung über den großen Teich nach Europa. Die Akteure innerhalb dieser Bewegung haben jedoch den Vorteil, dass sie aus den Fehlern ihrer amerikanischen Kollegen und Kolleginnen lernen können. Denn während sich in den USA ein massiver Widerstand gegen diese offen zur Schau gestellte Bevormundung bilden konnte, verläuft der Prozess in Deutschland und anderen europäischen Staaten deutlich subtiler. Anstatt öffentlich auf die Barrikaden zu gehen und laut mit dem digitalen oder analogen Megaphon die eigene Überzeugung und den Wunsch für eine Schere im Kopf herauszuposaunen, wird hierzulande der Weg über die staatlichen Institutionen gegangen. Natürlich inklusive staatlicher Förderung und Fürsprache durch das Bundesministerium für Familie, Senioren, Frauen und Jugend.

No Hate Speech Movement nennt sich also reichlich unkreativ der deutsche/europäische Ableger dieser Kampagne für eine „saubere Sprache“ im Netz. Wie schon erwähnt finden sich beunruhigend viele Förderer für diese Kampagne auf der Webseite von No Hate Speech.de:

1

Bei dieser „starken“ Unterstützung sollte man doch zumindest erwarten können, dass man einen konkreten Plan dafür hat, was man denn eigentlich mit einer solchen Kampagne erreichen möchte. Startpunkt dafür wäre, dass man zuerst einmal klar definiert, was denn eigentlich Hate Speech ist und anschließend belegt, dass diese negative Auswirkungen besitzt und in einer so signifikanten Häufigkeit vorkommt, dass damit eine Aufklärungs- und Präventionskampagne gerechtfertigt ist.

Beginnen wir ganz vorne: Was ist eigentlich Hate Speech bzw. wie ist diese definiert? No Hate Speech hat dafür folgende Erklärung parat:

Definitionen von Hate Speech

Es gibt keine einheitliche Definition von Hate Speech, weder in Deutschland noch international. Im Gesetzbuch wird Hate Speech (noch) nicht spezifisch erwähnt – verurteilt werden Beleidigungen oder Volksverhetzung. Das heißt aber im Umkehrschluss nicht, dass online haten erlaubt ist…, falls jemand auf die Idee käme.

Oh. Keine einheitliche Definition also. Na das kann ja heiter werden.

Es folgen zwei Verweise. Zum einen auf die Definition von Hate Speech durch den Europarat, welche breiter und schwammiger nicht sein könnte:

Hate speech for the purpose of the Recommendation entails the use of one or more particular forms of expression –namely, the advocacy, promotion or incitement  of  the  denigration,  hatred  or  vilification  of  a  person  or  group  of persons, as well    any harassment, insult, negative stereotyping, stigmatization or threat of such person or persons and any justification of all these  forms of  expression –that  is  based  on  a  non-exhaustive  list  of personal  characteristics  or  status  that  includes  “race”,  colour,  language, religion  or  belief,  nationality  or  national  or  ethnic  origin,  as  well  as  descent, age, disability, sex, gender, gender identity and sexual orientation.

Also quasi alles was in irgendeiner Weise negativ oder als beleidigend aufgefasst werden könnte.

Zum anderen folgt ein Verweis auf die Amadeu Antonio Stiftung. Diese versucht den Begriff Hate Speech aus „politischer und sprachwissenschaftlicher Sicht zu beschreiben“ sowie die „rechtliche Einordnung des Begriffs Hate Speech zu erklären“. Wer sich diese „Versuche“ antun möchte, der kann diese hier und hier nachlesen. Anstatt jedoch eine klare Definition für Hate Speech zu liefern, werden hier nur noch mehr Variablen in die Bewertung von sprachlichen Äußerungen integriert. So ist es z.B. vermeintlich relevant, ob die Äußerungen von privilegierten oder nicht-privilegierten Personen stammen:

Was Hate Speech ist, ist umstritten

Dass es innerhalb einer Sprachgemeinschaft unterschiedliche Meinungen darüber geben kann, ob ein bestimmter Ausdruck als Hassrede gilt oder nicht, ist selbst dort nicht überraschend, wo alle Beteiligten aufrichtig Position beziehen: Mitglieder einer privilegierten Gruppe empfinden einen sprachlichen Ausdruck häufig deshalb nicht als herabwürdigend/ verunglimpfend, weil er sich nicht gegen sie, sondern eben gegen eine (möglicherweise sogar unbewusst) als von der angenommenen Norm abweichende Gruppe richtet. […]

Inwieweit die „Privilegien“ einer Person bestimmt werden können und inwiefern diese in einem anonymen Online-Meinungsaustausch überhaupt von den Beteiligten erkannt werden können, bleibt natürlich offen.

Wir können also feststellen: Eine Definition von Hate Speech findet bisher nicht statt. Damit wird eigentlich auch alles weitere obsolet, aber lassen wir uns doch den Spaß nicht nehmen und schauen uns einmal die „Daten“ an, mit denen No Hate Speech zeigen möchte, dass Hassrede ein gesamtgesellschaftliches Problem darstellt gegen das Stellung bezogen werden muss.

Wie groß ist das Problem eigentlich?

Es ist schwierig, das genau zu sagen. Denn Hate Speech hat viele verschiedene Facetten und nicht alles kann dokumentiert werden. Drei ausgewählte Beispiele zeigen, wie häufig Hasskommentare sind und wer davon betroffen ist.

2015 hat der Europarat (Abteilung Jugend) eine Online-Meinungsumfrage gemacht: 83% der Befragten gaben an, dass sie online Erfahrungen mit Hate Speech gemacht haben. LGBTI-Jugendliche, Muslim*innen und Frauen waren die drei Haupt-Zielgruppen der Hasskommentare.

Rechtsextreme nutzen das Internet und Soziale Medien, um ihre Propaganda zu verbreiten und Anhänger*innen für ihre Ideologie zu gewinnen. Jugendschutz.net beobachtet diese Strategie und veröffentlicht die Ergebnisse jährlich im Bericht „Rechtsextremismus online“.

Die britische Zeitung The Guardian hat 70 Millionen Kommentare untersuchen lassen, die seit 2006 auf ihrer Website hinterlassen wurden. Das Ergebnis: Von den zehn am stärksten von Hate Speech betroffenen Autor*innen waren acht Frauen und nur zwei Männer, sie sind beide schwarz.

Erneutes Abwiegeln. Man kann das ja alles nicht so genau sagen. Dann folgen drei Beispiele, die jedoch nicht das intendierte Ergebnis zur Folge haben, sondern eher die Frage in den Raum stellen, ob man denn nichts Handfestes zum Vorzeigen hat.

Auf das Thema „Rechtsextreme“ möchte ich nicht weiter eingehen, da es hier meiner Meinung nach vollkommen gerechtfertigt ist eine Beobachtung potenzieller, volksverhetzender Aussagen vorzunehmen und diese an die entsprechenden staatlichen Organe weiterzuleiten. Warum hier jedoch „Rechtsextreme“ Äußerungen mit anderen unerwünschten Aussagen unter dem Schirm der Hate Speech zusammengefasst und gleichgesetzt werden, bleibt unklar, lässt aber tief blicken.

Auf die „Untersuchung“ des Guardian  möchte ich ebenfalls nur kurz eingehen: Die Methodik, mit der die 70 Millionen Kommentare ausgewertet wurden, ist grundsätzlich fehlerhaft. Das lässt sich aus folgendem Zitat aus der Methodenerklärung des Guardian zur Untersuchung entnehmen:

In our analysis we took blocked comments as an indicator of abuse and/or disruption. Although mistakes sometimes happen in decisions to block or not block, we felt the data set was large enough to give us confidence in the findings.

Wie unter anderem vielfach in den Kommentaren unterhalb des Artikels erwähnt wird, ist diese Form der Datenerhebung unzulässig, da die Moderatoren keinen objektiven Blockkriterien folgten, sondern „aus dem Bauch heraus“ entschieden, ob ein Kommentar zulässig oder unzulässig ist. Zusätzlich gibt es unzählige Beschwerden darüber, dass Kommentare geblockt wurden, die in keiner Weise „abusive“ oder „disruptive“ waren und ausschließlich legitime Kritik enthielten. Für einen potenziellen Bias der Moderatoren wurde also nicht kontrolliert und aus diesem Grund ist auch die gewaltige Datengrundlage von 70 Millionen Kommentaren unbrauchbar.

Kommen wir also zur Online-Meinungsumfrage des Europarats: Was hier zusammengetragen wird kann man eigentlich nur als einen schlechten Witz bezeichnen. Zum einen sind online durchgeführte Umfragen in der Mehrheit der Fälle als qualitativ sehr schlecht einzuschätzen, da keine Kontrolle darüber existiert ob die Befragten auch wirklich nur einmal teilgenommen haben und ob die Antworten der Teilnehmer überhaupt als authentisch eingeschätzt werden können. Zum anderen haben Online-Umfragen noch stärker mit dem sogenannten Selbstselektions-Bias zu kämpfen, als z.B. Telefonumfragen oder persönliche Gespräche mit einem Interviewer. Es gibt keine Kontrolle darüber, wer  überhaupt an der Umfrage teilnimmt und somit kann die Stichprobe nicht als Zufallsstichprobe angesehen werden. Dass die Auswahl der Stichprobe zufällig erfolgt, ist aber eines der wichtigsten Gütekriterien bei der Einschätzung darüber, ob es sich um eine repräsentative Umfrage handelt. Ein kurzer Blick auf die deskriptiven Daten der Stichprobe zeigt: Junge (d.h. unter 30 Jahren), weibliche Studenten sind massiv überrepräsentiert.

8

7

(Ich entschuldige mich für die schlechte Qualität der Abbildungen. Leider gibt die Quelle nicht mehr her.)

Die Daten sind also als nicht-repräsentativ für die Gesamtbevölkerung einzuschätzen und die Aussagekraft der Umfrage sinkt somit gegen Null. Witzig jedoch: Auf die Frage, ob die Teilnehmer der Umfrage sich durch Online Hate Speech jemals bedroht oder angegriffen/beleidigt gefühlt haben, antwortet die Mehrheit (63,5%) mit „Nein“.

Im Zusammenhang mit dieser Umfrage möchte ich auch noch auf den Blogartikel von stefanolix verweisen, der sich mit einer ähnlichen Umfrage aus dem Jahr 2012 beschäftigt hat und vergleichbare Probleme bei der Stichprobe findet.

Der Berg voller Bullshit wächst und wächst, und hier noch tiefer zu graben würde vermutlich einem kompletten Verfall zum Wahn gleichkommen. Aber es ist wie ein Motorradunfall: Man kann nicht wegschauen, so sehr man es auch möchte. Weiter geht es also auf der Webseite von No Hate Speech:

Was ist Cybermobbing?

Cybermobbing findet nicht auf dem Schulhof, sondern im Internet statt. Allerdings sind die Opfer nicht nur Schüler*innen, sondern ganz allgemein gesagt: User*innen, die über längere Zeit belästigt, beleidigt, bedroht oder bloßgestellt werden. Wer von Cybermobbing betroffen ist oder mitbekommt, dass jemand gemobbt wird, kann sich wehren oder Betroffene unterstützen. Der „klicksafe-Tipp“ erklärt Schritt für Schritt wie.

Das „Bündnis gegen Cybermobbing“ hat in einer Studie herausgefunden, dass mittlerweile immer mehr Erwachsene im Netz gemobbt werden, meistens übrigens Frauen.

Aus unerklärlichen Gründen führt man auf dem Abschnitt „Wissen“ der No Hate Speech Webseite zusätzlich auch noch den Begriff des Cybermobbing ein. Inwieweit ein Zusammenhang zwischen Online Hate Speech und Cybermobbing besteht, bleibt jedoch ebenfalls unklar. Aber netterweise wird auf eine Studie des „Bündnis gegen Cybermobbing“ verwiesen, mit dem Zusatz, dass eines der Ergebnisse dieser Studie besagt, dass immer mehr erwachsene Frauen im Netz gemobbt werden, d.h. von Cybermobbing betroffen sind. Schauen wir uns dafür doch einmal Abbildung 5 aus der besagten Studie an:

3

Interessant ist hier vor allem, dass sich die Studie nicht nur mit Cybermobbing befasst, sondern auch gleichzeitig Daten über das Vorkommen von Mobbing erhebt. Die relativen Anteile der Betroffenen geben bereits erste Hinweise darauf, was die Gründe dafür sein könnten. War den Autoren bereits vorher klar, dass nur ein extrem geringer Anteil der Befragten überhaupt von Cybermobbing betroffen ist?

Aber zurück zu den Daten: 7,6% der männlichen Befragten und 8,3% der weiblichen Befragten sind betroffen. Eine Frage die sich mir hier sofort stellt ist: Haben die Autoren der Studie schon einmal etwas von Inferenzstatistik gehört? Warum wird hier nicht einmal der Versuch unternommen mit statistischen Messverfahren zu untersuchen, ob die Unterschiede zwischen den beiden Gruppen (Männer vs. Frauen) nicht nur zufällig durch die Wahl der Stichprobe entstanden sind? Vielleicht wenigstens einmal einen t-Test anwenden? Das wäre wohl zu viel verlangt.

No Hate Speech zieht also die Frauenkarte, obwohl diese Aussage nicht von den Daten der Studie gestützt wird. Ganz im Gegenteil: Die Verteilung der „Rollen“ ist zwischen den Geschlechtern sogar sehr ausgeglichen.

Gehen wir aber noch einmal einen weiteren Schritt zurück an den Anfang der Studie, dort wo wir auf die Wurzel allen Übels stoßen. Die Stichprobe ist (mal wieder) kompletter Murks:

Die  vorliegende  Studie  wurde  als  standardisierte  Onlinebefragung  konzipiert. Die  Erhebung erfolgte  in  der  Zeit  vom  11.  bis  24.  November  2013.  Die Grundgesamtheit  umfasste  alle Personen  in  der  Bundesrepublik  Deutschland,  die 18  Jahre  oder  älter  waren.  An  der  Erhebung beteiligten  sich  brutto 8.915 Personen.  Diese  Stichprobe  wurde  um  nicht  vollständig ausgefüllte Fragebögen und  nicht  plausible  Datensätze  bereinigt,  so  dass  sich  eine  Netto-Stichprobe  von 6.296 Fällen  ergibt.

Die  Stichprobe  verteilt  sich  fast  analog  zur  tatsächlichen  Bevölkerungsverteilung  auf  die  16 Bundesländer  bzw.  Stadtstaaten  (vgl.  Abb.  1). […] Die  Stichprobe  kann  daher  als  spezifisch  repräsentativ  bezeichnet  werden.  Die  Hälfte  der Stichprobe  weist  den  beruflichen  Status  eines  Angestellten  auf,  die  nächstgrößte  Gruppe sind Schüler, Studenten oder Personen in der Ausbildung (13%).

[Hervorhebung nicht im Original]

Die Stichprobe ist also spezifisch repräsentativ, weil die Verteilung der Stichprobe fast der tatsächlichen Bevölkerungsverteilung auf die Bundesländer gleicht? Da die Autoren nicht wirklich viel über die Verteilung des Vorkommens von Mobbing und Cybermobbing wissen können, muss eine Zufallsstichprobe gezogen werden um Repräsentativität zu gewährleisten. Der Verweis auf eine merkmalsspezifische Repräsentativität der Stichprobe ist nichts weiter als ein sprachlicher Trick um den Anschein einer höher-qualitativen Stichprobe zu erzeugen. Die Autoren konnten weder dafür kontrollieren, dass die Angaben der Befragten korrekt sind, noch ob es einen Selbstselektions-Bias gab. Studenten und Auszubildende sind erneut deutlich überrepräsentiert, während Arbeiter und Selbstständige deutlich unterrepräsentiert sind.

Gleiches gilt für die Altersverteilung und die Geschlechterverteilung:

4

In der Stichprobe sind junge Frauen deutlich überrepräsentiert. Insgesamt lässt sich also der verwendeten Stichprobe keine Repräsentativität attestieren.

Es wird auch langsam klar warum eine Vermengung der zwei Begrifflichkeiten Mobbing und Cybermobbing vorgenommen wurde. Die Autoren schreiben in ihrem Fazit:

Die Ergebnisse sind erschreckend: Fast 30% geben an, schon einmal in irgendeiner Form Opfer von Mobbing oder Cybermobbing geworden zu sein.

Offenbar entsprachen die Daten über Cybermobbing nicht den Vorstellungen der Autoren. Hier musste also nachgeholfen werden, um die Gefährlichkeit und die Häufigkeit des Cybermobbing künstlich aufzublähen. Schließlich klingen 8% nicht ganz so eindrucksvoll wie 30%. Eine Taktik, die ich auf meinem Blog nicht zum ersten Mal aufgedeckt habe.

Fazit: Alles was nötig wäre um die Kampagne von No Hate Speech zu rechtfertigen fällt also bereits am Startblock flach auf den Boden. Weder wird der Begriff Hate Speech klar definiert, noch werden aussagekräftige, empirische Daten vorgebracht, welche die Gefährlichkeit und Häufigkeit von Hate Speech belegen könnten. Im Fall der Studie über Cybermobbing muss der Sachverhalt des Mobbing herangezogen werden, um das Vorkommen des Cybermobbing nach oben zu schrauben. Letztendlich versucht man sich mit dem Verweis auf scheinbar wissenschaftliche Studien selbst den Anschein von Wissenschaftlichkeit und Legitimation zu verleihen. Dieses Vorgehen ist unlauter und beschämend für die Verantwortlichen von No Hate Speech; und noch mehr für die staatlichen Förderer. Was diese aber vermutlich nicht sonderlich stört und damit den verabscheuungswürdigen Hintergrund der Kampagne No Hate Speech noch deutlicher offenbart.

Addendum: Christian Schmidt und Lucas Schoppe haben sich ebenfalls der No Hate Speech Kampagne gewidmet. Klare Leseempfehlung!

Worte = Taten (oder auch „Traue keiner Definition, die du nicht selbst verdreht hast.“)

Der Begriff der „Hassrede“ (engl. hate speech) ist derzeit vor allem in deutschen Medien sehr präsent. Nachdem erst vor kurzem das BKA deutschlandweit 60 Hausdurchsuchungen im Zusammenhang mit sogenannten „Hasskommentaren“ (oder auch „Verbalradikalismus“) durchgeführt hat, Justizminister Heiko Mass Facebook dazu zwingen möchte nicht genehme Kommentare zu löschen und die Amadeu Antonio Stiftung an den Grundlagen für eine Stasi 2.0 arbeitet, stellt sich mir die Frage, woher dieser Begriff hate speech eigentlich kommt und was die Wissenschaft dazu zusagen hat. Die Bezeichnung „Wissenschaft“ verwende ich hier (wie leider so oft) als eine sehr vorsichtige Umschreibung dessen, was einem beim Blick in folgendes Paper erwartet:

Heterosexuals‘ Attitudes Toward Hate Crimes and Hate Speech Against Gays and Lesbians

Modern racism and sexism have been studied to examine the different ways that prejudice can be expressed; yet, little attention has been given to modern heterosexism. This study examined the extent to which modern heterosexism and old-fashioned heterosexism predict acceptance of hate crimes against gays and lesbians and perceptions of hate speech. Male (n= 74) and female (n= 95) heterosexual college students completed a survey consisting of scales that assessed modern and old-fashioned heterosexism, acceptance of violence against gays and lesbians, attitudes toward the harm of hate speech and its offensiveness, and the importance of freedom of speech. Results indicated strong negative relations between both modern and old-fashioned heterosexism and the perceived harm of hate speech. When old-fashioned heterosexism, modern heterosexism, and the importance of freedom of speech were combined to predict hate crime and hate speech attitudes, only old-fashioned heterosexism predicted acceptance of hate crimes. All three predictors contributed to the perception of the harm of hate speech. Gender differences in the role of the importance of freedom of speech in predicting attitudes toward hate crimes and hate speech are noted.

Um kurz zusammenzufassen: Die Autoren postulieren eine Unterscheidung von Heterosexismus (d.h. Sexismus von heterosexuellen Menschen gegenüber homosexuellen Menschen) in einen „altmodischen“ bzw. „traditionellen“ Heterosexismus und einen modernen Heterosexismus.

Diese beiden Begriffe unterscheiden sich, laut den Autoren, wie folgt:

  • Traditioneller Heterosexismus ist eine direkte und öffentliche Zurschaustellung von Meinungen, die eine Ablehnung von Homosexualität und homosexuellen Menschen ausdrücken.
  • Moderner Heterosexismus ist im Gegensatz dazu keine eindeutige und öffentliche Zurschaustellung ablehnender Meinungen, sondern drückt sich in der Befürwortung und Unterstützung von politischen Maßnahmen aus, welche in der Benachteiligung von Minderheiten resultieren.

Hier noch einmal im Wortlaut der Studie:

Old-fashioned heterosexism, or overt sexual prejudice, is a clear expression of negative attitudes toward and  dislike of  gays  and  lesbians,  whereas  modern  heterosexism is  amore subtle type of heterosexism. […]
Old-fashioned heterosexism, like old fashioned racism and sexism may be evolving into a modern form, referred to as symbolic racism (Sears, 1988) or modern racism (McConahay, 1986). Modern racists do not directly express dislike of people of color, and they do not affirm beliefs in the inferiority of minority groups. However, they do support policies that result in disadvantages for minority groups (e.g., elimination of affirmative action, busing). Often, such policies are defended in the guise of support of traditional values. Thus, modern racism is a subtle, indirect way of opposing a group.

Die Autoren möchten nun mit Hilfe mehrerer Befragungen von Studenten (Stichprobe: n = 171; 74 männlich, 95 weiblich; 2 keine Angabe; Durchschnittsalter = 26,72 Jahre) herausfinden, ob ein höherer Wert in der Skala „traditioneller Heterosexismus“ mit einer höheren Akzeptanz von hate crimes und hate speech einhergeht. Parallel dazu erwarten die Autoren, dass ein höherer Wert in der Skala „moderner Heterosexismus“ zwar mit einer höheren Akzeptanz von hate speech, aber nicht von hate crimes einhergeht.

Zusätzlich erfassen die Autoren noch, wie wichtig den Probanden die Meinungsfreiheit ist. Eine höhere Wertschätzung der Meinungsfreiheit soll, laut den Autoren, ebenfalls mit einer höheren Akzeptanz von hate speech einhergehen. In einem finalen Test wurden den Probanden 3 fiktive Szenarien in Textform vorgelegt in welchen Beispiele von hate speech dargestellt wurden. Die Probanden sollen dann bewerten wie beleidigend bzw. gefährlich sie die Szenarien empfinden.

Nach der etwas langen und trockenen Einleitung kommen wir jetzt zum interessanten Part, nämlich den Definitionen von hate crimes und hate speech, welche die Autoren als Grundlage für ihre Studie nehmen:

A hate crime is a criminal act in which the victim was targeted because of the actual or perceived race, color, religion, national origin, ethnicity, gender, disability, or sexual orientation. This may include, but is not limited to, threatening phone calls, hate mail, physical assaults, vandalism,  fires,  and  bombings. […]

In contrast to hate crimes, hate speech is a generic term that has come to embrace the use of speech attacks based on race, ethnicity, religion, and sexual orientation or preference. The expression of hate is not a crime in and of itself. The differences between hate crimes and hate speech  rests  on  the  distinction  between  acts  and  symbols  or  words. Acts, such as assault, battery, vandalism, arson, murder, lynching, and physical harassment, are punishable under our criminal and civil laws. Words, like kike, faggot, nigger, spic, pictures–such as those in pornography depicting women as degraded or abused for sexual pleasure–and symbols are protected by courts as acts of individual expression.

Die Autoren ziehen hier also eine klare Grenze zwischen Handlungen (d.h. hate crimes) und Sprache (d.h. hate speech). Es ist natürlich grundsätzlich schwierig, wenn man sich auf einen theoretischen Bezugsrahmen stützt, zu dem leider am Ende die erhobenen Daten nicht passen.

Aber ich greife voraus. Bevor wir zum überwältigenden Doppeldenk der Autoren in der Interpretation der Daten kommen, müssen wir uns zuerst anschauen, was die fünf Damen denn so herausgefunden haben:

Table1

Die deskriptive Statistik ist schnell erklärt. Die gesamte Stichprobe pendelte sich bei 5 der 7 Variablen in der Mitte der Skalen ein. Nur bei „Offensivesness“ und „Harmfulness“ der 3 Szenarien war die gesamte Stichprobe näher am Maximum der Skalen, d.h. die Probanden schätzten die Szenarien als sehr beleidigend und gefährlich ein.

Zwischen den Geschlechtern gab es ebenfalls Unterschiede. Männer tendierten zu höheren Werten bei den ersten 5 Variablen und zu geringeren Werten bei „Offensiveness“ und „Harmfulness“ der Szenarien. Bei den Frauen war es genau umgekehrt.

Um die Zusammenhänge zwischen den Variablen zu analysieren, haben die Autoren anschließend die Interkorrelationen zwischen den Variablen berechnet und Regressionsanalysen durchgeführt.

Da ich die starke Vermutung habe, dass sich die Daten vermutlich sowieso niemand im Detail anschauen wird, hier nur der Vollständigkeit halber:

Table2

Table3Was soll uns das jetzt also alles sagen? Die Autoren beschreiben das selbst in der  Diskussion ihrer Studie so:

When old-fashioned and modern heterosexism were combined with importance of freedom of speech to predict approval of hate crimes and the harm of hate speech, a different pattern emerged. Controlling for old-fashioned heterosexism, modern heterosexism did not contribute a unique effect for approval of hate crimes or responses to the scenarios. Thus, though modern heterosexism predicted both ap- proval of hate crimes and minimization of the harm and offensiveness of hate speech as described in explicit scenarios, these relations are attributable to modern   heterosexism’s overlap with old-fashioned heterosexism. However, modern heterosexism did sustain an independent contribution to the perceived harm of hate speech.

Die anfängliche Einteilung in traditionellen und modernen Heterosexismus geht also voll nach hinten los. Diese beiden Formen des Sexismus treten nicht parallel auf. Stattdessen besteht eine große Überlappung zwischen modernem und traditionellem Heterosexismus. Personen die modernen Heterosexismus zeigen, zeigen also auch traditionellen Heterosexismus. Es liegt die Vermutung nahe, dass Sexisten ihren Sexismus in der heutigen Zeit einfach besser tarnen, anstatt dass es eine neue Form des unterschwelligen Sexismus gibt, der jetzt von einer breiten Öffentlichkeit geteilt wird.

Aber anstatt dass die Autoren anerkennen, dass die Prämissen ihrer Studie Fehler aufweisen, beginnen sie jetzt damit sich ihre Ergebnisse schön zu reden.

The question arises as to why modern heterosexism predicted the perceived harm of hate speech more strongly than the offensiveness and harmfulness of the speech in the scenarios, as demonstrated by the independent effect of modern heterosexism in the regressions on harm of hate speech but not on responses to the scenarios. Because the scenarios are specific and strong instances of hate speech (and instances that have actually been reported), modern heterosexism may contribute to hate speech only when the issue is phrased in the abstract. When the egregious behavior is explicitly described, it may only be the more overt type of heterosexism that becomes engaged in responses to hate speech. However, it is not that the participants regarded the speech as hate crimes because freedom of speech predicted responses to the harm of hate speech and the responses of the scenarios and did not predict approval of hate crimes. (Hervorhebung nicht im Original)

Ah ja. Moderner Heterosexismus offenbart sich also nur dann, wenn hate speech in einer abstrakten Form(?) und nicht in einem realen Szenario dargeboten wird. Völlig nachvollziehbar.

Does this mean that modern heterosexism is innocuous because it is only related to the perceived harm of hate speech abstractly stated and not to responses to the scenarios and approval of hate crimes? No, and for several reasons. First, there was a strong intercorrelation between old-fashioned and modern heterosexism. When modern heterosexism is expressed it is possible that it has become old-fashioned heterosexism or sexual prejudice gone underground. Secondly, speech and acts are inseparable and the line between speech and acts is arbitrarily drawn. […] (Hervorhebung nicht im Original)

Was. Zur. Hölle. Die Grenze zwischen Sprache und Handlungen ist willkürlich?

Wie war das doch gleich am Beginn der Studie?

The differences between hate crimes and hate speech rests on the distinction between acts and symbols or words.

Jetzt wird vor allem eine Sache glasklar: Für die Autoren gibt es keinen Unterschied zwischen Worten und Taten. Ein verbaler „Angriff“ ist gleichbedeutend mit einem physischen Angriff. Den fünf Damen schmeckt es daher offensichtlich überhaupt nicht, dass es in den USA einen sehr starken Schutz der Meinungsfreiheit gibt und hier würde man sich vermutlich am liebsten eine Änderung des First Amendments der Verfassung der Vereinigten Staaten wünschen.

Dabei erkennen die Autoren am Ende sogar an, dass das Wertschätzen der Freedom of Speech keinen Zusammenhang mit der Akzeptanz von hate speech hat.

However, freedom of speech was not the mechanism by which modern heterosexists justified tolerance of hate speech of gays and lesbians. Freedom of speech was an independent predictor and controlling for freedom of speech did not reduce the effect of modern heterosexism on the harm of hate speech.

Erneut zeigt sich, dass Schlagworte wie hate speech auf einem sehr wackeligen, „akademischen“ Fundament gebaut sind. Wenn es den Autoren nicht passt, dann wird einfach die Definition von hate speech angezweifelt und umgedeutet, um dann die erhobenen empirischen Daten ins rechte Licht zu rücken.

Schlimmer ist jedoch, dass aus jeder geschriebenen Zeile die Unzufriedenheit darüber trieft, dass Worte und Taten nicht einfach mal eben gleichgesetzt werden können. Wenn das die Attitüde ist, aus der sich auch die aktuellen Bestrebungen in Deutschland und Europa speisen, dann können wir uns ja für die kommenden Wochen und Monate schon einmal warm anziehen. #amadeuantoniofilme

Doktorant empfiehlt: Einführung in das kritische Denken

Als Addendum für meinen Artikel über das kritische Denken möchte ich heute eine Videoreihe vorstellen, die das Konzept ausführlich darstellt. Viel Spaß!

Kritisches Denken 101: Induktion und Deduktion

Die tagtägliche Konfrontation mit Artikeln und Kolumnen, welche nicht einmal die Mindeststandards der Logik und Vernunft erreichen – sei es von professionellen Journalisten oder Amateuren, die in ihrer Freizeit bloggen – lässt mich immer wieder ratlos zurück. Oftmals kann ich einen Text nicht mehr lesen ohne dabei innerlich die begangenen logischen und/oder argumentativen Fehlschlüsse mitzuzählen.

Zwei Fragen kommen mir dabei immer wieder in den Sinn: Fehlt den Autoren dieser Artikel die kritische Denkfähigkeit? Oder wird bewusst auf eine korrekte Argumentationsführung verzichtet, wenn es der eigenen Narrative nicht zuträglich ist?

Sollte letzteres zutreffen, lässt sich daran vermutlich nicht viel ändern. Außer die eigene Skepsis zu schärfen, versteht sich. In Anbetracht der ersten Möglichkeit möchte ich hier eine kurze Grundlage für die Anwendung des kritischen Denkens darlegen und mich dabei konkret auf die Schlussverfahren der Induktion und Deduktion beziehen.

Doch bevor wir dazu kommen: Was ist kritisches Denken?

Eine längere Definition findet sich hier. Kurz zusammengefasst beschreibt kritisches Denken die Orientierung und Ausrichtung des eigenen Denkens nach den methodischen Kriterien der Wissenschaft. Sich mit den Kriterien der Wahrheitsfindung, wie sie in der Wissenschaft angewendet werden, auseinanderzusetzen, ist vor allem für Laien eine große Hilfe bei der Beurteilung von Behauptungen und dem Erkennen von Scheinargumenten. Zusätzlich ist die Fähigkeit des kritischen Denkens ein wichtiger Schritt auf dem Weg zum mündigen Bürger.

Man muss aber nicht reihenweise Bücher oder wissenschaftliche Publikationen wälzen, um den Prozess der kritischen Denkfähigkeit anwenden zu können. Stattdessen reicht es, sich mit ein paar der Grundprinzipien vertraut zu machen. Eines davon sind die beiden Schlussverfahren der Induktion und Deduktion.

Eine Erklärung beider Begriffe: Bei der Induktion schließen wir vom Einzelnen auf das Allgemeine. Konkret bedeutet das, dass man aus einzelnen, empirischen Beobachtungen auf eine allgemeine Theorie oder eine Gesetzmäßigkeit schließt. Wir nehmen also eine Verallgemeinerung vor bei der nur eine gewisse Wahrscheinlichkeit besteht, dass sie korrekt ist (siehe auch probabilistisches Schließen). Die vorgebrachten Prämissen müssen also nicht zwangsläufig in einer korrekten Konklusion resultieren. Durch Induktion erlangte Theorien oder Gesetzmäßigkeiten sind dennoch ein erster wichtiger Schritt bei der Wahrheitsfindung.

Ein Beispiel, welches gerne für die Illustration des induktiven Schlussverfahrens verwendet wird:

Prämisse = Alle bisher beobachteten Vögel können fliegen. [Empirische Einzelbeobachtungen]

Konklusion = Alle Vögel können fliegen. [Aufgestellte Gesetzmäßigkeit]

Solange wir keinen Vogel finden der nicht fliegen kann, ist diese Argumentation korrekt. Und je mehr flugfähige Vögel wir bisher gefunden haben, desto wahrscheinlicher ist es, dass unsere Verallgemeinerung ebenfalls korrekt ist.

Es wäre aber ein Fehler an dieser Stelle mit der Wahrheitsfindung aufzuhören. Daher muss im nächsten Schritt die Deduktion erfolgen: Bei der Deduktion schließen wir vom Allgemeinen auf das Einzelne. Eine zuvor aufgestellte allgemeine Theorie oder Gesetzmäßigkeit muss überprüft werden, in dem die Vorhersagekraft dieser Theorie genutzt wird um eine Prognose aufzustellen. Anschließend kann man eine aufgestellte Gesetzmäßigkeit bzw. Verallgemeinerung mit einzelnen, empirischen Beobachtungen entweder validieren oder falsifizieren. Ein wichtiger Unterschied zur Induktion besteht darin, dass es bei der Deduktion keine Wahrscheinlichkeit dafür gibt, ob eine Konklusion korrekt ist oder nicht. Wenn die Prämissen korrekt sind, dann muss zwangsläufig auch die Konklusion korrekt sein, und vice versa.

Um mit unserem Beispiel fortzufahren:

Prämisse = Alle Vögel können fliegen. [Aufgestellte Gesetzmäßigkeit]

Konklusion/Prognose = Der Strauß ist ein Vogel und kann daher fliegen.

Empirische Einzelbeobachtung: Der Strauß kann nicht fliegen.

Durch die empirische Beobachtung stellen wir fest, dass der Strauß zwar ein Vogel ist, aber nicht fliegen kann. Die aus der Prämisse abgeleitete Konklusion ist daher nicht korrekt, wodurch automatisch auch die zuvor aufgestellte Gesetzmäßigkeit nicht korrekt ist und verworfen werden muss. Auf Basis der neuen empirischen Daten können wir jetzt wieder mit der Induktion beginnen und eine neue Gesetzmäßigkeit aufstellen, die dann wiederum geprüft werden muss. Wäre der Strauß ein flugfähiger Vogel, so hätte diese Einzelbeobachtung unsere Gesetzmäßigkeit verifiziert. Wichtig hierbei jedoch: Eine Theorie oder ein Gesetz kann niemals abschließend als wahr befunden werden, da in der Praxis nicht jede mögliche Einzelbeobachtung vorgenommen werden kann. Es kann nur mit jeder Verifikation oder ausbleibenden Falsifikation eine stärkere Annäherung an die Wahrheit erreicht werden.

Hier noch einmal eine Abbildung der beiden Schlussverfahren und ihrer Anwendung:

DeduktionInduktion

Das Grundprinzip von Induktion und Deduktion ist einfach zu verstehen, so lange die gewählten Prämissen und Konklusionen simpel und offensichtlich sind. Wie alles im Leben, sind aber die präsentierten Prämissen und Konklusionen in der Praxis selten einfach, sondern in den meisten Fällen komplex und zusätzlich mit weiteren Prämissen und Konklusionen verschachtelt.

Ein grundsätzliches Problem, welches mir regelmäßig auffällt, ist, dass die Vertreter der am Anfang dieses Textes erwähnten Artikel und Kolumnen nur das induktive Schlussverfahren anwenden und dann aufhören. Einzelbeobachtungen werden aufgezählt und am Ende des Artikels steht eine verallgemeinerte Aussage über den Zustand der Welt. Eine Prüfung erfolgt jedoch nicht. Es ist also dem Leser überlassen, eine Verifikation oder Falsifikation durchzuführen. Oder die Autoren erwarten, dass man ihnen einfach Glauben schenkt.

Ein schönes Beispiel – und Auslöser dafür, dass ich diesen Post verfasse – ist folgender Artikel des Independent mit dem Titel „Sites like Uni Lad only act to support our everyday rape culture“. Dort findet sich mehrfach die unzureichende Anwendung der beiden Schlussverfahren. Ein Textauszug:

When I use the term ‘rape culture’, I don’t mean to exaggerate or sensationalise. I am not referring to isolated incidents, but to a widespread trend towards articles, websites and events that sexualise, objectify and dehumanise female students and women in general. I am talking about entire websites where across hundreds of articles about women not a single female name appears; they are replaced with “wenches”, “hoes”, “clunge”, “skank”, “sloppy seconds”, “pussy”, “tramp”, “chick”, “bird”, “milf”, “slut” and “gash”. They are part of a growing culture in which the sexual targeting of female students as “prey” is actively encouraged, even when it verges on rape and sexual assault. It is an atmosphere in which victims are silenced and perpetrators encouraged to see crimes as merely ‘banter’ – just part of ‘being a lad’.

Versuchen wir diesen Abschnitt doch einmal nach dem zuvor besprochenen Prinzip aufzuschlüsseln:

Prämisse = Eine nicht näher bestimmte Anzahl an Webseiten und Artikeln bezeichnet Frauen mit herabwürdigenden Begriffen. [Einzelbeobachtungen]

Konklusion 1 = Es gibt einen Trend zu Webseiten, Artikeln und Vorkommnissen, bei denen Frauen sexualisiert, objektifiziert und entwürdigt werden.

Konklusion 2 = Es gibt eine wachsende Kultur, in der dazu ermutigt wird Frauen als „sexuelle Beute“ ins Visier zu nehmen.

Konklusion 3 = Es wird ein Klima erschaffen, in dem Opfer mundtot gemacht und Täter ermutigt werden ihre Verbrechen als Scherze anzusehen; als etwas was Kerle eben machen.

Aus einer Prämisse werden also drei verallgemeinerte Aussagen über den Zustand der Welt bzw. das „kulturelle Klima“ in Großbritannien abgeleitet. Diese induktiven Schlüsse können anschließend vom Leser anhand der Wahrscheinlichkeit der Korrektheit ihrer Konklusionen bewertet werden (vgl. Vertretbarkeit von Argumenten).

Wo aber bleibt die Überprüfung der Konklusionen in einem deduktiven Schlussverfahren durch die Autorin? Und welchen Wert haben die aufgestellten Verallgemeinerungen, wenn diese Überprüfung ausbleibt?

Es ist wichtig sich klar zu machen, dass es sich hierbei nicht nur um die Äußerung einer Meinung handelt. Die Autorin des Artikels macht eine faktische Aussage, welche entweder bestätigt oder widerlegt werden kann. Diese Aufgabe wird aber dem kritischen Leser selbst überlassen, während der naive Leser die ausschließlich durch Induktion erlangte und nicht geprüfte Theorie als bare Münze nimmt.

Ein Zyniker würde jetzt sagen: „Tja, so ist das eben und mehr kann man auch nicht erwarten. Den aufwändigen Weg der Deduktion wird kein professioneller Journalist gehen, geschweige denn ein Amateur auf seinem persönlichen Blog. Vor allem dann nicht, wenn eine korrekte Prüfung der Aussagen die hohe Wahrscheinlichkeit birgt, dass seine komplette Argumentation zusammenbricht.“

Vielleicht ist das so. Vielleicht kann man aber auch mehr verlangen.

Alternativ lässt sich eine persönliche, grundlegende Skepsis gegenüber faktischen Äußerungen entwickeln, wenn deren Autor nicht bereit oder dazu in der Lage ist, die von ihm aufgestellten Verallgemeinerungen in einem deduktiven Schlussverfahren zu prüfen.

Über Meinungen darüber, inwieweit ein solcher Standard für journalistische Inhalte angemessen ist, würde ich mich sehr freuen.