Individual contribution
Merkmale guten Erklärens im Musikunterricht
Mario Frei1, Sven Hilbert1, Bernhard Hofmann2, Gabriele Puffer2
1Universität Regensburg, Germany; 2Universität Augsburg, Germany
Theoretischer Hintergrund
Erklären gilt als wichtige Kompetenz von Lehrkräften und wird zu deren Kerntätigkeiten im Unterricht gezählt (z. B. Findeisen, 2017; Fraefel & Scheidig, 2018; Pauli, 2015). Das wirft die Frage nach Qualitätsmerkmalen unterrichtlichen Erklärens auf. Während dazu aus Erziehungswissenschaft und fachdidaktischer Forschung bereits empirische Erkenntnisse vorliegen (z. B. Findeisen, 2017; Kiel, 1999; Kulgemeyer & Tomszyczyn, 2015; Wittwer & Renkl, 2008), zeigt sich die Forschungslage zu Stellenwert, Funktion und Qualität von Erklärhandlungen im Musikunterricht noch defizitär.
Bereits vorgelegt wurde eine erste theoretische Modellierung zu Merkmalen „guten“[1] Erklärens im Fach Musik (Frei et al., 2022). Neben generischen Merkmalen (Strukturiertheit, sprachliche Verständlichkeit, Sprech- und Körperausdruck sowie Adressatenorientierung; Lindl et al., 2019) wurde der Einsatz verschiedener externer Repräsentationsformen (siehe dazu Schnotz & Bannert, 1999) bzw. die sich daraus ergebenden Erklärmodi fachspezifisch konzeptualisiert (optische Repräsentation: z. B. Visualisierungen; akustische Repräsentation: z. B. Hörbeispiele). Im Rahmen des transdisziplinären Forschungsprojekts FALKE-q (Schilcher et al., 2021) erfolgte eine empirische Validierung mit Blick auf unterrichtliches Erklären musiktheoretischer Inhalte (Frei, i. Vorb.).
Der Beitrag soll Fragestellung, methodisches Vorgehen und einige Ergebnisse der Teilstudie FALKE-q-Mu vorstellen.
Fragestellung
Die Studie geht von der Annahme aus, dass die Validität potenzieller Merkmale von Unterrichtsqualität perspektivenspezifisch sein kann (vgl. z. B. Kunter & Baumert, 2006; Kleickmann et al., 2019). Für Angehörige verschiedener Statusgruppen (z. B. Schüler:innen, Lehrkräfte) sind möglicherweise unterschiedliche Merkmale einer unterrichtlichen Erklärung qualitätsrelevant. Daraus ergeben sich folgende Fragestellungen:
- Wie unterscheiden sich die Bewertungen von Erklärqualität unter Berücksichtigung von Erklärmodus und Statusgruppe?
- Wie hängen globale Bewertungen von Erklärqualität und Beurteilungen zu den genannten Einzelmerkmalen zusammen? Lassen sich auch hier Unterschiede zwischen den Statusgruppen ausmachen?
Methode
In einem experimentellen Ansatz dienen sieben Video-Vignetten als Stimuli in einem Online-Fragebogen. Jede Vignette enthält eine kurze Erklärung zu insgesamt drei in Curricula der sechsten Jahrgangsstufe typischerweise verankerten musiktheoretischen Inhalten; optische und akustische Formen der Repräsentation werden über alle Videos hinweg systematisch variiert. An der Erhebung nahmen im Fach Musik 271 Personen teil, davon 148 Schüler:innen, 61 Studierende, und 62 Lehrende (41 Lehrkräfte sowie 21 Hochschullehrende). In einem zweistufigen Verfahren bewerteten die Teilnehmenden der drei Statusgruppen jede Erklärung zunächst mit einer Globalnote (als Schulnote von 1 bis 6) und gaben in einem zweiten Durchlauf Beurteilungen zu Einzelmerkmalen guten Erklärens ab. Die dabei verwendeten sechsstufigen Rating-Skalen basieren auf der theoretischen Konzeptualisierung des Projekts FALKE-q-Mu.
Die Mediane der Reliabilitätskoeffizienten (Cronbach‘s Alpha) pro Skala sind über alle Statusgruppen, Merkmale und Videos hinweg nach Field (2013) und aufgrund der Neukonstruktion als akzeptabel einzustufen (0,62 < a < 0,84).[2] Zur Datenauswertung wurden unter anderem regressions- und varianzanalytische Verfahren verwendet.
Ergebnisse
Eine mixed ANOVA zeigte einen großen Effekt des Innersubjektfaktors „Erklärmodus“ (F(2, 518) = 167,69; p < 0,01; = 0,39). Detailliertere Post-hoc Analysen (Werte korrigiert nach Bonferroni) ergaben, dass unabhängig der Statusgruppen und unabhängig vom Erklärthema diejenigen Erklärungen signifikant schlechter bewertet werden, in denen optische Repräsentationen fehlen (alle p < 0,01). Das überrascht vor dem Hintergrund, dass das Fehlen von akustischen Repräsentationen – ein zentrales Spezifikum von Musikunterricht – zu keinen signifikanten Unterschieden in der Erklärqualität führt. Nach Statusgruppen getrennte Regressionsanalysen lassen den Schluss zu, dass für Schüler:innen tatsächlich andere Merkmale relevant sind als für Lehrende und Studierende. Demnach kann die Annahme einer perspektivenspezifischen Validität von Erklärqualität im Fach Musik aufrechterhalten werden.
[1] Der Terminus „gut“ wird in Anlehnung an die Kategorie „gutes Unterrichten“ nach Berliner (2005) verstanden.
[2] Eine Ausnahme bildet die Skala Sprachliche Verständlichkeit. Die Limitation des niedrigen Median-Werts (Cronbachs-Alpha) von 0,48 wird in der Analyse berücksichtigt.
Individual contribution
Wie gut können Schüler:innen historisch denken? Ein Kooperationsprojekt der Geschichtsdidaktik (Universitäten Konstanz und Salzburg), der Empirischen Bildungsforschung (Universität Tübingen) und des Instituts für Qualitätsentwicklung an Schulen Schleswig-Holstein
Christiane Bertram1, Wolfgang Wagner2, Christoph Kühberger3, Nadja Einhaus4, Karin Hülsen4, Benjamin Stello4, Ulrich Trautwein2
1Universität Konstanz, Germany; 2Universität Tübingen, Germany; 3Universität Salzburg, Österreich; 4Institut für Qualitätsentwicklung an Schulen Schleswig-Holstein (IQSH)
Theoretischer Rahmen
Häufig wird in Gesellschaften mit der Vergangenheit oder der „Geschichte“ argumentiert, wenn es um Probleme in der Gegenwart und Lösungsangebote für die Zukunft geht. Um schwierige oder gar unzulässige Umgangsweisen mit Geschichte durchschauen und dekonstruieren zu können, ist in einer demokratisch organisierten Gesellschaft eine historisch-politische Grundbildung unerlässlich. Daher steht neben der Vermittlung relevanten historischen Wissens die Förderung historischer Kompetenzen im Zentrum des Geschichtsunterrichts. Theoretisch fundierte und empirisch erprobte Kompetenzmodelle des historischen Denkens und Lernens (u. a. Gautschi, 2009; Körber et al., 2007) haben in den letzten Jahren Eingang in die Bildungs- und Lehrpläne aller bundesdeutscher Länder gefunden und bestimmen die Aus- und Fortbildung der Lehrkräfte.
Auf dieser Grundlage wurde auch in den Fachanforderungen Geschichte in Schleswig-Holstein (Ministerium für Schule und Berufsbildung des Landes Schleswig-Holstein [MSB], 2016) definiert, welche Kompetenzen im Sinne überprüfbarer Standards die Lernenden am Ende der Sekundarstufe I erreicht haben sollen. In einem Kooperationsprojekt des Instituts für Qualitätsentwicklung an Schulen Schleswig-Holstein (IQSH) mit dem Hector-Institut für Empirische Bildungsforschung an der Universität Tübingen und der Fachdidaktik Geschichte an den Universitäten Konstanz und Salzburg haben wir untersucht, inwieweit die Lernenden die für das Ende der Sekundarstufe I formulierten Ziele erreichen.
Forschungsfragen
Wir wollten einen Einblick in den Leistungsstand der Lernenden gewinnen und Unterschiede nach Klassenzugehörigkeit und Schulform überprüfen. Zudem sollten die Informationen über die Testergebnisse der Lernenden den Lehrkräften die Möglichkeit geben, den Leistungsstand ihrer Schüler:innen bezogen auf den Erwerb historischer Kompetenzen zu erfahren. Darüber hinaus wollten wir herausfinden, wie viele Schüler:innen einen Mindeststandard (nicht) erreichen.
Methodisches Vorgehen
Um diese Fragen zu beantworten, führten wir im Herbst 2021 online eine Studie durch, in der erprobte Aufgaben aus einem historischen Kompetenztest, dem sog. HiTCH-Test (Authors, 2017; Authors, 2022) eingesetzt wurden. 111 Klassen und 2.258 Schüler:innen, von denen sich 52% dem weiblichen Geschlecht zugeordnet haben, nahmen an der Erhebung teil. Jeweils 50% waren zum Testzeitpunkt in der achten bzw. neunten Klassenstufe, 26% waren auf einer Gemeinschaftsschule (davon 63% mit Oberstufe), 74% besuchten das Gymnasium. Gemeinsam mit Lehrkräften aus Schleswig-Holstein führten wir einen eintägigen Standard Setting Workshop (Tannenbaum & Katz, 2013) durch, in dem wir in einem standardisierten und iterativen Verfahren zu einem gemeinsamen Verständnis der „Minimalstandards“ gelangen wollten: Was sollen Schüler:innen am Ende der Sekundarstufe I mindestens verstanden haben?
Ergebnisse
Zentrale Ergebnisse des Projekts waren:
(1) Der eingesetzte standardisierte Online-Test hat sich aus psychometrischer Sicht als geeignet erwiesen, um historische Kompetenzen reliabel und validie zu erfassen, und fand eine hohe Akzeptanz bei den Schüler:innen und Lehrkräften.
(2) Der Leistungsunterschied zwischen den teilnehmenden Schüler:innen am Gymnasium und der Gemeinschaftsschule war deutlich ausgeprägt und war mehr als doppelt so groß wie der Unterschied zwischen Acht- und Neuntklässler:innen. Außerdem zeigten sich auch nach Kontrolle wichtiger Faktoren wie der Schulform sowie der individuellen Voraussetzungen der Schüler:innen bedeutsame Leistungsunterschiede zwischen einzelnen Schulklassen.
(3) Im Rahmen eines Standard Setting-Workshops mit Lehrkräften aus Schleswig-Holstein wurde ein Vorschlag für einen empirisch verankerten Mindeststandard erarbeitet. Ein bzw. zwei Schuljahre vor dem Ende der Sekundarstufe I hatten 21% der Neuntklässler:innen am Gymnasium und 61% an der Gemeinschaftsschule diesen Mindeststandard (noch) nicht erreicht. In der verbleibenden Schulzeit würde voraussichtlich der Anteil von Schüler:innen, deren Leistungen unterhalb des Mindeststandards liegt, substanziell sinken, doch würden basierend auf einer Projektion immer noch rund 35% der Schüler:innen der Gemeinschaftsschule den Mindeststandard nicht erreichen.
Ausblick
Mit dem Kooperationsprojekt wurde ein Prozess angestoßen, in dem die Forschenden gemeinsam mit den Fachlehrkräften in Schleswig-Holstein an einer Verständigung über Kriterien arbeiten, ab welchen Testergebnissen das historische Denken den in den Fachanforderungen formulierten Erwartungen, den „Standards“, entspricht.
Individual contribution
Schriftliches Urteilen im Politikunterricht der Sekundarstufe I - Eine Interventionsstudie zum textsortenbasierten Schreiben im Fachunterricht
Claudia Forkarth
Universität Duisburg-Essen, Germany
Theoretischer Hintergrund
Sprachliches Lernen als Aufgabe aller Fächer zu verstehen und umzusetzen, ist eine zentrale Zielstellung sprachsensibler Schulentwicklung (Roll et al., 2019; Thürmann & Volmer, 2017). Dabei ist die Bedeutung konzeptuell schriftsprachlicher Fähigkeiten für den Schulerfolg und die gesellschaftliche Teilhabe hervorzuheben (OECD, 2006; Reiss et al., 2016).
Am Ansatz der „durchgängigen Sprachbildung“ (Gogolin, 2017) setzt die Arbeit an und zielt auf die Förderung fachspezifischer (schrift-)sprachlicher Fähigkeiten im Politik-/Gesellschaftslehreunterricht am Beispiel der Textsorte Politisches Urteil. Die politische Urteilsfähigkeit wird als eine zentrale Dimension der Politikkompetenz (Detjen et al., 2012) verstanden und bietet ebenso wie die Modellerweiterung (Manzel & Weißeno, 2017) einen theoretischen Bezugsrahmen politikdidaktischer Forschung.
Insbesondere mit dem Ziel, Schüler*innen zu mündigen Bürger*innen auszubilden, zeigt sich, wie voraussetzungsreich politische Partizipation und Diskursteilnahme sind und dass Unterstützungsmöglichkeiten für die Lernenden auf unterschiedlichen Ebenen erforderlich sind (Dutz, 2020). Es fehlen schriftsprachliche ebenso wie politikbezogene Kompetenzen, deren Erwerb die Schüler*innen vor große Herausforderungen stellt. Es fällt ihnen einerseits schwer, politische Urteile zu fällen, andererseits wird das schriftliche Urteilen selten gefördert und explizit angebahnt, obwohl Schüler*innen Fachinhalte und Wissen um fachspezifische Sprachstrukturen benötigen, um den Anforderungen des Schreibens im Fachunterricht gerecht zu werden (Oleschko 2012).
Forschungsdesign
Die quasi-experimentelle Interventionsstudie (Pre-Post-Design) untersucht die schriftliche Urteilsfähigkeit von Schüler*innen der Jahrgangsstufen sieben/acht an Gesamtschulen in NRW anhand der sprachlichen Handlung Begründen sowie den Effekt einer fachspezifischen, textsortenbasierten Schreibförderung (Genre-Cycle, Taufik, 2009; Callaghan et al. 1993; Roll et al. 2022).
Im Vortrag soll ein Überblick über das abgeschlossene Dissertationsprojekt (Forkarth, im Druck) und ausgewählte Ergebnisse gegeben werden. Die zentrale Forschungshypothese ist, dass eine textsortenbasierte Schreibförderung im Politikunterricht positive Effekte auf das Schreiben politischer Urteile im Fachunterricht hat.
Dabei wird (1) die Ausgangslage der Schüler*innen untersucht (deskriptive Analyse), (2) die Intervention auf ihre Wirksamkeit überprüft (Varianzanalyse mit Messwiederholung) und (3) Einflussfaktoren auf das fachspezifische Schreiben bestimmt (Cross-Lagged-Panel-Design, Regressionsanalyse).
Datenerhebung und -auswertung
Die Daten wurden 2019 an zwei Gesamtschulen in Nordrhein-Westfalen und 13 Klassen mittels Schreibaufgaben und weiteren Testinstrument zur Überprüfung unterschiedlicher Einflussgrößen (u.a. Fachwissenstest, C-Test, SLS) erhoben (9 Interventions-, 4 Kontrollklassen; NSchüler*innen = 358). Die Testverfahren zur Erhebung und Auswertung der Textprodukte der Schüler*innen sind standardisiert, ein Kategoriensystem mit Ankerbeispielen zur Auswertung der Schreibprodukte wurde entwickelt, mehrfach pilotiert und in Doppelrating-Verfahren mit Rater-Schulungen durchgeführt (ICC(A,2) = .779-.988).
Ergebnisse
Ein erster Einblick in die Ergebnisse entlang der Forschungsfragen zeigt:
(1) Ausgangslage: Die Schüler*innen weisen Lücken in der textsortenspezifischen Schreibfähigkeit (begründen) auf. Es zeigen sich außerdem Unterschiede in der Textsortenfähigkeit im Deutsch- und Politikunterricht (t1, t(247) = 6.852, p = .000; t2 t(225) = 9.523, p = .000). Schüler*innen mit und ohne Zuwanderungshintergrund unterscheiden sich in der Ausgangslage (gemessen an der Textsortenfähigkeit) signifikant voneinander: t(252) = 2.915, p = .004. Der Zuwanderungshintergrund korreliert außerdem negativ mit der Textsortenfähigkeit (r = -.205**), dem Fachwissen (r = -.297**) sowie den allgemeinsprachlichen Fähigkeiten (r = -.283**).
(2) Wirksamkeit: Es lässt sich kein Lernzuwachs (unter Berücksichtigung der Kontrollgruppe) der Schüler*innen vom ersten zum zweiten Messzeitpunkt in ihrer Fähigkeit, schriftliche politische Urteile zu verfassen, nachweisen (F(1, 197) = .633, p = .472) (s.a. Hermansson et al, 2019, zum Nicht-Effekt von Interventionen).
(3) Einflussfaktoren: In der Regressionsanalyse (|R²| = .23) zeigen sich signifikante Effekte des Geschlechts (β = -.178; t(134) = -2.214, p = .029), des Informationsverhaltens (β = .226; t(134) = 2.500, p = .014) und des Fachwissens (β = .232; t(134) = 2.677, p = .008). In der SchriFT II-Studie zeigt sich außerdem, dass weniger die Herkunft als vielmehr fachspezifische und sprachbezogene Faktoren Einfluss nehmen (Krabbe & Enzenbach 2022).
Weitere Ergebnisse z.B. hinsichtlich der Jahrgangsstufen- und Klassenzugehörigkeit, Mehrsprachigkeit oder Fachwissen sowie Limitationen der Studie werden diskutiert.
Individual contribution
„Fair Debattieren und Erörtern“ – ein evidenzbasiertes Forschungsprojekt im Feld Schule
Lucas Deutzmann, Winnie-Karen Giera, Sarah Risse
Universität Potsdam, Germany
Ein zentrales Ziel der inklusiven Deutschdidaktik ist es, Schüler:innen der Sekundarstufe I durch die Vermittlung literaler Kompetenzen den Zugang zu Bildungsabschlüssen zu ermöglichen und dadurch Bildungsgerechtigkeit zu erzielen (OECD, 2021). Schulleistungsstudien zeigen, dass Schüler:innen Barrieren im Bildungsverlauf aufweisen, wenn ihnen diese literalen Kompetenzen fehlen (Stanat et al., 2010; Neumann, 2010). Daher gilt es, alle Schüler:innen, und besonders die Schreiber:innen, Sprecher:innen und Leser:innen mit gering ausgeprägten literalen Fähigkeiten, zu fördern, damit diese im beruflichen, kulturellen und politischen Kontext gesellschaftlich partizipieren können. Das mündliche und schriftliche Abwägen von Argumenten eröffnet durch das simultane sprachliche und demokratische Handeln ergiebige Möglichkeiten, literale Kompetenzen und das Bestreben zur politischen und gesellschaftlichen Teilhabe bei Schüler:innen zu fördern (Achour et al. 2020, Winkler, 2005). Trotz dessen lässt sich der Einfluss des mündlichen Argumentierens auf die Fähigkeit zum Schreiben dialektischer Erörterungen im Deutschunterricht am Ende der Sekundarstufe I als Forschungsdesiderat bezeichnen. Dabei ist das Schreiben einer dialektischen Erörterung eine relevante Prüfungsaufgabe im Rahmen des Mittleren Schulabschlusses im Fach Deutsch in der zehnten Jahrgangsstufe.
Auf der Grundlage jenes Forschungsstandes wurde das Unterrichts- und Forschungsprojekt Fair Debattieren und Erörtern konzipiert. Dabei handelt es sich um eine kontrollierte, quasi-experimentelle Interventionsstudie im Paneldesign in der Klassenstufe 9 an Gymnasien und Nicht-Gymnasien mit 355 Schüler:innen. In diesem Kontext wird die zentrale Fragestellung untersucht, wie (schrift-)sprachliche Kompetenzen von Schüler:innen im neunten Jahrgang durch zwei Unterrichtsreihen zu den Themen Debattieren und schriftliches Erörtern erfasst und weiterentwickelt werden können. Die Studie untersucht hierbei die wechselseitige Beeinflussung der Debattierkompetenz (Treatment D) einerseits und der Schreibkompetenz (Treatment E) andererseits. In diesem Zusammenhang gingen die geschulten Mitglieder des Lehrstuhlteams im Sinne des Design-Based-Research-Ansatzes (Philipakos et al., 2021) in das Feld Schule, um die Intervention in Form der beiden Unterrichtsreihen durchzuführen. Das Projekt wurde in der ersten Phase (11/2021-05/2022) pilotiert und im Sinne des DBR-Ansatzes sowohl innerhalb des Lehrstuhlteams als auch mit Lehrkräften evaluiert, reflektiert und angepasst. Der innovative Charakter der Datenerhebung liegt in der Erfassung der Schreibprozesse als Verlaufsdiagnostik mithilfe der digitalen Erhebungsplattform Gorilla.sc. begründet, welche zu vier Messzeitpunkten (Pre-, Zwischen-, Post- und Follow-up-Testung) in randomisierten Interventionsgruppen sowie in Kontrollgruppen erfolgte. Die Messung der Schreibkompetenz wurde in diesem Zusammenhang durch vier Schreibaufgaben (Textsorte dialektische Erörterung) ausgewählter MSA-Prüfungen der letzten zehn Jahre realisiert. Alle anonymisierten Erörterungstexte (n =1000) wurden, angelehnt an das IMOSS-Kodierverfahren (Neumann & Matthiesen, 2011), im Double-Blind-Verfahren holistisch und analytisch codiert (Cohen’s Kappa =.727). Die Datenaufbereitung erfolgte durch R Studio in Form von Mehr-Ebenen-Analysen.
Der Vortrag fokussiert die Ergebnisse der Interventionsstudie hinsichtlich der Schreibkompetenz der Schüler:innen in Form der Textlänge, der Textqualität sowie der digital erfassten Schreibprozesse. Die Ergebnisse zeigen hinsichtlich der Reihenfolge der Treatments, dass die Texte derjenigen Schüler:innen, welche zuerst debattierten und danach schriftlich erörterten, eine größere Textlänge- und Qualität aufwiesen als in der anderen Interventionsgruppe sowie der Kontrollgruppe. In diesem Zusammenhang konnten die Textlänge, die Anzahl der Wörter im (digitalen) Schreibplan, die Zeit im (digitalen) Schreibfeld, die Zeit im Schreibplan und die Anzahl der Wechsel zwischen Schreibfeld und Schreibplan als hoch signifikante Prädiktoren für die Textqualität ermittelt werden (p<0.01). Zudem bestand ein höchst signifikanter Zusammenhang zwischen den vier Messzeitpunkten und allen abhängigen Variablen in allen Probandengruppen (p<0.001). Die Ergebnisse verdeutlichen die Relevanz von Interventionsstudien im Längsschnitt im DBR-Design, um Transferprozesse zwischen Universität und Unterrichtspraxis zu initiieren.
|