Leistungsbeurteilung als Problem und Chance der Schulentwicklung*)

von Jürgen Oelkers

Die "Fragwürdigkeit der Zensurengebung" hiess ein in Deutschlandund in der Schweiz sehr erfolg- und folgenreicher Sammelband, der 1971 in ersterAuflage erschien und bereits fünf Jahre später sechs Auflagen erreicht hatte.Die Befunde dieses Bandes beschäftigten seinerzeit die Medien und lösten auchheftige Reaktionen in der Lehrerschaft aus. Sie war überwiegend entsetzt überdie Befunde der Forschung und fühlte sich angegriffen. Der Herausgeber desBandes, Karl-Heinz Ingenkamp, berichtet darüber im Vorwort zur sechsten Auflagedes Buches:

"Ich war ... überrascht, dass fast kein Wort der Fäkaliensprache ausgelassen wurde, um meine ‚Nestbeschmutzung‘ zu kennzeichnen. Solche Stellungnahmen konnten aber einzelnen Aussenseitern zugerechnet werden. Deprimiert haben mich jedoch Briefe der Wortführer einer ‚schweigenden Mehrheit‘, die mir kollegial ins Gewissen redeten und in jeder Zeile offenbarten, dass sie noch nie etwas von den Fehlerquellen der Zensurengebung gehört hatten und auch nicht bereit waren, in entsprechenden Untersuchungen mehr als eine Zahlenspielerei unredlicher Statistiker zu sehen" (Ingenkamp 1976, S. 5).

Diese Einstellung habe sich, heisst es weiter, inzwischen "bei sehrvielen Lehrern geändert", nicht zuletzt "durch die Verbreitung diesesBuches". Auch in der Ausbildung sei das Problem der Zensurengebung stärkergewichtet worden. Von der Forschung "unberührt" geblieben sei"eigentlich nur die Praxis unserer Bildungsbürokratie" (ebd., S.5/6). 25 Jahre später gibt es immer noch Noten, es ist keineswegs, wieIngenkamp seinerzeit forderte, ein "besseres diagnostischesInstrumentarium" entwickelt worden und es erscheint weiterhin"fragwürdig", wie schulische Leistungen beurteilt werden und welcheFolgen damit verbunden sind. Zwischen 1971 und 2001 sind diverse Variantenausprobiert worden, es fehlt auch nicht an Vorschlägen für mehr oder wenigerradikale Aenderungen der Beurteilungspraxis, aber das hauptsächliche Instrumentder Beschreibung von Leistungen ist immer noch das Notenschema.

Dieser Tatbestand kann nicht einfach auf die verstockte"Bildungsbürokratie" zurückgeführt werden. Offenbar hat dasNotenschema in der Praxis viele Vorteile, die in der psychologischen oderpädagogischen Kritik immer übersehen wurden. Die Kritik ist nicht neu, und sieist auch kein Phänomen der Aufbruchstimmung zu Beginn der siebziger Jahre, alsdas grundsätzlich "Alternative" Mode war. Voten "gegenPrüfungen und Noten" finden sich schon Ende des 19. Jahrhunderts(Schreiber 1899), seinerzeit vorgebracht von Medizinern, die dieFachöffentlichkeit mit den schädlichen Folgen von Prüfungsstresskonfrontierten. Seitdem sind die Nachteile von Prüfungen und Notenextensiv untersucht worden, ohne die einfache Frage zu beantworten, warum esangesichts der Nachteile immer noch Prüfungen und Noten gibt. Die Praxis kannnicht einfach als einzige Fehlhandlung hingestellt werden.

Die Vorteile von Ziffernnoten sind etwa die folgenden:

  1. Eine Skala von fünf oder sechs Noten erlaubt die Beschreibung einer Normalverteilung in der Klasse.
  2. Die Beschreibung ist kurz und eindeutig.
  3. Das Notenschema ist ein öffentlicher Standard und wird nicht nur in der Schule verwendet.
  4. Das Schema lässt sich auf ökonomische Weise einsetzen und kommunizieren.
  5. Probleme der Ausdeutung sind gering.

Demgegenüber haben die oft genannten Alternativen erhebliche Nachteile. Textliche Leistungsbeschreibungen oder "Wortgutachten" verlangen einen erheblich grösseren Aufwand, sind in stärkerer Weise interpretationsabhängig und haben Probleme vor allem bei der Formulierung negativer Beurteilungen. Sie verstecken die Urteile oft hinter differenzierter Freundlichkeit. Standardisierte Beurteilungsbögen verwenden zumeist weiche und vage Kriterien, zielen auf "ganzheitliche" Beurteilungen und müssen wiederum interpretiert werden. Diskursive Verfahren, etwa in Eltern:Schüler-Gesprächen, konfrontieren die Notengeber, also die Lehrkräfte, mit Akzeptanzproblemen, die nicht selten Machtproben darstellen. Diese Verfahren mischen Notengebung und Austausch, ohne dass über die Noten wirklich verhandelt werden könnte. Letztlich taucht in allen Varianten das Notenschema wieder auf, weil in jedem Falle eine vergleichende Leistungsbeurteilung abgegeben werden muss. Warum also sollte man das bewährte Schema dann nicht gleich und in originaler Form verwenden?

Ich werde die offenbar heikle Frage der Leistungsbeurteilung nicht lediglich als Problem, sondern zugleich als Chance der Schulentwicklung verstehen. Die Idee einer nicht-selektiven Schule, die auf vergleichende Leistungsbeurteilung gänzlich verzichtet, wird sich mindestens im Gymnasialbereich nicht durchsetzen. Sie ist auch insofern fraglich, als Schülerinnen und Schüler in aller Regel eine solche Leistungsbeurteilung wünschen und wenn, dann Form und Verfahren kritisieren. Die Praxis der Leistungsbeurteilung kann entwickelt werden, wobei auffällig ist, dass diese Aufgabe in den heutigen Modellen der Schulentwicklung bislang kaum eine Rolle spielt. Das zentrale Problem, wie die Leistungen bewertet und beschrieben werden sollen, erhält überraschend wenig Aufmerksamkeit. Das gilt nicht für die Lehrkräfte, die hier einen hohen Belastungsfaktor sehen, wohl aber für die Reformdiskussion, in der die Zukunft der Schule auf seltsame Weise notenfrei oder notenfern gesehen wird.

Meine Ausführungen haben drei Teile: Zunächst werde ich auf den Stand derForschung eingehen und berichten, was seit Ingenkamps "Fragwürdigkeit derZensurengebung" geschehen und auch nicht geschehen ist (1). In einemSchritt gehe ich auf die Belastungsfaktoren heutiger Schularbeit näher ein,unter denen offenbar Leistungsbeurteilung und Notengebung einen hohenStellenwert einnehmen (2). Anschliessend frage ich nach realistischenMöglichkeiten der Entwicklung, die in einem selektiven Bildungssystem nichteinfach darin bestehen kann, jeden Schüler nach seinem Talent für sich undohne Vergleich mit Anderen zu fördern (3).

 

1. Ergebnisse der Forschung

 

Zeugnisse und Noten, dazu Prüfungen und alternative Leistungsdiagnosen, sindForschungsthemen, die sich im deutschen Sprachraum deutlich auf die zwanzigerund sechziger Jahre des 20. Jahrhunderts konzentrieren. Besonders zwischen 1950und 1970 lässt sich ein starkes Forschungsaufkommen nachweisen, das danach, imUnterschied zu den angelsächsischen Verhältnissen, abnimmt. Ingenkamp fasstedie vorliegenden Forschungen zusammen und beschrieb die Resultate im Blick aufvier Dimensionen:

  • subjektive Fehlerquellen
  • das klasseninterne Bezugssystem
  • die Qualitätsunterschiede in den einzelnen Schulfächern
  • den prognostischen Wert.

Die bis 1976 vorliegenden Arbeiten verweisen, so Ingenkamp, auf eine sehrweitgehende Subjektivität in der Zensurengebung. Es handelt sich um persönlichgefärbte Urteile, nicht um objektive Bewertungen, die auf einen gemeinsamenMassstab verweisen müssten. Das gelte selbst oder gerade für denMathematikunterricht. Eine deutsche Studie zeigte, dass einigeMathematiklehrkräfte von den Fehlern, andere von den richtigen Lösungenausgingen, um zur Zensur zu gelangen. Die Ansichten über die Bewertung vonFaktoren wie Sauberkeit, Schrift, formal-mechanischem Rechnen im Vergleich zumFinden des Lösungsansatzes oder zum mathematischen Denken variierten erheblich(Haecker 1971). Für die Bewertung sei auch die "implizitePersönlichkeitstheorie" entscheidend (Hofer 1975), mit der die Lehrkräfteihre Verhaltens- und Charaktererwartungen an die Schüler bestimmen. DieseErwartungen werden nicht explizit formuliert und sind gleichwohl wirksam.Weitere Fehlerquellen im Urteil sind Stereotypen in der Geschlechtswahrnehmungoder auch einfach individuelle Vorlieben, wie schon früh in der Bewertung vonAufsätzen gezeigt wurde (Bobertag 1933, Ulshöfer 1949).

Die drei anderen Dimensionen der Fragwürdigkeit beziehen sich aufBedingungen und Folgen der Subjektivität. Noten werden aufgrund desklasseninternen Bezugssystems, also der beobachteten und bewerteten Verteilungin einer bestimmten Klasse, gegeben, aber der Wert der Noten bezieht sich immerauf das gesamte Schulsystem. Unterstellt wird die Vergleichbarkeit derNotengebung an allen Orten, während die tatsächlichen Bewertungen von Schulezu Schule und von Fach zu Fach variieren, zum Teil erheblich und nicht seltenärgerlich. In verschiedenen Fächern wird mit unterschiedlicher Strengezensiert, die Strenge nimmt mit der Bedeutung des Faches in der Stundentafel zu,"stark selektive Hauptfächer" haben die strengste Notengebung (deGroot 1971). Gleichzeitig zeigen Untersuchungen der Häufigkeitsverteilung, dassZensuren "keine Intervallskala mit gleichen Notenabständen"darstellen (Ingenkamp 1976, S. 232). Die Benotungsstrenge nimmt mit derKlassenstufe zu, bleibt in der Verteilung der Fächer aber gleich. DieHauptfächer des Gymnasiums steigern die Anforderungen, die Zensurenverteilungin den Nebenfächern wird eher noch milder (Hopp/Lienert 1976).

Der prognostische Wert dieser Praxis sei gering, schrieb Ingenkamp 1976. Zwarkorrelieren innerhalb eines Schultyps die Zensuren in aufeinanderfolgendenKlassenstufen relativ hoch, aber das sei für die Prognose von Erfolg oderMisserfolg in nachfolgenden Schulen oder Stufen kaum von Bedeutung. DieQualität ist zu unterschiedlich: Primarschulzeugnisse gewichtenElementarisierungseffekte wie die Rechtschreibleistungen oder auch Faktoren wieFleiss und Wohlverhalten erheblich stärker als intellektuelle Fähigkeiten. DieMassstäbe von Aufnahmeprüfungen variieren von Jahr zu Jahr und von Ort zu Ortwiederum erheblich. Zudem hängt der Schulerfolg von der Stärke des Jahrgangsund den Klassenfrequenzen ab (Tent 1969; Sauer/Gamsjäger 1996). Der stärksteFaktor für Erfolg oder Misserfolg aber ist die Schichtzugehörigkeit, dassoziale Milieu, aus dem die Schüler stammen (Ingenkamp 1976, S. 274ff).

Der Topos der "Fragwürdigkeit" zieht sich seitdem durch diedeutschsprachige Forschungsliteratur. Die vier Dimensionen von Ingenkamp werdenin einem Forschungsbericht von 1999 nochmals herausgestellt. Demnach ist dieBenotung in verschiedenen Fächern unterschiedlich streng (Ziegenspeck 1999, S.137ff.), wobei nicht nur der Rang des Faches eine Rolle spielt. In der Tendenzwird umso strenger zensiert,

  • je mehr die Leistungen in schriftlichen Arbeiten überprüft werden,
  • je mehr die Leistungen quantifizierbar sind
  • und/oder je stärker die verbalen Anforderungen hervortreten.

Mädchen erhalten dabei bessere oder gleichgute Zeugnisnoten als Jungen, sierepetieren erheblich weniger und haben inzwischen mindestens in Deutschland dengrösseren Schulerfolg (Richter 1996). "Erfolg" wird in dendiesbezüglichen Studien wie eine objektive Grösse betrachtet und mit Noten inVerbindung gebracht, zugleich wird der Topos der Fragwürdigkeit der Notenweiter verwendet. Auch 1999 ist der prognostische Wert von Zensuren oderZeugnissen gering (Ziegenspeck 1999, S. 156ff.) und greift das"klasseninterne Bezugssystem", also die Relativierung derNotenaussagen im Blick auf den Ort, an dem sie entstehen. Noten sollenortsübergreifend vergleichbare Leistungen beschreiben, aber was sie erfassen,ist lediglich die Verteilung in einer bestimmten Leistungsgruppe.

Grossen Raum nimmt wiederum die Beschreibung der "subjekivenFehlerquellen" ein. Als Effekte werden unter anderem genannt:

  • Halo-Effekt: Ein globaler Allgemeineindruck bestimmt die Wahrnehmung einzelner Merkmale
  • Beharrlichkeitstendenz: Lehrkräfte rücken von einem bereits gefällten Urteil bei späteren Beurteilungen nicht ab
  • Reihungseffekt: Unter dem Eindruck, "es können doch nicht alle gleich schlecht sein" werden bessere Noten gegeben
  • Kontrasteffekt: Nach einer Serie von sehr guten Leistungen wird eine mittelmässige Leistung tendenziell als schlecht bewertet
  • Beurteilungstendenzen: Milde oder Strenge, "zentrale Tendenz" (Vermeidung von Extremwerten) und "motivierende" versus "selektive" Notengebung
  • Wissen-um-die Folgen-Fehler: Mildere Beurteilung bei absehbar negativen Folgen für die Schüler, nicht umgekehrt.

Damit verbunden sind die seit Beginn des 20. Jahrhunderts immer wiederbeschriebenen Beurteilungsunterschiede bei der Zensierung oder allgemeiner: beider Bewertung von Schülerarbeiten (Grey 1913; Ziegenspeck 1999, S. 188ff.). DieStreuung der Aufsatznoten ist ein bekanntes Phänomen, weniger bekannt sindBefunde, die darauf hindeuten, dass die gleichen Beurteiler die gleiche Arbeitzu verschiedenen Zeitpunkten höchst unterschiedlich bewerten. Zudem gibt eseine "Verlaufskurve der Bewertung" (Weidig 1961), die sich beilangwierigen Korrekturarbeiten einstellt und im gleichen Fach individuell sehrverschieden ist. Die erste Arbeit einer Korrekturserie wird tendenziell andersbewertet als die letzte, wobei der Effekt mit der Länge der Gesamtkorrekturzunimmt. Schliesslich hat die Reihenfolge in der Qualitätswahrnehmung einenEinfluss: "Kontrasteffekt" meint in diesem Zusammenhang, dass dieselbeArbeit, vom Lehrer nach Durchsicht vieler guter Proben korrigiert, ganzanders ausfällt als dies nach Durchsicht vieler schlechter Problemgeschehen würde.

Implizite Persönlichkeits- und Charakterurteile spielen eine nicht zuunterschätzende Rolle, ebenso die soziale Verteilung in der Unterrichtsarbeit.Lehrerinnen und Lehrer beziehen sich in ihrem Unterricht mehr auf die gutenSchüler, sie lassen gute wie schlechte Schüler direkt oder häufiger indirektwissen, was sie von ihrer Leistungsfähigkeit und oft damit verknüpft von ihrerPerson halten, und das Selbstbild der Schüler passt sich tendenziell dem Bildan, das die Lehrer von ihnen haben und mitteilen. Hinzukommen dieAttribuierungen aufgrund von Erfolg oder Misserfolg. Beide können dem eigenenVermögen oder dem eigenen Unvermögen zugeschrieben werden, wobei dasschulische Selbstbild offenbar in beiden Hinsichten verstärkend wirken kann. Esscheint dann ein "vicious circle" aufzutreten, wer als Schülerständig keinen oder nur mässigen Erfolg hat, traut sich künftig auch keinenErfolg zu. Es gibt auch Effekte, die zeigen, wie abhängig Lehrkräfte von dersozialen Situation und dem Entgegenkommen der Klasse sind, die sie unterrichten.Lehrkräfte, denen die Schüler positive Erwartungen entgegenbringen,stufen sich selbst im Blick auf ihre Tüchtigkeit höher ein als Lehrkräfte,bei denen die Erwartungen der Schüler negativ sind. Wenn ein Schülerkonstante Leistungen zeigt, ist das auch eine Reaktion auf das Verhältnis zumLehrer.

Ueber Lehrerkommentare zu Leistungen ist folgendes bekannt (Krampen 1987):

  1. Sozial orientierte Lehrerkommentare wirken bei leistungsschwächeren Schülern deutlich negativ, bei leistungsstärkeren neutral oder leicht positiv.
  2. An einem sachlichen Standard orientierte Lehrerkommentare wirken in der Tendenz bei allen Schülern positiv, ohne dass eine bestimmte Leistungsgruppe deutlich von ihnen profitiert.
  3. Individuell orientierte Lehrerkommentare wirken ebenfalls bei allen Schülern tendenziell positiv, am meisten profitieren davon die leistungsschwächeren.

Generell scheint die feste allgemeine Einschätzung eines Schülers odereiner Schülerin die Notengebung zu beeinflussen. Wer gute Leistungen zeigt,erhält und hat so Charaktervorteile. Die Noten einzelner Schüler in bestimmtenFächern sind über das Schuljahr verteilt erstaunlich konstant. Wenn dieEinschätzung einmal gefasst ist, scheint sie kaum korrigierbar zu sein.Tendenziell wird dem guten Schüler eine schlechte Leistung nicht nachteilig,dem schlechten Schüler eine gute Leistung nicht positiv vermerkt. Offenbarkorreliert auch Sympathie auf Seiten des Lehrers mit besseren und Antipathie mitschlechteren Noten (Ziegenspeck 1999, S. 206). Zudem ist bekannt, dass

dort, wo Schüler in zwei Fächern von ein und derselben Lehrkraft unterrichtet werden, sich ein bedeutsamer und hoher Zusammenhang zwischen den Zensuren in beiden Fächern ergibt, während dieser signifikante Fachnotenzusammenhang bei Schülern, die in den zwei betreffenden Fächern verschiedene Lehrer hatten, nicht nachgewiesen werden konnte (ebd., S. 207).

Angesichts dieser Resultate könnte man schliessen, es sei unmöglich, zu einer "gerechten Zensierung" der Leistungen von Schüler zu gelangen und dass dies der Lehrerschaft auch bewusst sei (Döring 1925, S. 177). Das schrieb der Jugendpsycholge Otto Döring 1925, aber das wirft dann nochmals die Frage auf, warum immer noch weitgehend Noten die Praxis der Leistungsbeurteilung bestimmen. Die Genauigkeit von Schülerbeurteilungen scheint sich auf das "klasseninterne Bezugssytem" zu beschränken. "Im Durchschnitt betrachtet", heisst es in einer gerade veröffentlichten Uebersicht, können die Lehrkräfte "die Rangreihe der Leistungen innerhalb ihrer Klasse recht gut einschätzen", auch wenn mit "erheblichen Unterschieden" zwischen den Lehrkräften gerechnet werden muss (Weinert 2001, S. 50). Die klasseninterne Rangreihe der Leistungen, also die Nomalverteilung, entspricht nicht den tatsächlichen Schülerleistungen, wenn man diese unabhängig testet. Noten beschreiben den internen Rangunterschied. Aber auch wenn Lehrkräfte gut in der Lage sind, die Schüler ihrer eigenen Klasse gemäss ihren Leistungen zu rangieren, heisst das nicht, "dass gleichen Noten in unterschiedlichen Klassen auch vergleichbare Leistungen zu Grunde liegen" (ebd.). Daraus ergibt sich eine dreifache Forderung:

  1. Die subjektive Beurteilung muss durch eine objektive ersetzt werden, die Standards oder einen übergreifenden "Bezugsmassstab" voraussetzt.
  2. Das objektive Kriterium sind die vom Lehrplan geforderten Lernziele unabhängig von den in einer Klasse vorhandenen Leistungsunterschieden.
  3. Dafür müssen am Lehrplan orientierte, diagnostische Instrumente entwickelt werden, die die Noten ersetzen.

(ebd.).

Die beiden ersten Forderungen sind inzwischen in der bildungspolitischenDiskussion akzeptiert, wenngleich unklar ist, wie sie erfüllt werden sollen.Die dritte Forderung ist heikel, und dies nicht nur, weil sie die Professionnoch mehr in Richtung Psychologie verändern würde. Solche neuen Instrumentehaben zumeist nicht nur eine Dimension, nämlich die der Lernziele. DieseDimension wird oft "kriteriale Norm" genannt, die in vielenalternativen Modellen der Leistungsbeurteilung gleichrangig ergänzt wird eine Sozialnormund eine Individualnorm, also den Leistungsvergleich innerhalb derjeweiligen Lerngruppe und den individuellen Fortschritt, den die Leistung fürden Schüler erbracht hat. In trivialeren Konstrukten wird zwischen"Sozial-", "Selbst-"- und "Sachkompetenz"unterschieden, ohne dabei der Sachkompetenz das deutlich grössere Gewicht zuverleihen. Auffällig bei derartigen Vorschlägen ist aber insbesondere, dasssich der Aufwand durch Komplizierung und Vervielfältigung der Kriterienerhöht, ohne dass reale Belastungsfaktoren ins Spiel gebracht würden. Mitdiesem Missverhältnis beschäftige ich mich in einem zweiten Schritt. Er giltdem Phänomen, dass Reformen immer die Belastungen steigern, ohne sie jewirklich zu kalkulieren. Innovationen sind in diesem Sinne immer abstrakt undkönnen sich doch als gutartig hinstellen.

2. Aufgaben und Belastungen
Die historisch sehr stabile Notenskala erlaubt den Lehrkräften bei allen Belastungen immer noch eine halbwegs ökonomische Arbeitsweise, die offenbar im Blick auf das "klasseninterne Bezugssystem" so schlecht nicht ist. Lehrkräfte beurteilen zutreffend, was sie beurteilen können, nämlich die Leistungen in der Klasse, die sie unterrichten. Dass die Urteile "subjektiv" sind, muss nicht heissen, dass sie sämtlich unvergleichlich sind. Auf der anderen Seite werden Noten gerne dann verwendet, wenn bestimmte Interessen objektiviert werden sollen: Die Beschreibungen des Schulerfolgs von Mädchen und jungen Frauen verwendet jenes Notensystem, das ansonsten verpönt ist. Die schwache Prognosefähigkeit muss im Blick auf den Schulerfolg relativiert werden, offenbar sind Noten nicht einfach nur subjektive Etikettierungen, die einzig in einer bestimmten Klasse Geltung haben. Zudem liegen Langzeituntersuchungen kaum vor, die nicht einzelne Gruppen oder Kohorten befragen, sondern Erfolg und Misserfolg bestimmter Gruppen durch die Schulzeit und danach verfolgen. Eine der wenigen Studien, die so verfährt, zeigt etwa, dass Schüler, die bei Schuleintritt Lesen konnten und bestimmte Rechenoperationen beherrschten, mithin gleichsam automatisch zu den Besten ihrer Klasse zählten, zu einem grösseren Teil auch nach sechs Jahren noch diesen Rang einnahmen, trotz Klassen-, Stufen- und Lehrerwechsel sowie vielfacher Benotung.

Die empirische Notenforschung verfolgt Fragestellungen, die seit Beginn des20. Jahrhunderts stabil sind und eigentlich von vornherein die Notengebung unterVerdacht stellt. Kritische Gegenevidenz ist unter dem Eindruck bestimmterStudien mindestens im deutschen Sprachraum nie erzeugt worden. Auffällig istauch, dass die grundlegenden Datensätze kaum erneuert wurden, obwohl sich diePraxis der Notengebung seit den sechzigerJahren, aus dem die hauptsächlichenUntersuchungen stammen, erheblich verändert hat. Die "Mängel dertraditionellen Notengebung" sind auch Thema eines Trendberichts derSchweizerischen Koordinierungsstelle für Bildungsforschung, der 1999veröffentlicht wurde (Vögeli-Mantovani 1999). Dieser Bericht trägt denprogrammatischen Titel

Mehr fördern,
weniger auslesen.
Zur Entwickung
der schulischen Beurteilung
in der Schweiz.

Die Kritik der Noten wiederholt im wesentlich den Topos der "Fragwüdigkeit",also Ingenkamps Thesen von 1971 spielen auch 1999 noch eine zentrale Rolle zurBeurteilung des Problems. Die Mängel der Notengebung werden in sechsAussagen zusammengefasst, Noten also sind schlecht oder unbrauchbar, denn:

  1. Verschiedene Lehrkräfte bewerten dieselbe Arbeit unterschiedlich.
  2. Die Lehrkraft hat die Tendenz, dieselbe Arbeit zu verschiedenen Zeitpunkten unterschiedlich zu bewerten.
  3. Es ist keineswegs klar, was mit einer Note zum Ausdruck gebracht wird.
  4. Die gängige Benotungspraxis hat viele unerwünschte Nebeneffekte.
  5. Noten sind zur Beurteilung bestimmter Sachverhalte ungeeignet.
  6. Notenarithmetik ist mathematisch unzulässig.

Von möglichen Vorteilen ist dagegen keine Rede. Die ersten beidenVerdikte folgen Daten und Interpretationen aus dem Sammelband von Ingenkamp. Derdritten Aussage liegt eine Schweizer Studie aus dem Jahre 1971 zugrunde (Flammer1971), die darauf verweist, dass Noten übermässig viele Funktionen erfüllenmüssen, ohne klar definiert zu sein. Im Normalfall kennt der Schüler dielehrerspezifische Beurteilungsstrategie nicht, so dass die Note nur im Blick aufdas Symbol, also die Ziffer, eindeutig ist. Die vierte Aussage verwendet zweiStudien, die Ende der siebziger Jahre entstanden (Huberman 1980; Rheinberg 1980)und die zeigen würden, dass die Orientierung am Klassendurchschnitt sichungünstig auf Leistungsmotivation, Anstrengungsbereitschaft,Ursachenzuschreibung von Schulleistungen und die Selbstwahrnehmung auswirkt.Aber damit ist eigentlich nur gesagt, dass Schüler auf Erfolge und Misserfolgeunterschiedlich reagieren, während ein Leistungssystem davon bestimmt ist, dassnicht jeder gleich Erfolg haben kann. Die fünfte These hat keinen Bezug zuneueren Arbeiten und äussert den allgemeinen Verdacht, dass Standardisierungder Inhalte, also die Festlegung eindeutiger Kriterien, mit der Gefahr verbundensei, die wünschbare Variationsbreite der Leistungen zu vermindern. Auf derStrecke blieben "Kreativität, Phantasie und Originalität" (Vögeli-Mantovani1999, S. 85). Die sechste These bezieht sich auf ein Problem, das ebenfallsimmer wieder ins Feld geführt wurde (Sacher 1984), nämlich die"trügerische Sicherheit" der Durchschnittsberechnung.

"Noten sind im besten Fall grobe Schätzwerte für den Leistungsrangplatz eines Schülers oder einer Schülerin innerhalb einer Klasse. Die Beurteilung lässt sich bei diesen ungenauen Ausgangsdaten auch durch exakte mathematische Prozeduren wie z.B. eine Durchschnittsberechnung nicht verbessern. Die Berechnung von Kommastellen und deren Interpretation vermitteln eine trügerische Sicherheit, die durch die scheinbar mathematische Genauigkeit suggeriert wird.
Durchschnittsberechnungen mit Noten sind aber aus mathematischen Gründen unzulässig, weil Noten als Ordinalzahlen von unzureichender mathematischer Qualität sind, so dass keine rechnerischen Grundoperationen durchgeführt werden dürfen" (Vögeli-Mantovani 1999, S. 86; Hervorhebung J.O.).

Mit der Logik dieses Arguments könnte weder eine Kantonsschul-Aufnahmeprüfung noch eine Maturitätsprüfung durchgeführt werden, die auf der anderen Seite aber weder beliebig verlaufen noch zu vollkommen willkürlichen Resultaten führen. Was in Rechnung gestellt werden muss, ist eine gewisse Unschärfe, die mehr oder weniger gross sein kann und die mit Belastungsfaktoren korreliert werden muss. Interessanterweise tun das die mir vorliegenden Studien zur "Fragwürdigkeit" der Notengebung sämtlich nicht. Sie kritisieren den psychologischen Wert von Noten, den pädagogischen Zweck oder den mit Noten verbundenen mathematischen Schein, während offenbar die Notengebung vor dem Hintergrund der zur Verfügung stehenden Zeit und so im Blick auf effizientes Arbeiten beurteilt werden muss (Schrader 1997, S. 664f.).

Inzwischen liegen einige seriöse Studien zu Belastungen der Lehrkräfte vor,darunter eine, die speziell für den Kanton Zürich in Auftrag gegeben wurde.Zumeist handelt es sich um Befragungen, aber auch um Interviews,Feldbeobachtungen und Dokumentenanalysen. Wenn etwa medizinische Gutachtenausgewertet werden, die Diagnosen enthalten, mit denen die Frühpensionierungvon Lehrkräften begründet werden, dann ergeben sich Daten, die auf Folgen vonschweren Belastungen hinweisen, Depressionen, Gefühle des Ausgebranntseins,eine Zunahme psychosomatischer Erkrankungen und Aehnliches mehr. QualitativeStudien zeigen, dass amtierende Lehrkräfte ihren hauptsächlichen Konflikt imzermürbenden Widerstreit zwischen dem eigenen pädagogischen Anspruch und dem,was sie alltäglich tun und erleben müssen, sehen (Schönwälder/Plum 1998).Belastend wirkt der berufseigene Idealismus, der auf der anderen Seiteunverzichtbar ist. Arbeitszeitstudien zeigen, dass die Lehrkräfte ihrenArbeitsaufwand als zu hoch einschätzen, während Entlastungsstunden kaumWirkung zeigen. Die Gesamtarbeitszeit reduziert sich nicht proportional mit denreduzierten Stunden, was sich auch daran zeigt, dass TeilzeitangestellteLehrkräfte in Relation mehr Arbeitszeit aufwenden als Vollzeitkräfte (Mummert+Partner1999). Diese Resultate beziehen sich offenbar nicht auf bestimmte nationaleSysteme, sondern gelten quer zu den Systemen, wenngleich mit typischenVariationen.

Eine grosse Untersuchung zur Arbeitszeit der Lehrpersonen in derdeutschsprachigen Schweiz (Landert 1999) zeigt unter anderem folgende Befunde:

  • Lehrkräfte unterschätzen ihre Arbeitszeit eher als dass sie sie überschätzen.
  • Alle Wochentage sind belastet, die Wochenendarbeit variiert nach Schultyp und Schulstufe.
  • Die durchschnittliche Arbeitszeit liegt ferienbereinigt höher, als im öffentlichen Dienst verlangt: Zwischen 44,6 und 47,3 Wochenstunden je nach Pensengrösse, zwischen 44,4 und 47,8 Stunden bezogen auf die Schulstufen.
  • Die Jahresarbeitszeit konzenteriert sich auf das Hauptgeschäft, nämlich Unterrichten, Vor- und Nachbereitung sowie Planung und Auswertung.
  • Für Betreuung und Beratung stehen 3% der durchschnittlichen Jahresarbeitszeit zur Verfügung.

Wer in einem solchen Zeitrahmen tätig ist, wird jede unnötige Belastungvermeiden. Eine Steigerung der Belastung muss zum Aufgabenrahmen und zumEngagement passen. Das zeigt deutlich auch die Zürcher Studie (Forneck/Schriever2000), die Ende 2000 vorgelegen hat, also akute Daten präsentiert. Sie erhebtnicht nur zeitliche, sondern generell berufliche Belastungen. Lehrkräfte allerKategorien geben dabei an, dass sie als besonders belastend empfinden

  • Disziplinierungen angesichts von Sozialisationsdefiziten,
  • Selektionsentscheide,
  • Korrekturen/Prüfungen,
  • Belastung durch Schulreform und Schulentwicklung,
  • zu grosse Klassen.

Es gibt keine Zunahme der Arbeitszufriedenheit mit zunehmendem Alter, was darauf hindeutet, dass der vielzitierte Effekt der Routinisierung nicht vorhanden ist oder zumindest nicht die Zufriedenheit erhöht. Besonders belastend sind Beurteilungen an den Schnittstellen der schulischen Selektion, das Ungenügen der Unterrichtsvorbereitung oder - überproportional häufig in der Primarschule - "problembelastete Schüler". In der Mehrzahl der Kategorien wird die zur Verfügung stehende Zeit als nicht ausreichend angesehen. Und das hat auch etwas mit dem Beruf selbst zu tun: "Die Professionstätigkeit zeichnet sich dadurch aus, dass die in der Arbeit mit Menschen wahrgenommenen professionellen Herausforderungen tendenziell unabschliessbar sind" (ebd., S. 84).

Die an der Befragung beteiligten Mittelschul-Lehrkräfte gaben an, dass wohlauch Unterrichtsvorbereitungen ein Belastungsfaktor seien, vor allem aber, unddies im Unterschied zu sämtlichen anderen Schulformen, die Korrektur vonPrüfungen sowie, damit zusammenhängend, wenngleich weniger gewichtet, dieBenotungen. Das deckt sich mit der subjektiven Problemwahrnehmung, die gesonderterhoben wurde. Die Mittelschullehrerinnen und -lehrer empfinden die verfügbareZeit für die Korrektur von Klassenarbeiten und so die Basis für dieNotengebung als weitaus zu gering. Sie investieren im Vergleich mit den anderenKategorien übermässig viel Zeit in schulische Sonderformen. Die Lehrkräfteder Volksschule und des Kindergartens sind dagegen der Auffassung, zu wenig Zeitfür die Beurteilung der Schülerinnen und Schüler zur Verfügung zu haben. DieMittelschullehrkräfte geben an, dass dafür die Zeit bei ihnen ausreicht,vermutlich weil Beurteilung und Leistungsbeurteilung sehr angenähert sind. IhrProblem sind der besondere Stoffdruck und die besondere Zeitknappheit angesichtshoher Erwartungen, die sich kaum je sehr präzise fassen lassen.

Es gibt in der Zürcher Lehrerschaft, sozusagen entgegen anderslautendenMeldungen, insgesamt keine grundsätzlichen Widerstände gegen Schulreformen,aber die dafür zur Verfügung stehende Zeit wird deutlich als ungenügendangesehen. Burned-Out-Symptome lassen sich nachweisen, allerdings mit schwachniederigeren Werten als in vergleichbaren deutschen Untersuchungen. Besondershohe Erschöpfungswerte zeigen Lehrpersonen der Real- und der Oberschule.Beklagt wird durchgehend eine "höhere Arbeitsüberforderung" (ebd.,S., 95), während die Unzufriedenheit mit dem Lehrerberuf insgesamt nichtbesonders ausgeprägt ist. Das mag auch damit zusammenhängen, dassFremdkontrolle kaum erlebt wird. Interessant ist schliesslich auch noch, dassdie Selbstwirksamkeitseinschätzung mit der Schulstufe abnimmt. Die mit Abstandhöchsten Werte für Selbstwirkamkeit zeigen sich bei den Kindergärtnerinnen,also die Gruppe, die weder Korrekturen vornehmen muss noch Noten vergibt.

Einige andere Befunde, die sich nicht mit dem Problem von Prüfungen undNoten in Verbindung bringen lassen, aber Aufschlüsse für das Gesamtbildergeben, sind:

  1. Mit einer Ausnahme arbeiten vollangestellte Lehrkräfte auch im Kanton Zürich mehr, als vom Personalgesetz gefordert.
  2. Die schulformspezifischen Differenzen in der Jahresarbeitszeit sind eher gering, die individuellen Unterschiede dagegen hoch. Innerhalb einer Schulform arbeiten die Lehrkräfte "höchst unterschiedlich lang".
  3. Teilzeitarbeitskräfte arbeiten deutlich mehr, als ihr Anstellungsgrad verlangt.
  4. Eine Reduktion der Pflichtlektionen führt nicht zu einer Reduktion der Arbeitszeit. Vielmehr verwenden die Lehrkräfte dann grössere Zeiteinheiten in die einzelnen Tätigkeiten.
  5. Lehrkräfte in Leitungsfunktionen arbeiten in allen Schulformen signifikant mehr, eine höhere Belastung ist auch bei Lehrkräften feszustellen, die an der Schulentwicklung beteiligt sind.

Insgesamt lässt sich festhalten: Im Mittelpunkt der Arbeit der Lehrkräfte stehen die unterrichtsbezogenen Tätigkeiten. Für Lehrerinnen und Lehrer an Mittelschulen bedeutet das, Fächer mit wissenschaftlichem Anspruch zu unterrichten und darauf bezogen Leistungen zu bewerten. Sie haben einen weit höheren Aufwand im Bereich der Korrekturen, Prüfungen und Notengebung als andere Kategorien. Dafür steht deutlich zu wenig Zeit zur Verfügung, während der tatsächliche Arbeitsaufwand eher unter- als überschätzt wird. Alles, was den Aufwand steigert, ohne den Ertrag zu verbessern, wird in dieser Praxis keine Verwendung finden. Meine abschliessenden Ueberlegungen, die Leistungsbeurteilungen als Chance der Schulentwicklung zu verstehen, haben diese Voraussetzung.

 

3. Leistungsbeurteilung und Schulentwicklung

Das historische Notensystem ist überwiegend ein Fünferschema. Auffälligist dieser Befund, weil auch in einem Sechsersystem faktisch nur fünf Notengenutzt werden. Der "Gothaer Schulmethodus" von 1685 sah zum erstenMale ein einheitliches Schema für die Unterrichtsgegenstände vor. Gleichzeitigsollten Ingenium und Mores, also die Geistesgaben und das sittliche Verhalten,der Schüler beurteilt werden. Für das Ingenium genügten vier Stufen, diebeiden anderen Bereiche sollten mit dem Fünfersystem bewertet werden.

Ingenium Unterrichtsgegenstände Mores
Sehr fein fein fromm
Gut fertig fleissig
Ziemlich ziemlich still
Schlecht etwas/wenig unfleissig

schlecht ungehorsam

Offenbar ist dieses Schema, zeitgemäss verändert, geeignet Leistungs- undVerhaltensdifferenzen innerhalb einer bestimmten, grösseren Lerngruppe zubeschreiben. Die vergleichsweise intensive Forschung hat bislang keineAlternativen geliefert, die praktikabler wären. Ein allein auf Lehrerurteilegestütztes selektives Schulsystem gilt in der Literatur als "dysfunktional"(Langfeldt/Tent 199, S. 77), aber Vorschläge etwa derart, Zeugnisse als"entwicklungsbezogene Berichte" aufzufassen (ebd., S. 80) oder ingrösserem Masse Leistungstests einzusetzen, haben sich bislang nichtdurchgesetzt. Standardisierte Tests wie in England, die verknüpft sind mitInspektoraten, erhöhen den statistischen Wert der Prüfungen, aber zugleichauch den Stress der Lehrkräfte (Travers/Cooper 1996), die auf permanentePrüfungen hin, die nicht sie selbst bestimmen, unterrichten müssen.Andererseits helfen auch allgemeine Hinweise auf die gesellschaftlichen Risikenschlechter Noten nicht recht weiter (Grünig u.a. 1999, S. 78ff.). Eher ist dieglobale Notenkritik selbst ein Belastungsfaktor für die Lehrkräfte, weil siegesagt bekommen, was sie falsch machen, ohne zugleich gesagt zu bekommen, wie esunter den gegebenen Umständen besser gemacht werden kann.

Die meisten Vorschläge, die die Lehrkräfte als "Diagnostiker"(Jäger 2000) aufwerten und ihnen zusätzliche Aufgaben aufbürden, erhöhen nurden Aufwand, ohne die reale Zeitverteilung in Rechnung zu stellen. Nach denvorliegenden Schweizer Daten konzentriert sich die Jahresarbeitszeit derLehrkräfte mit durchschnittlich zwischen 80 und 90 Prozent auf dieunterrichtsbezogenen Tätigkeiten. Den verbleibenden Rest einer starkgestressten Zeit müssen sich Betreuung und Beratung, Weiterbildung oderGemeinschaftarbeit und alles übrige teilen (Landert 1999). Es ist dann ziemlichgrotesk, Listen mit allerlei diagnostischen Tätigkeiten zu lesen, dieungewichtet sind und die zeitliche Belastungen unberührt lassen (Jäger 2000,S. 101). Das Grundproblem von Aufwand und Effekt ist nicht gelöst, zumal nichtin einem Berufsfeld, das vom individuellen Engagement lebt und sich inzeitlicher Hinsicht nicht standardisieren lässt. Wer die erhöhte Arbeitszeitkünstlich beschränkt, gefährdet den Schulerfolg. Auf der anderen Seitemüssen, ich wiederhole diesen zentralen Punkt, Reformvorschläge daraufhinüberprüft werden, ob sie die Belastungen erhöhen, ohne den Effekt zuverbessern. Wer, wie im Trendbericht der SKBF beschrieben (Vögeli-Mantovani1999, S. 78), gleichgewichtige Aussagen über

  • Sozialform
  • kriteriale Norm und
  • Individualnorm

machen soll, muss über viel zusätzliche Zeit, geeignete Instrumente undviel Geduld bei der Auswertung von aufwendig erhobenen Daten verfügen, ohnedass gewiss wäre, ein besseres Resultat zu erzielen.

Chancen für die Schulentwicklung ergeben sich erst dann, wenn nicht derideale Notengeber vor Augen steht, den die Kritik zugleich voraussetzt undablehnt, sondern wenn die Bedingungen des Praxisfeldes kalkuliert werden.Versteht man unter "Noten" die Beschreibung von Leistungen im Blickauf Aufgaben während einer bestimmten Periode der Beurteilung, dann stellensich eigentlich nur drei wirkliche Probleme:

  1. Wie vergleichbar sind die Aufgaben?
  2. Wie transparent sind die Beurteilungen?
  3. Wie berechnet sich die Lernzeit und so die Chance, die Aufgabe zu lösen?

An der Kritik der Zensurengebung ist der Hinweis gerechtfertigt, dass Notensich auf ein "klasseninternes Bezugssystem" beziehen und aberAllgemeingültigkeit beanspruchen. Eine "Fünfeinhalb" in Englischoder Mathematik kann an verschiedenen Orten verschiedenes bedeuten undinsbesondere mit einem verschiedenen Leistungsstand verbunden sein. Das Problemlässt sich nie ganz auflösen, wohl aber reduzieren, indem Standardseingeführt werden und die Notengebung bestimmen. Bis heute beziehen sich Notennicht auf festgelegte Inhalte, sondern zumeist auf die Stoffverteilung imProgramm einer bestimmten Lehrkraft. Das ist gesetzeskonform, denn auch imPromotionsreglement für die Gymnasien des Kantons Zürich ist davon keine Rede.Aber es wäre ein Stück Schulentwicklung, die Inhalte anzupassen und Aufgabenvergleichbbar zu bestimmen, denn immerhin verhelfen die Noten zu gleichenBerechtigungen.

Im Promotionsreglement wird bestimmt, dass die Lehrperson die Klasse"über die Art der Leistungsbeurteilung" im Fach informiert(Promotionsreglement § 7, 2). Transparent sind Beurteilungen aber nur dann,wenn zugleich das Lernpensum kalkuiert werden kann, und dies vor Beginn derBeurteilungsperiode. Die Fächer müssten die Anforderungen an die Schülerabstimmen, die dann individuell ihren eigenen Lernaufwand, von dem derLernerfolg massgeblich abhängig ist, abklären und einteilen könnten. Nachunseren Daten geschieht das heute zumeist nicht. Die Schüler kennen nicht nurdie lehrerspezifischen Beurteilungsstrategien nicht, ausgenommen, was sie davonim Unterricht erleben, sie wissen vor allem nicht, was im Beurteilungszeitraumgenau auf sie zukommt. Hier wären transparente Programme mit möglichstrealistischer Zeiterwartung zu entwickeln.

Die Notenpraxis wird vermutlich auf absehbare Zeit das Fünferschema nichtüberwinden. Es kommt eher darauf an, möglichst präzise zu fassen, was Notenin bestimmten Fächern im Blick auf welche Standards genau beschreiben sollen.Auch das fehlt überwiegend. Die Praxis der Notengebung ist eine der einzelnenLehrkräfte, die die Noten nach eigenem Urteil festlegen, ohne sich in der Regelmit Anderen auszutauschen. Notenagenturen ausserhalb der einzelnen Schuleverbessern das Resultat vermutlich nicht, weil Noten sich auf fortlaufendeLeistungen beziehen, die am Ende unter dem Eindruck der Beurteilungsperiodegesamthaft bewertet werden. Ein Resultat der Forschung war, dass Lehrkräftedieses Geschäft recht gut beherrschen, so dass hier auch die Entwickungeinsetzen muss. Daher ist nicht die "implizitePersönlichkeitstheorie" das Problem, die nicht zu vermeiden ist und abervermutlich weit mehr Vorteile hat, als die Forschung zugesteht; vielmehr wird esdarum gehen, das Engagement des Notengebers und seine Kompetenz zu nutzen undzugleich die Gefahr grosser Streuungen zu begrenzen. Das gelingt am besten durchklar formulierte Standards oder Bezugsnormen, und zwar sowohl der Inhalte alsauch der Noten selbst. Vor allem hier ist Entwicklung nötig, die abrückt vomeinfachen Gegensatz: "Noten oder nicht?"

Die gegenwärtigen Tendenzen auf Volksschul- und Sekundarschulstufe zeigen imübrigen, dass das Notenprinzip längst nicht mehr in der Absolutheit gilt, diedie Kritik unterstellt (Vögeli-Mantovani 1999, S. 89ff.). Inzwischen gibt esnicht nur "Noten",

  • sondern Noten mit und ohne explizite Bezugsnormen,
  • Lernberichte,
  • fakultative wie nicht-fakultative Beurteilungsgespräche,
  • Orientierungsarbeiten zur Standortbestimmung,
  • Selbstbeurteilungen der Schülerinnen und Schüler,
  • Zeugnisse mit lernzielbezogenen Wortetiketten,
  • Zeugnisse mit lernzielbezogenen Wortetiketten für Beurteilung des Lernprozesses und der Leistung

In Basel gibt es "prognostische Noten" erst ab der sechsten Klasse,reguläre Noten erst nach dem Uebertritt in der achten Klasse. In Baselland gibtes reguläre Noten ab der sechsten Klasse, zuvor wahlweise Noten oderLernberichte. Im Aargau gibt es reguläre Noten ab dem zweitenBeurteilungszeitraum der ersten Klasse, in Bern werden bis zur sechsten KlasseBeurteilungsgespräche geführt, Lernberichte erstellt und in der dritten sowiesechsten Klasse lernzielorientierte Noten erteilt. In Solothurn sind die erstendrei Jahrgänge notenfrei, in Freiburg gibt es Verbalzeugnisse, Lernberichte undBeurteilungsgespräche von der ersten Klasse an. Diese Entwicklung zeigt, dassin Zukunft eher die Wahrung des Notenschemas das Problem ist, weil Teile derSchulreformdiskussion die Meinung von Karlheinz Ingenkamp übernommen hat,wonach Noten und Zeugnisse an sich höchst fragwürdige Phänomene seien unddaher abgeschafft oder ersetzt werden müssten.

Der Ersatz ist immer eine Reduktion, meistens von Leistungsanforderungen, diemit dem Verzicht auf Noten ihre Klarheit verlieren und mit endlosenDifferenzierungen immer neue Aequivalente erzeugen. Letztlich geht es bei dieserEntwickung um die Frage, ob eine selektive Leistungsschule gewollt ist odernicht. Ist sie gewollt, verlangt sie möglichst eindeutige Systeme derBeschreibung und Beurteilung von Leistungen, also weder des Charakters noch derPerson, sondern im Blick auf das, was Lehrkräfte offenbar gut können, nämlichdie Verteilung der individuellen Leistungsfähigkeit im Blick auf ihre Klasse,vorausgesetzt Bezugsnormen, die den Rahmen einer bestimmten Klassenübersteigen, also inhaltliche Standards darstellen. Dass Urteile fehlbar sind,ist trivial; aber offenbar ist das nicht das Problem. Vielmehr wäre zu fragen,wie die Praxis der Notengebung organisiert ist und wie sie verbessert werdenkann. In diesem Sinne ist Notengebung eine Chance der Schulentwicklung. Das giltinsbesondere dann, wenn die Urteile objektive Unterstützung erfahren und sichauf anerkannte Fachnormen beziehen können.

Literatur

Bobertag, O.: Leistungsschätzung und Leistungsmessung in der Volksschule.In: Zeitschrift für Pädagogische Psychologie 34 (1933), S. 377-393.
De Groot, A.D.: Fünfen und Sechsen. Weinheim 1971.
Döring, O.: Untersuchungen zur Psychologie des Lehrers. Leipzig 1925.
Flammer, A.: Zur Definition der Notenskala. In: Schweizerische Zeitschrift fürPsychologie 30 (1971), S. 204-218.
Forneck, H.J./Schriever, F.: Die individualisierte Profession. Untersuchung derLehrer/ -innenarbeitszeit und -belastung im Kanton Zürich. Ms. Zürich 2000.
Grey, C.F.: Variations in the Grades of High School Pupils. Baltimore 1913.
Grünig B. u.a.: Leistung und Kontrolle. Die Entwicklung von Zensurengebung undLeistungsmessung in der Schule. Weinheim/München 1999. (= Erziehung im Wandel.Hrsg.v. H. Rauschenberger, Bd. 4)
Haecker, H.: Subjektive Faktoren im Leistungsurteil der Lehrer. In: Schule undPsychologie 18 (1971), S. 74-84.
Hofer, M.: Die Validität der impliziten Persönlichkeitstheorie von Lehrern.In: Unterrichtswissenschaft Heft 2 (1975), S. 5-18.
Hopp, A.-D./Lienbert, G.A.: Eine Verteilungsanalyse von Gymnasialzensuren. In:Kh. Ingenkamp (Hrsg.): Die Fragwürdigkeit der Zensurengebung. Texte undUntersuchungsberichte. 6., überarb. u. erw. Aufl. Weinheim/Basel 1976, S.250-263.
Huberman, M.: Das Selbstkonzept. Eine Untersuchung über die Wirkung von Noten,Ranglisten und Preisen auf Kinder der Genfer Primarschule. Genève: FAPSE 1980.
Ingenkamp, Kh.: Zur Problematik der Auslese und ihrer Bewährungskontrolle. In:Kh. Ingenkamp (Hrsg.): Pädagogisch-psychologische Untersuchungen zum Uebergangauf weiterführende Schulen. Weinheim 1963, S. 7-54.
Ingenkamp, Kh. (Hrsg.): Die Fragwürdigkeit der Zensurengebung. Texte undUntersuchungsberichte. 6., überarb. u. erw. Aufl. Weinheim/Basel 1976. (ersteAufl. 1971)
Jäger, R.S.: Von der Beobachtung zur Notengebung. Ein Lehrbuch. Diagnostik undBenotung in der Aus- Fort- und Weiterbildung. M. e. Beitrag v. U. Lissmann.Landau 2000.
Krampen, G.: Effekte von Lehrerkommentaren zu Noten bei Schülern. In: R.Olechowski/E. Persy (Hrsg.): Fördernde Leistungsbeurteilung. Wien/München1987, S. 297-227.
Langfeldt, H.P./Tent, L.: Pädagogisch-psychologische Diagnostik. Band 2:Anwendungsbereiche und Praxisfelder.Göttingen/Bern/Toronto/Seattle 1999.
Landert, Ch.: Die Arbeitszeit von Lehrpersonen in der Deutschschweiz. Zürich1999.
Mummert+Partner: Untersuchung zur Ermittlung, Bewertung und Bemessung derArbeitszeit der Lehrerinnen und Lehrer im Land Nordrhein-Westfalen. Bd. I/II.Düsseldorf 1999.
Peters, R.S.: What is an Educational Process? In: R.S. Peters (Ed.): The Conceptof Education. London: Routledge&Kegan Paul 1967, S. 1-23.
Prinz von Hohenzollern, J.G./Liedtke, M. (Hrsg.): Schülerbeurteilungen undSchulzeugnisse. Historische und systematische Aspekte. Bad Heilbrunn/Obb. 1991.(= Schriftenreihe zum Bayerischen Schulmuseum Ichenhausen, hrsg. v. BayerischenNationalmuseum, Bd. 10)
Promotionsreglement für die Gymnasien des Kantons Zürich vom 10. März 1998.
Rank, Th.: Schulleistung und Persönlichkeit. München 1962.
Rheinberg, F.: Leistungsmessung und Lernmotivation. Göttingen 1980.
Richter, S.: Unterschiede in den Schulleistungen von Mädchen und Jungen.Geschlechtspezifische Aspekte des Schriftsprachenerwerbs und ihreBerücksichtigung im Unterricht. Regensburg 1996.
Rosenthal, R./Jacobson, L.: Pygmalion im Unterricht. Lehrererwartungen undIntelligenzentwicklung der Schüler. Weinheim 1971.
Sacher, W.: Praxis der Notengebung. Hilfen für den Schulalltag. Bad Heilbrunn/Obb.1984.
Sauer, J./Gamsjäger, E.: Ist Schulerfolg vorhersehbar? Die Determinanten derGrundschulleistung und ihr prognostischer Wert für den Sekundarschulerfolg.Göttingen/Bern/Toronto/Seattle 1996.
Schönwälder, H.-G./Plum, W.: Pädagogische Arbeit der Lehrer und Lehrerinnen– terra incognita der Bildiungspolitik! Bericht über eineExpert(innen)-befragung in Nordrhein-Westfalen, Bremen, Münster. Ms. GEWNordrhein-Westfalen. Düsseldorf 1998.
Schrader, F.-W.: Lern- und Leistungsdiagnostik im Unterricht. In: F.E. Weinert(Hrsg.): Psychologie des Unterrichts und der Schule.Göttingen/Bern/Toronto/Seattle 1997, S. 659-699.
Schreiber, H.: Gegen Prüfugen und Noten. In: Zeitschrift für Philosophie undPädagogik 6 (1899), S. 31-38.
Tent, L.: Die Auslese von Schülern für weiterführende Schulen. Göttingen1969.
Travers, C.J./Cooper, C.L.: Teachers under Pressure. Stress in the TeachingProfession. London/New York: Routledge 1996.
Ulshöfer, R.: Zur Beurteilung von Reifeprüfungsaufsätzen. In: DerDeutschunterricht 1 (1949), S. 84-102.
Ulbricht, H.: Wortgutachten auf dem Prüfstand. Eine empirische Untersuchung zurverbalen Beurteilung in der 1. und 2. Klasse der Grundschule mittelsElternbefragung und Zeugnisanalyse. Münster/New York 1993.
Vögeli-Mantovani, U.: Mehr fördern, weniger auslesen. Zur Entwicklung derschulischen Beurteilung in der Schweiz. Aarau 1999. (= SKBF Trendbericht, Nr. 3)
Weidig, E.R.: Die Bewertung von Schülerleistungen. Weinheim 1961.
Weinert, F.E. (Hrsg.): Leistungsmessungen in Schulen. Weinheim/Basel 2001.
Weise, G.: Leistungsmessung. In: J. Petersen/G.-B. Reinert (Hrsg.):Pädagogische Positionen. Ein Leitfaden für Lehrer aller Schulen. 2. Aufl.Donauwörth 1990, S. 216-230.
Weiss, R.: Zensur und Zeugnis. Beiträge zu einer Kritik der Zuverlässigkeitund Zweckmässigkeit der Ziffernbenotung. Linz 1965. (= WissenschaftlicheVeröffentlichungen des Bundes in Oberösterreich, Bd. 3)
Wolf, K.: Die Gerechtigkeit des Erziehers. München 1962.
Ziegenspeck, J.: Handbuch Zensur und Zeugnis in der Schule. HistorischerRückblick, allgemeine Problematik, empirische Befunde und bildungspolitischeImplikationen. Ein Studien- und Arbeitsbuch. Bad Heilbrunn/Obb. 1999.

 

 

 

 Übersicht Notengebung

 


Home | Profil | Aktuell | Kalender | SO
Themen | Presse | Archiv | Links | Kontakt