Pourquoi les évaluations nationales n’ont pas marché en Grande Bretagne ? D’après Paul Black (4) Une surcharge excessive et une déconsidération du rôle des enseignants

En 1990 et 1991, les premiers essais à grande échelle des nouvelles évaluations standardisées pour les enfants de 7 ans ont eu lieu. Contrairement aux tests chronométrés de courte durée, ils exigeaient beaucoup de préparation et d’organisation de la part des enseignants. Pour beaucoup de ceux qui n’avaient jamais planifié un travail thématique avec des objectifs clairs servant à évaluer l’apprentissage des élèves, les tests étaient à la fois exigeants et perturbants. Cela s’explique en partie par le fait que les concepteurs évaluations standardisées n’avaient pas eu suffisamment de temps pour mettre à l’essai un nouveau type d’exercice et ajuster le niveau de la demande, et en partie par le fait que le temps et les ressources nécessaires pour préparer les enseignants – qui n’avaient jamais participé à des examens publics auparavant – à ces exercices assez novateurs étaient insuffisants.

De nombreux enseignants du primaire se sont plaints de la méconnaissance et de la charge de travail et ont reçu beaucoup d’attention de la part des médias ; leurs préoccupations ont été utilisées par ceux qui s’opposaient à la stratégie dans son ensemble pour plaider en faveur d’un retour aux tests antérieurs. D’autres, qui ont reçu moins d’attention, ont accueilli les tests parce qu’ils les considéraient comme un modèle pour améliorer la conception de leur enseignement. Un an plus tard, les premiers tests pour les jeunes de 14 ans reçurent une attention similaire, bien que les enseignants du secondaire aient été plus favorables aux aspects inhabituels des tests, peut-être en raison de leur participation aux développements de l’évaluation dans la préparation des nouveaux programmes des lycées en 1988.  

Toutefois les difficultés techniques étaient considérables. Les séquences de progression spécifiées par les énoncés en termes de niveaux dans les programmes scolaires étaient basées sur très peu de preuves empiriques. Les problèmes sont devenus évidents lorsque de nombreux élèves ont réussi, par exemple, un énoncé de niveau 6 alors qu’ils échouaient à l’énoncé de niveau 4 (inférieur) dans le même sujet. Il y avait également des problèmes de fiabilité, car les tests devaient permettre d’évaluer le niveau de réussite de chaque élève dans plusieurs domaines, mais pas dans la totalité, avec un temps de test limité et sans la possibilité de vérifier la cohérence entre les différents domaines, et encore moins de les modifier.

En même temps, les évaluations par les enseignants sont également devenues un problème. Ces derniers se sont largement plaints du fait que la charge de travail supplémentaire que représentait l’évaluation leur enlevait du temps d’enseignement. Des enquêtes ont montré que de nombreux enseignants du primaire avait  » fait  » leur évaluation sur une période d’environ 3 semaines peu avant la mise en place évaluations standardisées. Selon eux, l’évaluation standardisée n’était qu’une charge Cela renforçait la dimension de l’évaluation sommative sans rapport avec l’apprentissage des élèves. Une enquête révélait l’émergence de trois types de réponses des enseignants dans les écoles primaires. Quelques-uns procédaient à de véritables évaluations formatives, passant en revue les résultats de tous les élèves environ une fois par semaine afin d’établir des progressions pour la semaine suivante. D’autres étaient devenus des « copies-conformes », recueillant et conservant les données mais n’en faisant que peu usage pour ajuster leur enseignement aux élèves. Ces enseignants se plaignaient du fardeau de l’évaluation parce que, pour eux, il s’agissait effectivement d’un supplément inutile à leur travail. Un troisième groupe ignorait l’ensemble de l’affaire, soit en la considérant comme une imposition arbitraire qui ne devrait pas être autorisée à perturber leurs propres pratiques, soit en jugeant que les différends et les changements qui accompagnaient la nouvelle politique justifiaient l’inaction. Au fur et à mesure que s’élaboraient les cahiers des charges, il devenait évident que ces évaluations présentaient une lourdeur excessive pour les enseignants du primaire.

Source : Black, Paul J. « Performance assessment and accountability: The experience in England and Wales. » Educational evaluation and policy analysis 16.2 (1994): 191-203.