Pourquoi les évaluations nationales n’ont pas marché en Grande Bretagne ? D’après Paul Black (2) les recommandations du groupe national d’experts (TGAT)

Les neuf principales recommandations du groupe national d’experts peuvent être résumées comme suit :

1. L’évaluation nationale devrait être basée sur une combinaison d’évaluation par les enseignants et de tâches fixées à l’extérieur, appelées tâches d’évaluation standardisée (SAT).

2. L’objectif principal de l’évaluation, outre celui de l’évaluation à l’âge de 16 ans, devrait être de fournir un feed-back fréquent sur l’apprentissage des élèves afin que l’enseignement puisse s’adapter à leurs besoins (c’est-à-dire être formatif) ; en particulier, la composante évaluation des enseignants devrait être fondée sur une évaluation formative, et il était nécessaire soutenir le développement de l’évaluation formative par les enseignants.

3. Les évaluations aux quatre étapes de la scolarité devaient être interreliées ; pour ce faire, il était nécessaire que les spécifications du programme d’études ne soient pas simplement des objectifs finaux pour les différents niveaux de scolarité, mais des objectifs échelonnés selon un schéma de progression commun à tous les groupes d’âge.

4. Les programmes scolaires devaient être exprimés selon des critères de performance mais sans chercher à classer les élèves

5. Les différents thèmes principaux de chaque matière scolaire devraient être spécifiés dans un ensemble de critères rassemblés en 10 niveaux pour donner la progression attendue dans l’apprentissage dans la matière. Le niveau 2 devrait faire figurer les attentes pour l’enfant moyen de 7 ans, le niveau 3 devrait correspondre aux attentes pour un enfant moyen de 9 ans, et ainsi de suite tous les 2 ans, de sorte qu’un enfant moyen de 16 ans pouvait se situer entre les niveaux 6 et 7, laissant une marge pour permettre des résultats différents à tout âge.

6. Les résultats de l’évaluation dans chaque matière devraient être présentés en termes de résultats globaux et en petit nombre – de préférence pas plus de quatre – selon des composantes correspondant à profil pouvant représenter les différents domaines de réussite dans une matière. Par exemple, la lecture, l’écriture, l’expression orale et l’écoute pouvaient constituer trois composantes du profil en anglais ; le traitement des nombres et des données, l’espace et la forme, l’algèbre et les recherches mathématiques peuvent être quatre composantes en mathématiques. Le profil de l’élève dans chaque matière, plutôt qu’un seul résultat, devait être considéré comme le résultat le plus important sur le plan éducatif.

7. Les évaluations standardisées définies à l’extérieur de la classe ne devaient pas nécessairement être des tests écrits formels ; en fait, pour les plus jeunes, ils devraient ressembler davantage à des travaux de classe soigneusement conçus pour que les élèves produisent des écrits ou des oraux qui fournissent les preuves nécessaires selon les différentes composantes du profil. Les évaluations standardisées devaient être notées par les enseignants des élèves concernés.

8. Le résultat des évaluations nationales pour chaque enfant aux quatre étapes de la scolarité devrait être déterminé en combinant les résultats des évaluations standardisées et les évaluations des enseignants. La combinaison devrait se faire par une modération par groupe d’enseignants, chaque groupe ayant devant lui les résultats des évaluations standardisées pour chaque école, les résultats de l’évaluation des enseignants avec des échantillons de travail, et les résultats moyens nationaux pour les évaluations standardisées. Il était recommandé que les résultats des évaluations standardisées fixent les moyennes et les écarts pour chaque école mais que, dans ce cadre, les écoles déterminent par elles-mêmes les résultats pour chaque élève.

9. Les résultats ne devraient pas être publiés à l’âge de 7 ans ; pour les enfants plus âgés, les résultats individuels ne devaient être accessibles qu’aux parents et à l’élève, mais les résultats scolaires globaux pouvaient être publiés dans le cadre d’un rapport complet sur l’école et d’une déclaration de l’autorité locale à partir de l’interprétation des résultats par rapport au bassin d’emploi de l’établissement.

Ce rapport a suscité de nombreux débats. Dans l’ensemble, la profession enseignante l’a accueillie favorablement, en partie parce que les enseignants s’attendaient à quelque chose de bien pire. La première ministre Thatcher exprimé son malaise, et certains universitaires ont été critiques. En particulier, nombre d’entre eux ont critiqué le fait que ces évaluations nationales imposaient un modèle unique d’apprentissage à tous les élèves et dans toutes les matières. Ce n’était pas l’intention du TGAT : le groupe d’experts avaient l’intention d’utiliser le cadre d’une manière très souple. En fait, par-delà les débats et controverses, le groupe avait élaboré son propre modèle à partir de l’expérience des membres dans une grande variété d’initiatives et d’institutions d’évaluation. Leur objectif central était de respecter et de renforcer l’apprentissage des élèves et le rôle professionnel des enseignants, tout en soutenant une évaluation rigoureuse et valable pour satisfaire aux exigences légitimes de la responsabilité publique.

Source : Black, Paul J. « Performance assessment and accountability: The experience in England and Wales. » Educational evaluation and policy analysis 16.2 (1994): 191-203.

Fermer le menu
%d blogueurs aiment cette page :