Accueil > Tous les numéros > N°25 - Dossier évaluation > * La docimologie ?

* La docimologie ?

dimanche 7 février 2010, par Greg

« Étude des épreuves », la docimologie (dokime, épreuve en grec) entend analyser les ressorts cachées de l’évaluation. À l’origine, cette nouvelle discipline, fondée par Henri Piéron en 1922, entendait explorer les arguments scientifiques permettant la remise en cause des schémas traditionnels d’enseignement. Elle centre son étude sur l’influence de l’évaluateur, l’influence de l’énoncé, les objectifs de l’évaluation et ses risques.

En 1930, le professeur Laugier effectue une expérience de multicorrection de copies d’agrégation d’histoire puisées dans les archives : 166 copies ont été corrigées par 2 professeurs travaillant séparément, sans connaître leurs appréciations respectives. Les résultats furent surprenants. La moyenne des notes du premier correcteur dépassait de près de deux points celle du second. Le candidat classé avant-dernier par l’un était classé second par l’autre. Les écarts de notes allaient jusqu’à 9 points. Le premier correcteur donnait un 5 à 21 copies cotées entre 2 et 14 par le second ; le second donnait un 7 à 20 copies cotées entre 2 et 11,5 par le premier. La moitié des candidats reçus par un correcteur était refusée par l’autre.
En 1932, la Commission Carnégie propose une expérience de multicorrection en prélevant, au hasard, cent copies dans les archives du baccalauréat à Paris. Ces copies furent distribuées à 6 groupes de 5 examinateurs. Les disciplines concernées étaient : le français, la philosophie, le latin, les mathématiques et la physique. Aucune copie ne reçut deux fois la même note. Une copie de français est notée 3 et 16 ; en philosophie et en latin l’écart maximum est de 12 points. Les mathématiques et la physique, réputées pour des sciences exactes, ne sont pas épargnées : l’écart maximum est respectivement de 9 et 8 points.
En 1975, l’Institut de recherche sur l’enseignement des mathématiques de Grenoble (Irem) entreprend une expérience analogue de multicorrection. Un échantillon de 6 copies photocopiées de mathématiques (niveau BEPC) est soumis à 64 correcteurs, avec un barème, très précis, sur 40 points. Les résultats confirment ceux de l’enquête précédente, effectuée 43 ans plus tôt. La dispersion des notes atteint près de 20 points.
Laugier et Weinberg ont montré que la double correction est illusoire. En effet, selon eux, il faudrait, pour obtenir une note « exacte » (une note « exacte » étant une moyenne de notes telle que l’adjonction d’une autre note ne modifie pas sensiblement cette moyenne) : 127 correcteurs en philosophie, 78 en composition française, 28 en anglais, 19 en version latine, 16 en physique, 13 en mathématiques.
Avec des enseignants de l’Irem de Reims, M. Jacques Nimier a fait corriger 20 copies de BEPC par 30 professeurs de mathématiques après l’établissement d’un barème, tandis que lui-même corrigeait également ces copie, mais sans les lire, en regardant l’écriture et la présentation. Le maximum de l’écart pour une même copie était de 11 points sur 20, sa note n’étant jamais à une extrémité !
À la demande d’enquêteurs anglais, un professeur de physiologie de la Faculté des sciences accepta 37 copies – dactylographiées et anonymes – qu’il avait corrigées trois ans et demi auparavant. Dans 7 cas seulement, il remit la même note au même devoir. Dans les
30 autres cas, il y eut des divergences comprises entre 1 et 10 points. L’admissibilité, avec ses nouvelles notations, aurait été modifiée ; la moitié des précédents admissibles aurait été refusée et
la moitié des refusés déclarée admissible.

Source principale : site personnel de Jacques Nimier