Numéro Un
Retrouvez le numéro un de
Third : qui gouverne les
algorithmes ?
Retrouvez le numéro un de
Third : qui gouverne les
algorithmes ?
Le 30 octobre 2017, Frédérique Vidal, ministre de l’enseignement supérieur de la recherche et de l’innovation et Jean-Michel Blanquer, ministre de l’Éducation Nationale, présentaient les grandes lignes du « Plan Étudiant ». Au coeur de ce nouveau dispositif, une mesure phare allait faire l’effet d’une mini-révolution : la suppression du système d’affectation Admission Post-bac (APB) au profit d’une nouvelle plateforme appelée « Parcoursup ». Derrière ces décisions politiques c’est une véritable refonte du système technique que venait d’annoncer le Ministère. APB et Parcoursup sont deux exemples concrets et aux conséquences cruciales de l’impact que prennent les algorithmes dans notre quotidien.
Retour sur ce feuilleton de l’enseignement supérieur aux multiples rebondissements.
Soyons clair dès le début : APB fonctionnait mal. Très mal. Son défaut principal était le manque total de transparence lié aux algorithmes régissant la plateforme. Créé en 2007, APB proposait un système d’affectation fondé sur l’algorithme des mariages stables de Gale-Shapley.
D’un côté, les candidats formulent un certain nombre de voeux hiérarchisés dans des formations : ils trient leurs choix selon un ordre de préférence. De l’autre, les formations trient les candidatures selon des critères qui leur sont propres. L’algorithme reçoit ensuite ces deux listes (celles des candidats et celles des formations) et réalise l’affectation des candidats à la meilleure des formations qu’ils peuvent obtenir. Ce processus s’appelle un « algorithme d’affectation ».
Très vite, deux catégories de formations virent le jour. D’un côté, les formations sélectives (prépas, BTS, DUT) et, de l’autre, les formations non-sélectives (les licences universitaires). Au début des années 2010, ce processus fonctionne plutôt bien et permet de faciliter considérablement le travail de toutes les universités/ écoles. Mais bien vite la plateforme se heurte à un problème de taille : le manque de place dans les établissements de formation supérieure.
Si du côté des lycéens et de l’opinion publique, il est tout à fait admis que des candidats puissent être refusés par des formations sélectives, on comprend moins pourquoi certaines facultés, en sureffectif, se mettent aussi à refuser des candidats.
En réalité, pour les facultés ne pouvant accueillir l’intégralité des candidats, un nouvel algorithme dit « algorithme de tri » a été mis en place pour classer les candidats. Pour les formations ayant les capacités d’accueillir tout le monde, cet algorithme est totalement invisible et n’a aucun impact. Mais pour les formations en surcapacité il opère une véritable sélection des candidats sur des critères non transparents.
Bien vite, on apprend qu’un tirage au sort est implémenté au sein de cet algorithme et permet de départager les candidats. Pour tenter d’en savoir plus sur les critères utilisés par l’algorithme d’APB, l’association « Droit des lycéens » lance plusieurs actions en justice pour obtenir la publication des algorithmes. Dans un premier temps, le ministère oppose une fin de non recevoir et refuse formellement la publication de ces algorithmes. Mais en octobre 2016, une décision de justice contraint le gouvernement à la publication de ces algorithmes.
C’est donc un document de 20 pages qui est envoyé à l’association. Commence alors un travail de fourmi pour tenter de décrypter le fonctionnement de cet algorithme de tri. De cette analyse, trois critères de tris sont extraits : (i) la proximité géographique des candidats avec la formation à laquelle ils candidatent, (ii) l’ordre dans lequel ils ont classé leurs voeux (plus ils classent une formation non-sélective haut dans leur liste, plus ils ont de chances d’y être acceptés) et (iii) en ultime recours, d’un chiffre aléatoire qui leur est attribué et qui fait office de tirage au sort.
Mais d’autres critères bien plus opaques apparaissent. Par exemple, les élèves issus de lycées français de l’étranger sont considérés par le système comme des « VIP » et sont directement classés en tête de liste sur APB. Autre critère contestable, les élèves en réorientation sont, eux, directement classés en bas de liste.
Par ailleurs, le fait de prendre en compte l’ordre des voeux des candidats pour les classer dans la liste biaise totalement le rapport des candidats avec le classement qu’ils opèrent. Sur APB, il ne faut pas classer ses voeux selon ses aspirations mais selon une stratégie pour « plaire à l’algorithme ».
Ces quelques éléments suffisent à jeter un discrédit total sur la plateforme et ils seront employés à loisir par le gouvernement Macron qui vient d’accéder au pouvoir en mai 2017. Le tirage au sort est d’ailleurs agité comme un chiffon rouge pour discréditer la plateforme APB. On découvrira plus tard via un rapport de la Cour des comptes qu’il n’avait en fait pénalisé que 2.000 candidats durant la session 2017 d’APB (soit 0,8% du nombre de candidats total).
Qu’importe. Il restera l’un des arguments majeurs des opposants à APB.
Héritant d’une plateforme au fonctionnement controversé, Frédérique Vidal doit faire face à l’été 2017 au « scandale des candidats sans fac » qui fait la une de la presse : dans les médias, de nombreuses victimes d’APB défilent pour dénoncer l’injustice de l’algorithme.
En octobre 2017, la mort d’APB est annoncée et un nouveau système fait son apparition : Parcoursup.
Deux éléments majeurs distinguent cette nouvelle plateforme de l’ancienne. D’une part, toutes les formations, qu’elles soient sélectives ou non-sélectives, s’occupent désormais de trier ellesmêmes les candidats. C’est la fin des algorithmes de tri et du tirage au sort. D’autre part, les candidats ne doivent plus hiérarchiser leurs voeux, ce qui entraine la fin des algorithmes d’affectation. Là où auparavant les candidats ne pouvaient obtenir qu’une proposition d’admission par tour, ils pourront désormais obtenir jusqu’à 10 propositions d’admission et disposeront d’un délai pour accepter l’une des propositions.
Le sujet de la non transparence de Parcoursup demeure néanmoins au coeur des débats. Une semaine encore avant l’ouverture de Parcoursup, personne ne sait ni comment les candidats ont été triés, ni comment le système fonctionne.
Le 21 mai 2018, le ministère publie à la veille de l’ouverture de Parcoursup le « code informatique des algorithmes de Parcoursup ». Il s’agit d’une quarantaine de fichiers informatiques et d’une documentation technique de 18 pages qui permettent de plonger au coeur du fonctionnement de Parcoursup.
Ces algorithmes permettent de mieux comprendre le fonctionnement de Parcoursup. Dans un premier temps, les candidats effectuent un certain nombre de voeux dans des filières sélectives et non-sélectives sans les hiérarchiser. Dans un second temps, les formations reçoivent les candidatures de ces élèves et, qu’elles soient sélectives ou non-sélectives, les trient à l’aide d’un outil d’aide à la décision (nous y reviendrons). Dans une dernière étape, Parcoursup reçoit ces listes de candidats triés et envoie les propositions d’admission.
Les algorithmes publiés par le Ministère correspondent à cette dernière partie. Ce que l’analyse du code révèle, c’est que Parcoursup effectue un re-tri des listes fournies par les formations selon deux critères. Le premier critère concerne uniquement les formations non-sélectives. Il s’agit d’un taux maximum d’élèves hors de la zone académique de la formation qui peuvent être acceptés. Concrètement, chaque formation ne peut recevoir plus d’un certain pourcentage de candidats non-issus de sa zonegéographique. Au-delà de cette capacité maximale, Parcoursup classe automatiquement les candidats en bas de liste.
Arrêtons-nous un instant sur ces pourcentages. Dans ses communications officielles, le Ministère assurait que ces pourcentages seraient publiés sur le site pour chaque formation. Pourtant, rien n’a été communiqué aux candidats et aux observateurs.
L’autre critère de re-tri des listes concerne, lui, à la fois les formations sélectives et les formations non-sélectives. Il s’agit d’un taux minimum de boursiers à respecter dans chaque formation. Concrètement, les formations ne respectant pas ce taux minimum ont vu remonter dans leur liste des candidats boursiers. Si cette fois les taux de boursiers étaient bien affichés sur le site de Parcoursup, une opacité totale demeure quant à la manière dont ils ont été fixés.
Reste que cet algorithme, s’il permet d’en savoir plus sur le fonctionnement général de la plateforme, ne dévoile en fait qu’une minuscule gouttelette de la plateforme. Ce qui n’a pas été publié, ce sont les critères locaux utilisés par les formations pour trier les candidats. Souvenons-nous que la nouveauté de Parcoursup était la suppression de l’algorithme de tris au profit d’un classement effectué formation par formation.
Et c’est là l’un des gros points noirs de Parcoursup. Le Ministère a mis à disposition de chaque formation un outil d’aide à la décision, sorte de grand fichier excel permettant d’insérer un certain nombre de critères pour distinguer les candidats les uns des autres. Mais dans les faits, les formations étaient libres d’utiliser, ou non, cet outil et de trier les candidats comme elles le souhaitaient. Frédérique Vidal a précisé, tout au long de la procédure et au moment du bilan, que ces critères locaux, appelés parfois à tort « algorithmes locaux », ne seraient pas publiés et ce malgré les requêtes de syndicats, de politiques, de professeurs et d’élèves.
C’est donc une transparence en trompe-l’oeil qu’opère Parcoursup. Divulguer certaines données ne présentant aucun intérêt stratégique mais laisser un voile opaque sur le fonctionnement critique de la plateforme.
L’autre enjeu majeur et point de débat de cette nouvelle plateforme, c’est la décision de supprimer la hiérarchisation des voeux de la plateforme. Pour justifier cette décision, le ministère emploie un argument majeur : le classement des voeux était trop compliqué sur APB. Selon la Ministre, les élèves ne faisaient pas des classements selon leur préférence et s’autocensuraient pour être sûrs d’obtenir une formation.
Avec Parcoursup, le paradigme a totalement évolué. Désormais, ce sont les formations elles-mêmes qui trient les candidats et il n’y a plus d’algorithme qui prend pour donnée d’entrée l’ordre des voeux des candidats. Une hiérarchisation des voeux serait donc totalement envisageable sans qu’elle n’ait aucun impact sur les chances des candidats d’être admis dans une formation.
Mais pourquoi, au fond, cette question de la hiérarchisation des voeux cristallise-t-elle autant les débats ? C’est parce que la fin de la hiérarchisation des voeux a signifié la fin de l’algorithme d’affectation qui permettait d’affecter rapidement et automatiquement les candidats au meilleur des voeux qu’ils pouvaient obtenir.
Dans son rapport d’octobre 2017, la cour des comptes précise que tout système d’affectation dans le supérieur qui ne se baserait pas sur une hiérarchisation des voeux serait « sous-optimal ». Et c’est effectivement cette sous-optimalité que l’on a pu observer tout au long de l’été. Au premier jour de Parcoursup, 50% des candidats étaient sur liste d’attente. Car les candidats avec les meilleurs dossiers ont pu obtenir jusqu’à 10 propositions d’admission dès le premier jour quand tous les autres candidats patientaient en-dessous. Le système s’est décanté lentement tout au long de l’été, mais il a engendré un certain nombre de comportements irrationnels de la part des candidats. Certains gardaient des voeux en attente alors qu’ils avaient déjà obtenu une formation qui les intéressait. D’autres candidats n’ont pas eu le temps ou la patience d’attendre suffisamment longtemps et sont donc passés à côté de leur formation préférée qu’ils auraient pu obtenir au mois d’août.
Le bilan de Parcoursup reste encore très difficile à décrire. Quelques éléments chiffrés peuvent tout de même éclairer. Au jour de la rentrée étudiante, 3.500 bacheliers étaient toujours en attente selon le Ministère. Mais quand on se plonge davantage dans les chiffres, on se rend compte que ce bilan minore la réalité. A côté de ces 3.500 candidats, près de 4.000 candidats actifs en réorientation et 29.000 candidats inactifs demeuraient. Soit au total 46.000 candidats toujours en attente partout en fin de procédure.
Les pistes d’amélioration évoquées par le Ministère ne semblent pas remettre en cause les dogmes algorithmiques qu’il s’était imposé. Malgré quelques protestations de chercheurs, universitaires et politiques, un retour à une hiérarchisation des voeux est totalement exclu par le Ministère. Il y aura donc toujours autant de candidats en attente dès le premier jour de la nouvelle mouture de Parcoursup. À moins… à moins que toutes les formations ne commencent à pratiquer de manière intense le surbooking ; accepter plus de candidats que de places disponibles, pour accélérer les réponses des candidats. Une solution qui paraît peu souhaitable pour les effectifs des formations.
En guise de conclusion, je vous propose une ouverture réflexive. La première devrait titiller l’esprit des juristes lisant ces pages. Cette année, le Ministère a donné plus de détails sur les recours possibles face aux décisions de Parcoursup. Les élèves refusés par une formation peuvent, dans un délai d’un mois, demander à une formation les raisons ayant conduit à son élimination. Les établissements sont obligés d’y répondre dans les meilleurs délais. Si la réponse ne satisfait pas les candidats, ils peuvent saisir un tribunal pour tenter d’obtenir, par voie judiciaire, une inscription en faisant condamner un établissement.
Mais si vous avez tout suivi jusqu’ici, vous devriez désormais savoir que Parcoursup effectue un tri supplémentaire des listes selon deux critères : un taux minimum de boursiers à avoir dans toutes les formations et un taux maximum d’élèves hors de la zone géographique. Ces deux critères induisent un retri des listes précédemment fournies par les établissements. Dès lors, les listes des écoles ne sont pas les mêmes que celles que Parcoursup prend en compte dans l’envoi des propositions d’admission aux candidats. D’où cette question : en cas de condamnation d’un établissement suite à une plainte d’un candidat qui sera vraiment responsable ? L’établissement, qui a fait un pré-tri ? Ou le Ministère, dont l’algorithme effectue le tri final et bouleverse la liste des candidats ?