Les bébés, ces génies de la statistique

Vous avez peut-être lu dans la presse ces jours-ci cette découverte incroyable: avec un peu d’entrainement, des babouins sont capables de distinguer  un vrai mot écrit en anglais d’un faux. Et ceci sans évidemment sans savoir lire et encore moins connaître le sens de ces mots.

On pourrait croire que les singes mémorisent simplement la forme visuelle des vrais mots et qu’ils finissent par savoir les distinguer des pseudo-mots qu’on leur présente. Mais cette explication est insuffisante, car les singes sont capables de distinguer un vrai mot d’un faux, même s’ils ne l’ont jamais vu auparavant! C’est donc du côté de la statistique qu’il faut rechercher l’explication. Selon Stanislas Dehaene (dont je vous ai parlé dans ce billet), l’apprentissage de la lecture se fait à force de voir se répéter certaines combinaisons de lettres, plus fréquentes que d’autres. L’expérience en question montre que les singes partagent avec nous une excellente capacité à repérer les régularités statistiques dans les groupes de lettres et qu’ils s’en servent pour deviner si un mot est correct ou pas. Cette découverte illustre le rôle essentiel  que joue notre don pour les statistiques pour apprendre à lire, à parler ou même à tirer des règles à partir de ce qu’on observe autour de soi…

La statistique pour se répérer dans le langage

Pendant longtemps on s’est demandé si les enfants apprenaient leur langue maternelle grâce à un sens inné de la grammaire (l’école de Chomski) ou par un simple effet de conditionnement appris, à force d’entendre certains mots associés à certains objets (c’est la théorie de Skinner, dont je vous ai parlé ici). Aujourd’hui, on penche de plus en plus pour une troisième voie, faisant intervenir la statistique comme pour l’apprentissage de l’écriture. Quand un bébé entend « oh! le joli bébé », comment sait-il que « jo-li » est un mot et que « li-bé » n’en est pas un (ou presque!)? La prosodie peut les aider (ce « parler bébé » qui énerve tous ceux qui ne sont pas les parents!) mais aussi les statistiques: après la syllabe « jo » ils ont très souvent entendu la syllabe « ji » alors qu’après « li » ils ont souvent entendu autre chose que  la syllabe « bé ». En termes statistiques, les syllabes d’un mot ont une probabilité conditionnelle beaucoup plus grande que celles d’un pseudo-mot.

Pour savoir si cette hypothèse statistique tient la route, les chercheurs ont inventé une langue artificielle avec des mots (« tokibu » ou « gikoba ») et des pseudo-mots (« bi-giko ») dont ils maîtrisaient complètement la statistique des syllabes. Pendant deux minutes ils ont fait écouter à des bébés de huit mois cette langue étrange, débitée pendant deux minutes sur un ton monocorde et ont ensuite observé s’ils étaient plus réceptifs à l’écoute des mots que des pseudo-mots, même s’ils avaient entendu aussi les mots que les pseudo-mots. Le résultat est sans appel: les bébés détectent les mots grâce à leur sens des probabilités conditionnelles!

La méthode est très efficace en général mais pas parfaite si certains mots viennent toujours ensemble. Pour mon Numbertwo par exemple, né au Mexique, « Achita » désignait son doudou car on disait toujours « Aqui està! » (« il est là! ») quand on le lui donnait…

Le même test passé sur des singes Tamarins a donné des résultats identiques. Après une courte période d’habituation, les singes distinguent dans un flot de syllabes les mots des pseudo-mots, indépendamment de leur fréquence d’écoute. Notre sensibilité à la statistique remonte donc assez loin dans histoire évolutive. En 2005 on a pu montrer que les rats aussi sont sensibles à la co-occurence des syllabes, mais apparemment pas aux probabilités de transition entre les syllabes. En revanche, ils sont tout aussi bons que nous si au lieu de syllabes on leur fait écouter des suites de sons simples ou des signaux lumineux (ils sont même capables de généraliser ces règles d’une modalité à l’autre, voir par exemple cette étude). Des vrais génies de la statistique!

Des règles pour apprendre plus facilement

Reste à prouver que dans le cas du langage, les enfants utilisent bien cette compétence statistique pour comprendre ce qu’on leur dit. L’hypothèse est que ces règles leur servent à intuiter la structure des phrases. Par exemple ils comprennent assez vite qu’après un article comme « le » ou « la », il y a souvent un objet ou une personne, et qu’après je » ou « tu » il y a souvent une action (un verbe). Mais la règle n’est pas totalement fiable. A force d’entendre des exceptions comme « je la donne », ils finissent aussi par saisir que « la », entendu après « je », n’introduit pas un objet, mais une action. Bref, ils finissent par saisir implicitement ce que c’est qu’un nom, un verbe, un article, un pronom, etc.

Dans une expérience récente, Jenny Saffran a montré que ces règles intuitives aident les enfants à mémoriser le sens des mots et à deviner leur sens. L’expérience qui portait sur des enfants de 22 mois, toujours à partir d’un langage totalement inventé, se déroulait en trois phases:

Les résultats sont étonnants:

Source: Lany&Saffran, From Statistics to Meaning (2010)

Une explication à l’universalité de la grammaire du langage?

On aurait pu penser que l’enfant apprend d’abord les sens des mots, qu’ensuite il apprend à les catégoriser et qu’enfin seulement il comprend les règles qui structurent les phrases. C’est d’ailleurs à cause de cet a priori qu’on enseigne la grammaire à l’école, comme une dernière phase d’apprentissage du langage. Or l’expérience précédente semble montrer que cet apprentissage se fait bien souvent dans le sens inverse. L’enfant repère très tôt des règles statistiques de structure simples et cette « grammaire intuitive » lui sert de repère. D’abord pour identifier les blocs de syllabes qui ont un sens (les mots), puis pour leur attribuer une catégorie et enfin pour deviner leur sens en fonction du contexte. La grammaire élémentaire s’acquiert donc en même temps que le vocabulaire, voire même avant! A se demander pourquoi j’ai un si piteux souvenir de mes cours de grammaire…

Du coup, on comprend mieux pourquoi certaines structures grammaticales se retrouvent dans toutes les cultures, comme l’avait relevé Chomsky. C’est le cas par exemple  des articles (comme le, la ou les en français), qui sont souvent présents sous forme de mots très courts et très fréquents, toujours situés en bordure des mots qu’ils qualifient. Ces invariants n’auraient rien d’inné: ils seraient tout simplement les recettes les mieux adaptées aux aptitudes statistiques innées de notre cerveau d’humain. Toutes les langues se sont progressivement adaptées à ce qui les rendaient plus faciles à apprendre et à décoder. Exactement comme ce qui s’est probablement passé pour l’écriture. On retrouve toujours les mêmes signes élémentaires dans tous les alphabets du monde, actuels ou passés sans doute car ces signes sont ceux que notre oeil de primate sait le mieux reconnaître dans la nature. Et ainsi l’universalité de ces constructions culturelles que sont le langage et l’écriture refléterait simplement leur adaptation à notre cerveau, après des millions d’années d’évolution.

Représentatif ou pas, cet échantillon?

Mais la compétence statistique des bébés va bien au-delà du langage et de l’écriture. Elle leur permet aussi de savoir quand et à quel point, ils sont en droit de généraliser ce qu’ils observent, à quelles conditions ils peuvent attribuer une cause à un effet, etc. Dans une expérience concoctée par Laura Schulz (du MIT), on présente à l’enfant une grande urne transparente, remplie de boules jaunes et bleues. Durant une première phase d’observation, l’expérimentateur pioche trois boules (bleues) et montre à l’enfant qu’elles font « pouët pouët » quand on appuie dessus. Dans une seconde phase, il pioche une boule (jaune) dans l’urne, la donne à l’enfant et observe s’il essaie d’en tirer un son et combien de fois il appuie dessus (en fait les boules jaunes sont toujours muettes).

Pour savoir si l’enfant est sensible à la notion de représentativité statistique, on joue sur la proportion de boules bleues initialement présentes dans l’urne:

 Les observations sont conformes aux prédictions, mais pour écarter d’autres explications possibles à ce résultat, on a imaginé plusieurs autres scénarios. Par exemple dans le scénario C, on ne tire qu’une seule boule bleue (au lieu de trois) dans la phase d’observation (ce qui augmente la vraisemblance d’un tirage aléatoire). Dans le scénario E, on fait semblant de tirer aléatoirement les trois boules de départ (en fait le tirage est truqué, héhé!). Dans chacun des cas, l’enfant réagit de façon cohérente par rapport au niveau de représentativité (apparent) du tirage de la phase d’observation.

Ainsi les enfants sont-ils très sensibles à la notion « d’échantillon représentatif » de ce qu’ils observent et infèrent précisément quand ils sont en droit de généraliser ou pas. De la même manière, si le fonctionnement d’un jouet présente une certaine ambiguïté, l’enfant perçoit spontanément cette ambiguïté et préfère chercher à la dissiper plutôt que de jouer avec un nouveau jouet qu’on lui propose à ce moment-là. Dans le fond, les enfants se comportent instinctivement comme de vrais petits scientifiques! La théorie des probabilités n’était, pour Laplace, « que le bon sens réduit au calcul ». Avec ces expériences, on pourrait presque dire l’inverse: le bon sens semble se réduire à un simple calcul de probabilités… Mais alors, comment se fait-il qu’on ait tant de mal avec ces maudites probabilités dès qu’on nous les enseigne à l’école? On en parlera au prochain épisode (ici!)

Sources:

Ces billets tirent essentiellement leur source des séminaires du Collège de France organisés cette année par Stanislas Dehaene, sur le thème du cerveau Bayésien. En particulier, ceux de :
Jenny Saffran: Statistical learning and infant language acquisition (conférence)
Laura Shulz: the origin of Inquiry (en pdf et sa conférence)
On peut aussi voir la conférence d’Anne Christophe sur le même thème (ici)

Billets connexes:
Comment on lit: sur les mécanismes neuronaux à l’oeuvre dans la lecture
Les neurones des nombres: un autre exemple de notre sensibilité aux nombres
L’amour du risque, sur nos rapports étonnants avec le risque
Notre cerveau joue aux dés, sur la manière dont pourraient être encodées ces probabilités dans notre tête.

4 comments for “Les bébés, ces génies de la statistique

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *