Langage & développement 10 min de lecture

Les 30 millions de mots : ce que la recherche Hart & Risley a vraiment montré

En 1995, Betty Hart et Todd Risley publient une étude qui va redéfinir les politiques d'éducation précoce aux États-Unis et bien au-delà : les enfants de familles pauvres entendent 30 millions de mots de moins que les enfants de familles professionnelles avant l'âge de 3 ans. Ce chiffre est devenu une vérité quasi universelle. C'est aussi l'une des données les plus mal utilisées en psychologie du développement.

L'étude originale : ce qu'Hart et Risley ont fait

Betty Hart et Todd Risley, chercheurs à l'Université du Kansas, avaient une question précise : pourquoi les programmes d'enrichissement précoce (comme Head Start) ne réduisaient-ils pas durablement les écarts de performance scolaire entre enfants de milieux favorisés et défavorisés ? Leur hypothèse : quelque chose se passe avant, dans les premières années de vie, qui creuse les inégalités avant même que les programmes n'interviennent.

Entre 1982 et 1986, ils ont recruté 42 familles volontaires à Kansas City et ont enregistré pendant une heure par mois les interactions verbales dans le foyer — dès les 7 mois des enfants jusqu'à leurs 3 ans. Les familles étaient réparties en trois groupes socioéconomiques : professionnels (13 familles), classes ouvrières (23 familles), et bénéficiaires de l'aide sociale (6 familles).

Les résultats sont frappants. À l'âge de 3 ans, les enfants de familles professionnelles avaient entendu en moyenne 45 millions de mots ; ceux de familles ouvrières, 26 millions ; ceux de familles en situation de pauvreté, 13 millions. L'écart entre les extrêmes : environ 30 millions de mots. Ce chiffre, extrapolé et arrondi, est devenu le titre de l'étude et de son influence.

Mais Hart et Risley ne s'arrêtaient pas là. Ils ont suivi un sous-ensemble de ces enfants jusqu'au CE2 et montré que les différences de vocabulaire à 3 ans prédisaient significativement les performances scolaires à 9-10 ans — avec des corrélations autour de 0,6. C'est ce lien entre exposition verbale précoce et trajectoire scolaire qui a donné à l'étude son retentissement politique.

Ce que l'étude a vraiment montré

Avant les critiques, il faut dire ce que Hart et Risley ont réellement démontré — et qui reste valide.

Premièrement, il existe des différences mesurables d'environnement verbal selon le milieu socioéconomique, et ces différences sont présentes dès les premiers mois de vie. Ce n'est pas une impression : c'est quantifié, longitudinal, et robuste sur l'échantillon étudié.

Deuxièmement, Hart et Risley ont observé des différences qualitatives au-delà du volume. Dans les familles professionnelles, les échanges avec l'enfant étaient plus souvent positifs et expansifs — l'adulte répondait à ce que l'enfant regardait, nommait, questionnait, développait. Dans les familles à faibles revenus, les interactions étaient plus souvent directives et restrictives — "arrête", "viens ici", "non". Hart et Risley ont appelé cela le language of abundance vs le language of restriction.

Troisièmement, leurs données longitudinales montrent un effet de cumul : un enfant qui entre à l'école primaire avec un vocabulaire plus étendu a une base plus large pour acquérir de nouveaux mots — l'avantage se creuse avec le temps plutôt que de se résorber naturellement.

Les problèmes méthodologiques qu'on a mis du temps à voir

42 familles. C'est la taille de l'échantillon de l'étude qui a influencé des décennies de politiques publiques aux États-Unis, en Europe et ailleurs. Pour une étude publiée en 1995 dans le domaine de la psychologie du développement, c'était une taille courante. Mais pour tirer des conclusions généralisables sur les inégalités sociales et le développement du langage, c'est très insuffisant.

Deuxième limite : l'échantillon est entièrement composé de familles afro-américaines à Kansas City, recrutées volontairement. Aucune famille hispanique, aucune famille d'immigration récente, aucune communauté rurale. La généralisation implicite à "les enfants pauvres" vs "les enfants riches" n'était pas justifiée par les données.

Troisième limite, la plus importante : Hart et Risley n'ont compté que le child-directed speech — le discours directement adressé à l'enfant. Ils ont explicitement exclu le discours entre adultes se déroulant en présence de l'enfant, ainsi que le discours adressé à d'autres enfants de la fratrie. Ce choix méthodologique, qui paraissait raisonnable à l'époque (on pensait que seul le discours adressé à l'enfant comptait), est au cœur des révisions ultérieures.

La réplication de Sperry : ce qui a été remis en question

En 2019, Douglas Sperry, Linda Sperry et Peggy Miller publient dans Child Development une étude qui ébranle le consensus autour du "word gap". Ils ont enregistré des interactions dans 6 communautés américaines très différentes — une communauté afro-américaine urbaine de Chicago, des Noirs du Sud rural, des Blancs des Appalaches, une communauté mexicaine-américaine, et deux communautés d'Asie du Sud — en utilisant un protocole similaire à celui d'Hart et Risley mais en comptant tous les mots auxquels l'enfant était exposé, pas seulement ceux adressés directement à lui.

Leurs résultats contredisent directement la hiérarchie établie par Hart et Risley. Dans certaines communautés à faibles revenus — notamment les communautés noires du Sud rural et des Appalaches — les enfants étaient exposés à autant ou plus de mots que dans les familles professionnelles de l'étude originale, une fois pris en compte le discours environnant. La raison : dans ces communautés, la vie sociale se déroulait en grande partie en présence des enfants, qui étaient constamment immergés dans des conversations adultes riches et variées.

La conclusion de Sperry et al. est prudente mais claire : le "word gap" de 30 millions n'est pas un fait universel — c'est un artefact partiel des choix méthodologiques d'Hart et Risley, et il ne caractérise pas toutes les familles à faibles revenus.

Cette réplication a été contestée à son tour — certains chercheurs maintiennent que le discours directement adressé à l'enfant a des effets différents du discours ambiant. Le débat est ouvert. Ce qui est certain : le chiffre de 30 millions ne peut plus être présenté comme un fait établi et universel.

Ce que la recherche récente dit sur ce qui compte vraiment

La qualité avant la quantité : les travaux d'Anne Fernald

Anne Fernald et ses collègues (Stanford) ont apporté une nuance décisive. Dans une étude publiée en 2013, ils ont suivi 48 familles hispaniques bilingues de la région de San Francisco et mesuré non pas le volume de mots mais deux paramètres qualitatifs : la richesse du vocabulaire utilisé et la vitesse de traitement du langage — la rapidité avec laquelle l'enfant identifie un objet nommé.

Leurs résultats montrent que des différences significatives de vitesse de traitement sont déjà présentes à 18 mois entre enfants de milieux socioéconomiques différents — et que ces différences prédisent le vocabulaire à 24 mois mieux que le simple volume de mots entendus. La qualité des interactions — richesse lexicale, réactivité aux initiatives de l'enfant, utilisation de questions ouvertes — compte davantage que la quantité.

Les tours de conversation : la contribution de Rachel Romeo

L'avancée la plus récente et la plus importante vient de Rachel Romeo et ses collègues (MIT / Harvard, 2018). Ils ont équipé 36 enfants de 4 à 6 ans de petits enregistreurs portables pendant plusieurs jours, puis ont mesuré par IRMf la connectivité des régions du langage dans leur cerveau.

Résultat surprenant : ce n'est pas le nombre de mots entendus qui prédit la connectivité neurale dans les régions du langage — c'est le nombre de turns, ou tours de conversation : les échanges réciproques où l'enfant dit quelque chose, l'adulte répond, l'enfant réagit. Et cet effet persiste après contrôle du revenu familial et du QI parental.

Ce résultat déplace l'attention du monologue (parler à l'enfant) vers le dialogue (parler avec l'enfant). Un parent qui répond aux initiatives verbales de son enfant — même avec des mots simples, même fatigué — construit quelque chose de neurologiquement différent de celui qui parle beaucoup sans écouter.

Ce qu'on peut honnêtement en retenir

Après 30 ans de recherche sur le "word gap", voici ce que les données permettent d'affirmer avec confiance :

L'environnement verbal précoce compte. Ce n'est pas une question d'opinion. Les études longitudinales, les mesures neurobiologiques et les corrélations avec les trajectoires scolaires le confirment de façon cohérente.

La réciprocité des échanges est le mécanisme central. Plus que le volume de mots, c'est la qualité dialogique — répondre aux initiatives de l'enfant, suivre son attention, nommer ce qu'il regarde, poser des questions — qui construit le langage et les circuits neuronaux associés.

Le chiffre de 30 millions est une simplification. Il a eu un rôle politique utile en attirant l'attention sur les inégalités précoces. Il a aussi été utilisé pour stigmatiser les familles pauvres en les présentant comme insuffisamment verbales — ce que les données de Sperry et d'autres montrent être inexact et culturellement biaisé.

L'injonction à "parler plus" est mal posée. Un parent épuisé qui se sent coupable de ne pas assez parler à son enfant ne deviendra pas meilleur en se forçant à un monologue. Ce qui aide : savoir que répondre — même brièvement — aux initiatives de l'enfant est plus efficace que parler pour parler.

Références scientifiques

  • Fernald, A., Marchman, V. A., & Weisleder, A. (2013). SES differences in language processing skill and vocabulary are evident at 18 months. Developmental Science, 16(2), 234–248.
  • Hart, B., & Risley, T. R. (1995). Meaningful Differences in the Everyday Experience of Young American Children. Brookes Publishing.
  • Hart, B., & Risley, T. R. (2003). The early catastrophe: The 30 million word gap by age 3. American Educator, 27(1), 4–9.
  • Romeo, R. R., Leonard, J. A., Robinson, S. T., West, M. R., Mackey, A. P., Rowe, M. L., & Gabrieli, J. D. E. (2018). Beyond the 30-million-word gap: Children's conversational exposure is associated with language-related brain function. Psychological Science, 29(5), 700–710.
  • Rowe, M. L. (2012). A longitudinal investigation of the role of quantity and quality of child-directed speech in vocabulary development. Child Development, 83(5), 1762–1774.
  • Sperry, D. E., Sperry, L. L., & Miller, P. J. (2019). Reexamining the word gap: The case for the environment. Child Development, 90(5), 1564–1583.
  • Weisleder, A., & Fernald, A. (2013). Talking to children matters: Early language experience strengthens processing and builds vocabulary. Psychological Science, 24(11), 2143–2152.