Zipf et hapax legomenon

En quelle langue est écrit cet étrange titre? Zipf n’est pas une onomatopée, mais le nom d’une loi en l’honneur de celui qui l’a découvert, un certain George Kingsley Zipf.

George-Kingsley-Zipf-

La loi de Zipf est étonnante, car elle concerne les statistiques de la linguistique. Il est facile de savoir que, peu importe la langue dans laquelle on écrit un long texte, roman, encyclopédie, la récurrence des différents mots variera énormément. Cependant, Zipf a cherché à en connaitre beaucoup plus et ce qu’il a découvert a de quoi étonner, pour ne pas dire abasourdir.

Commençons par un constat simple, mais non dénué d’importance, la récurrence des mots varie en fonction de leur longueur. Plus un mot est court, plus fréquemment il sera utilisé. On le voit bien avec les déterminants, les prépositions, les conjonctions, des mots généralement très courts. On le comprend également pour l’autre extrémité du spectre. Pour diverses raisons, les très longs mots ne seront pratiquement jamais employés, l’une des raisons étant notre ignorance même de leur existence, mais notre paresse fait également partie des causes favorisant leur absence. De plus, les longs mots sont souvent tirés de jargons spécialisés, impertinents dans des œuvres de nature générale.

Graphique_Zipf_pour_Ulysses

Lorsqu’un long mot devient très populaire, nous produisons des diminutifs, ce qui contribue à respecter le principe relationnel entre longueur courte – fréquence élevée. Cinéma pour cinématographe, pneu pour pneumatique, télé pour téléviseur, frigo pour réfrigérateur, doc pour docteur, etc., les mots raccourcissent avec la fréquence d’utilisation.

Zipf a également noté que les mots difficiles à prononcer auront tendance à disparaitre des discours. S’ils s’avèrent incontournables, certains se transformeront afin que leur prononciation s’en voit facilitée.

Mais sa plus étonnante découverte fut de constater que la récurrence des mots suit une loi mathématique étrangement simple.

Si le mot le plus fréquent est apparu n fois dans une œuvre, le deuxième plus fréquent apparaitra moitié moins souvent, le troisième, seulement le tiers du premier, etc. C’est une simple loi d’inverse 1/n.

En multipliant le rang (r) de chaque mot par son nombre de récurrences (n), on obtient une constante égale à n pour chaque mot répertorié dans l’œuvre. C’est la loi de Zipf. Fantastique, vous ne trouvez pas?

Bon, maintenant que j’ai donné l’explication du mot Zipf dans le titre, que signifient les deux autres mots?

Le terme «hapax legomenon» est tiré du grec et signifie «chose dite une seule fois». Dans la loi de Zipf, il signifie un mot apparaissant une seule fois dans une œuvre. Dans le graphique, ce sont les points situés tout au bas. 

Le dictionnaire français présente la version écourtée, le mot «hapax» pour désigner ces solitaires.

La langue des Gaulois d’Amérique

Je suis d’origine québécoise, mes ancêtres sont français et amérindiens. Quand j’étais jeune, tous les gens ordinaires parlaient joual. Ce mot provient de la déformation du mot « cheval ». À l’instar du créole, le joual est un mélange de langues. Dans ce cas précis, le joual louvoie entre le français, le vieux français et l’anglais. Rajoutez-y une grammaire bicéphale, une prononciation lâche sur un fort accent breton moyenâgeux et vous obtenez un résultat plutôt incompréhensible pour les gens d’autres origines.

Durant les décennies 1960 et 1970, la révolution tranquille, c’est le nom qu’on a donné à notre affirmation comme peuple distinct libéré des jougs de l’Église catholique et de la domination anglaise, nous a rapprochés de nos origines françaises. Nous avons peu à peu épuré notre langue des mots et des expressions anglaises de mauvais aloi. Ce travail se poursuit encore aujourd’hui, car la culture a de la mémoire. Qui plus est, nous sommes 8 millions d’individus rassemblés sur un territoire entouré d’un océan de 400 millions d’anglophones. L’on constate bien évidemment que l’anglais est fortement prisé, il permet mieux que d’autres langues, dont le français, d’inventer des néologismes. À une époque où la technologie avance à un train d’enfer, le français peine à suivre le rythme de création des mots-valises et des acronymes composés à partir de mots techniques.

Tâche difficile pour un peuple géographiquement isolé de protéger sa langue face à une autre langue dont ses hégémonies tant géographique que technologique la rendent si attractive. Nous avons créé des institutions et avons voté des lois pour soutenir notre langue. Nous encourageons les immigrants à parler français. Nous le mettons en valeur, nous l’embellissons, nous y apportons notre contribution et nous travaillons sans relâche à contrer la puissance d’assimilation de l’anglais. Ainsi, nous nous empressons à créer des néologismes lorsqu’un mot anglais, souvent technique, cherche à s’imposer. Nous forçons l’usage des bons mots français ou des bonnes expressions françaises lorsqu’ils existent. Nous produisons nos propres émissions de radios, de télé, nos propres films, notre propre théâtre. Nous écrivons et éditons des tas de livres, malgré leur faible rentabilité. Nous nous efforçons d’être à l’affût des pièges linguistiques qui finissent par dénaturer une langue. Bien sûr, l’anglais reste incontournable qu’on soit Chinois, Russe, Argentin, Finlandais ou Québécois. Paradoxalement, le pourcentage de Québécois parlant couramment l’anglais est en forte hausse depuis notre révolution tranquille, car nous ne combattons pas le bilinguisme, nous combattons l’absence du français. Nous combattons l’anglicisation des allophones au détriment de leur francisation. Nous exigeons de travailler en français, de nous servir en français dans les boutiques, les restaurants et nos institutions logeant sur notre territoire. Plus qu’ailleurs, l’image de l’irréductible village gaulois convient très bien au peuple québécois faisant face à l’envahisseur anglophone omniprésent. Nos caricaturistes montrent d’ailleurs régulièrement nos dirigeants portant les habits de l’un ou de l’autre des personnages de la fameuse bande dessinée. Dans le prochain article, j’aborderai l’évolution de la langue française et son avenir.