« Quand j’utilise un mot, il a exactement le sens que je choisis de lui donner, ni plus ni moins. » De l’autre côté du miroir (1872). Humpty Dumpty / Lewis Caroll.
L’alphabet contient 26 lettres et la langue française est composée d’environ 100 000 mots, selon le Robert. Nous en déduisons qu’il suffirait au maximum de mots de quatre lettres pour pouvoir tout écrire car 26⁴ = 456 976 combinaisons. Alors pourquoi existe t’il des mots bizarres comme « anticonstitutionnellement » avec 25 lettres et même des mots presque incompréhensibles comme « aminométhylpyrimidinylhydroxyéthylméthylthiazolium » avec 50 signes ?
Avec deux lettres, il existe seulement 26² combinaisons soit 676 mots. Bien que beaucoup soient très utiles (ex : , JE, TU, IL et ON), le vocabulaire est trop pauvre. Avec trois lettres nous pouvons former 17576 mots (26³ ) ce qui devrait être largement suffisant pour la vie courante. Nous pouvons commencer avec AAA et finir avec ZZZ. Le lien entre ces deux « mots » ou sigles semble évident : Association des Alcooliques Anonymes versus Zuper groZe Zieste !
Pour économiser de précieux octets dans les mémoires d’ordinateurs et permettre aux jeunes de moins se fatiguer les pouces sur leurs téléphones intelligents, nous pourrions tout recoder en « mots » de trois lettres au maximum.
Pour tester toutes les combinaisons de trois lettres d’une manière ordonnée, nous pouvons suivre cette série : AAA, AAB, AAC, …, ABA, ABB, ABC, …, BAA, BAB, BAC. Juste avec ce tout petit échantillon nous obtenons un groupe de rock suédois, l’abécédaire, et un type de bateau. C’est prometteur et il reste pleins de mots inutilisés! Parcourir toute la série risque de devenir un peu ennuyeux, il est donc plus amusant de laisser libre court au hasard via un petit programme informatique en Python qui peut écrire des phrases contenant entre 4 et 20 « mots » de 3 lettres :
import random ; hasard = random.randint lettres = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ' ql = (0,25) ; qm = (4,20) phrase = '' for p in range(hasard(*qm)) : ____mot = lettres[hasard(*ql)] + lettres[hasard(*ql)] +lettres[hasard(*ql)] ____phrase = phrase + ' ' + mot print(phrase)
Voici quelques résultats de ce programme:
ZRQ YUU PPB DKO WTI FGY YYF KJK WCH
MER HSN QVS NFA MUN HGR DHM HJW VQF CTC DND ZAG XQG
FZZ ONO RWG PAJ
HZY KEH YQO YYX RFF LNQ EQA YOM UPN KAB EHF BRG LAW UDL CSW
Comme vous pouvez le constater, c’est impossible à comprendre et même à prononcer (ex :ZRQ et YUU). Améliorons ce programme en séparant les voyelles (ex : A) et les consonnes (ex : B) et en faisant des mots ayant ces formes : AB, BA, ABA, BAB. Enfin ajoutons de la ponctuation pour obtenir un texte plus lisible..
import random ; haz = random.randint co = 'bcdfghjklmnpqrstvwxz' ; qco=(0,19) vo = 'aeiouy' ; qvo=(0,5) pu = ',.!?' ; qpu=(0,3) texte = '' for t in range(haz(2,20)) : ____phr = '' ____for p in range(haz(4,10)) : ________m = (haz(0,4)) ________if m==0 : mot = vo[haz(*qvo)] + co[haz(*qco)] ________elif m==1 : mot = co[haz(*qco)] + vo[haz(*qvo)] ________elif m==2 : mot = vo[haz(*qvo)] + co[haz(*qco)] + vo[haz(*qvo)] ________else : mot = co[haz(*qco)] + vo[haz(*qvo)] + co[haz(*qco)] ____if p==0 and texte[-2:] != ', ' : phr = phr + mot[0].capitalize() + mot[1:] ____else : phr = phr + ' ' + mot ____texte = texte + phr + pu[haz(*qpu)] + ' ' print(texte)
Voici le nouveau résultat :
Uq yfo qud oz, tir joq if ne ru saz. Ryt ob to ki fe xu yx xyz quf! Xov giq fic zy bum, vus yve job ico, qoq gyv woc aho hik bi wuk. Ere we liv. Biz zex xe? Iq gys tas.
Ce texte commence à ressembler à quelque chose ! On peut encore l’améliorer en incluant des accents, et surtout en autorisant des mots de quatre lettres. Mais bon, je pense que vous avez saisie le principe. Nous constatons que les « mots inutiles » passent mieux dans une phrase que « brut de décoffrage ». Il faut surtout respecter le rythme entre les consonnes et les voyelles et ne pas oublier la ponctuation pour faire des phrases.
Est-ce BON ou est-ce MAL d’écrire ainsi ? Est-ce une forme de « Bêtise Artificielle » (ce qui est, a priori, différent de l’IA) ? Est-ce qu’il s’agit d’une nouvelle façon de faire de l’écriture automatique ? Est-ce une solution imaginaire à un problème qui ne se pose pas ? C’est aux lecteurs d’en décider.
Pour terminer voici un petit texte avec des « mots inutiles » de 2, 3 ou 4 lettres :
Niza id rosy ejem, yfu tydu voba xym yfiq fi fi! Ed nun ap se din wu azip max wab? Ze fimy oke cuvy lo, livy deza juti ywot hybe qaro azy! Vyd afuv avuk ilu! Edol itiw upyp ot zin diku gymo? Er vy oki kig cesi er pab zuzi? Ol fero eno sora guz ebuk itac ap jere, wyg xytu ho qafe? Of unu tup re uno ciwy iluj. Buga uk qyta omu anec ik hu red va edin? Eg gygy toz ide xah, yp ce vyz ec uzi jyny wyn jo qab! He madu wy pyxe rin vaq yzeq ygo mi hy! La xipu wu yc leci hab eseq ezu big, av op puga kyfa evu, co tab uzuj dowa.
Et, tenez vous bien, voici la traduction faite par « Google Translate » de ce magnifique texte :
Niza main œuf rose, yfu tydu de xym yfiq dans la bouche ! Ed, tu ne peux pas faire d’azip max, n’est-ce pas ? Le fimy up cuvy go, livy deza juti ywot hybe écureuil azy ! Au milieu de la ville ! Avez-vous un upyp ou allez-vous à la salle de sport ? Et vy eye kig cesi et pub zuzi ? Le fils féroce de Guz livre Itac Up Jere, qui aime qafe ? D’un tup sur une ville municipale. Buga uk qyta tu as un rouge ou un rouge ? Par exemple, idée gygy toz xah, ouais, qu’est-ce que vyz ec uzi jyny wyn jo qab ! Il chérie, pyxe sourit aussi et sourit à moi hy ! Le xipu wu yc leci a dû manger un gros, av op puga kyfa evu, co tab uzuj dowa.
« Le xipu a dû manger un gros puga » !!! Est-ce vraiment grave Dr Faustroll ?
