Introduction, matériel et méthode.
Une analyse de 113.260.000. 000 de lettres isolées, prélevées par hasard sur internet par l'intermédiaire de Google.com, quelques soient les langues, à condition qu'elles utilisent le lettres latines, montre la fréquence suivante de probabilité d'utilisation en fonction des lettres.
Résultats.
A | 18150000000 | 16,025075 | 1 |
B | 3040000000 | 2,68408971 | 17 |
C | 4600000000 | 4,06145153 | 9 |
D | 5130000000 | 4,52940138 | 6 |
E | 7700000000 | 6,79851669 | 3 |
F | 2690000000 | 2,37506622 | 18 |
G | 2000000000 | 1,76584849 | 22 |
H | 1890000000 | 1,66872682 | 25 |
I | 8210000000 | 7,24880805 | 2 |
J | 1820000000 | 1,60692213 | 26 |
K | 2080000000 | 1,83648243 | 21 |
L | 3660000000 | 3,23150274 | 11 |
M | 4640000000 | 4,0967685 | 8 |
N | 3460000000 | 3,05491789 | 13 |
O | 4770000000 | 4,21154865 | 7 |
P | 4070000000 | 3,59350168 | 10 |
Q | 1910000000 | 1,68638531 | 24 |
R | 2490000000 | 2,19848137 | 20 |
S | 6880000000 | 6,07451881 | 4 |
T | 6100000000 | 5,3858379 | 5 |
U | 2510000000 | 2,21613986 | 19 |
V | 3460000000 | 3,05491789 | 14 |
W | 3560000000 | 3,14321031 | 12 |
X | 3410000000 | 3,01077168 | 15 |
Y | 3050000000 | 2,69291895 | 16 |
Z | 1980000000 | 1,74819001 | 23 |
Total | 113.260.000. 000 | 100 | 1 à 26 |
LETTRES | TOTAL ANALYSE | % | RANG |
Pour ceux que la science probabiliste intéresse, le calcul de la probabilité d'utilisation simultanée ou concomitante de plusieurs lettres se fait en multipliant les probabilités isolées d'utilisation isolée de chacune d'entre elle. Ainsi par exemple, la probabilité d'utilisation simultanée ou concomitante des lettres F, P et R, comme dans le sigle « FPR », est de 0,0000188, soit une chance (ou une malchance) sur 53.295, ce qui permet de ramener à une position humble ces trois lettres orgueilleusement rapprochées pour le malheur du Rwaanda de Gihaanga.
Agaculama Statistical Association : « Fréquence d'utilisation des lettres de l'alphabet latin dans le monde », Agaculama Journal of Statistics (2009), 1/1, pp.1-2.
Conclusions.
1/ La lettre la plus utilisée dans le monde est le A, soit 16,03% de l'ensemble des lettres utilisées isolément.
2/ Sept lettres les plus représentées représentent 50% de l'ensemble des lettres en caractère latin utilisées dans le monde, soit par ordre décroissant : A, I, E, S, T, D et O. On y trouve les quatre voyelles A, E, I et O. On y trouve aussi les consonnes S, T et D, ce qui n'est pas une surprise.
3/ La lettre la moins utilisée est le J, soit à peine 1,61% de l'ensemble.
4/ Les lettres les moins fréquemment utilisées sont le J, suivie du H, suivie du Q, suivie du Z et suivie du G.
Perspective.
Avis aux amateurs qui souhaiteraient faire une étude identique en hébreu, arabe, japonais, mandarin chinois, géorgien, berbère, thaï, néanderthalien, cunéiforme, hiéroglyphique, braille, morse ou dans la langue traditionnelle rwandaise avant sa contamination par l'écriture des colonialistes européens.Référence et auteur.
Agaculama Statistical Association : « Fréquence d'utilisation des lettres de l'alphabet latin dans le monde », Agaculama Journal of Statistics (2009), 1/1, pp.1-2.
NB:
Il faut bien occuper les Netters de ce forum avec l'un ou l'autre sujet de discussion de salons de coiffeurs, par ces temps de disette informationnelle!
Aucun commentaire:
Enregistrer un commentaire