mardi 24 mars 2009

Fréquence d'utilisation des lettres de l'alphabet latin dans le monde.

Chers amis d'A.M.I.,

Introduction, matériel et méthode.

Une analyse de 113.260.000. 000 de lettres isolées, prélevées par hasard sur internet par l'intermédiaire de Google.com, quelques soient les langues, à condition qu'elles utilisent le lettres latines, montre la fréquence suivante de probabilité d'utilisation en fonction des lettres.

Résultats.

A

18150000000

16,025075

1

B

3040000000

2,68408971

17

C

4600000000

4,06145153

9

D

5130000000

4,52940138

6

E

7700000000

6,79851669

3

F

2690000000

2,37506622

18

G

2000000000

1,76584849

22

H

1890000000

1,66872682

25

I

8210000000

7,24880805

2

J

1820000000

1,60692213

26

K

2080000000

1,83648243

21

L

3660000000

3,23150274

11

M

4640000000

4,0967685

8

N

3460000000

3,05491789

13

O

4770000000

4,21154865

7

P

4070000000

3,59350168

10

Q

1910000000

1,68638531

24

R

2490000000

2,19848137

20

S

6880000000

6,07451881

4

T

6100000000

5,3858379

5

U

2510000000

2,21613986

19

V

3460000000

3,05491789

14

W

3560000000

3,14321031

12

X

3410000000

3,01077168

15

Y

3050000000

2,69291895

16

Z

1980000000

1,74819001

23

Total

113.260.000. 000

100

1 à 26

LETTRES

TOTAL ANALYSE

%

RANG


Pour ceux que la science probabiliste intéresse, le calcul de la probabilité d'utilisation simultanée ou concomitante de plusieurs lettres se fait en multipliant les probabilités isolées d'utilisation isolée de chacune d'entre elle. Ainsi par exemple, la probabilité d'utilisation simultanée ou concomitante des lettres F, P et R, comme dans le sigle « FPR », est de 0,0000188, soit une chance (ou une malchance) sur 53.295, ce qui permet de ramener à une position humble ces trois lettres orgueilleusement rapprochées pour le malheur du Rwaanda de Gihaanga.


Agaculama Statistical Association : « Fréquence d'utilisation des lettres de l'alphabet latin dans le monde », Agaculama Journal of Statistics (2009), 1/1, pp.1-2.


Conclusions.


1/ La lettre la plus utilisée dans le monde est le A, soit 16,03% de l'ensemble des lettres utilisées isolément.

2/ Sept lettres les plus représentées représentent 50% de l'ensemble des lettres en caractère latin utilisées dans le monde, soit par ordre décroissant : A, I, E, S, T, D et O. On y trouve les quatre voyelles A, E, I et O. On y trouve aussi les consonnes S, T et D, ce qui n'est pas une surprise.

3/ La lettre la moins utilisée est le J, soit à peine 1,61% de l'ensemble.

4/ Les lettres les moins fréquemment utilisées sont le J, suivie du H, suivie du Q, suivie du Z et suivie du G.

Perspective.

Avis aux amateurs qui souhaiteraient faire une étude identique en hébreu, arabe, japonais, mandarin chinois, géorgien, berbère, thaï, néanderthalien, cunéiforme, hiéroglyphique, braille, morse ou dans la langue traditionnelle rwandaise avant sa contamination par l'écriture des colonialistes européens.

Référence et auteur.

Agaculama Statistical Association : « Fréquence d'utilisation des lettres de l'alphabet latin dans le monde », Agaculama Journal of Statistics (2009), 1/1, pp.1-2.

NB:

Il faut bien occuper les Netters de ce forum avec l'un ou l'autre sujet de discussion de salons de coiffeurs, par ces temps de disette informationnelle!

Aucun commentaire:

Enregistrer un commentaire