Statistiques Cools et Pertinentes
La chronique des diagrammes en bâtons.
Bonjour à tous et bienvenue dans cette nouvelle rubrique au rythme irrégulier et à la parution surprise, j'ai intitulé Statistiques Cools et Pertinentes ! Sur ce papier, moi-même Cauchynambour et ma joyeuse équipe de bots et autres logiciels d'affichage graphique allons vous partager une passion qui aurait pu être sympathique mais qui se révèle souvent bien étrange : les statistiques, les diagrammes en bâtons, les courbes et les dérivées. On va parler de stats.
Tout d'abord et parce que c'est la nouvelle année, commençont avec quelques chiffres sur 2022, en France et à l'international.
Une année en valeurs chiffrées
Ou pourquoi vous n'avez vraiment pas envie de participer à un CA
Nos nouveaux membres. Je suis dans une des barres !
Commençons par les newbies, les néophytes, les noobz, les débutants de la Fonda, bref les inscrits. Deux pics en début d'année et autour du concours des 10 ans, plus de calme à Noël, rien de spécial sous le radar. On compte parmis nous 328 personnes inscrites en 2022, dont 128 ont voté, 26 ont contribué (donc édité ou posté), y compris 22 posteurs d'originaux ou de traductions, et 75 de ces personnes sont encore actives, en lecture ou en écriture. Des chiffres comparables aux années précédentes, avec une légère augmentation des contributeurs par rapport à l'année passée. Le site accuse donc en janvier 2023 la bagatelle de 3150 membres, dont 812 qui ont contribué, 497 auteurs et 235 membres encore actifs. Ça en fait du monde !
On notera cependant qu'en terme de néo-contributeur et néo-posteurs, il s'agit de l'année la plus faible de l'histoire du site. Pour autant, l'impact sur le nombre de pages et de votes semble avoir été plus léger. L'interprétation de tels chiffres est laissé en exercice au lecteur.
Concours et Bibli, vous avez dit ?
Maintenant, les PAGES. Laissez-moi enfiler mes lunettes de petit comptable, c'est tipar.
Tout le monde aura remarqué le rayon laser de début mai 2022, qui comptabilise à lui tout seul un huitième des pages de l'année ! En effet, entre le concours des 10 Ans et l'ouverture de la Bibliothèque des Vagabonds à la francophonie, ça en fait des pages !
Bilan de l'année sur la Bibliothèque : 162 traductions, 5 originaux. Un concept qui se cherche encore côté FR, mais qui s'importe durement grâce au travail sans relâche de nos traducteurs chéris.
Tiens, tant qu'on y est à compter les pages, ça a donné quoi ?
Et le total de l'année est de… 793 pages (16 n'ont pas survécu) dont :
- 410 traductions sur la Fonda
- 162 traductions sur la Bibli
- 216 originaux sur la Fonda
- 5 originaux sur la Bibli
C'est donc encore une victoire pour les traducteurs, qui finissent l'année avec un sacré paquet de pages en plus ! Pour autant, on a une jolie moyenne de 18 originaux par mois, de quoi lire pour les plus francophiles d'entre vous ! Légère baisse de la production (-14 %) par rapport à une année 2021 de tous les records, mais rien d'alarmant ni de drastique.
Passons ensuite aux votes. Ce mètre étalon du niveau de lecture, imparfait mais le seul qu'on a, ne prend ni en compte les avis des non-membres, ni ceux des novoteurs, ni ceux des utilisateurs qui oublient de voter. Mais il permet malgré tout de se faire une petite idée des grosses phases de lecture, toute proportion gardée.
Que de couleurs dans cette édition de la Gazette !
Évidemment, des sacrés pics qu'on voit là. Bien sûr, le concours des 10 Ans, le challanje de l'été et le concours d'Halloween ont marqué de manière impressionante les votes, quant à février 2022… On dirait que SCPPER a tout simplement perdu les stats et les a empilé. Du reste, votre serviteur venait à peine d'arriver, alors dur de savoir ce qui aurait motivé une telle affluence de votes. Sur l'année 2022, on comptabilise donc un total de 8369 votes, dont 89,5 % positifs. Globalement, on dirait que ce que les gens écrivent plaît quand même. Du reste, la lecture sur le site semble se faire par vagues, rythmées par les saisons et les vacances qui, au choix, éloignent du PC ou offrent du temps libre.
Bon et la question à 100 000 balles alors, est-ce que les gens lisent moins ?
Et bien… Un peu. On observe une diminution de 14 % des votes par rapport à l'année dernière. Pas énorme, bien sûr, mais une petite baisse malgré tout. De quoi motiver la relance d'un club de lecture !
C'est bon ? Vous n'êtes pas morts sous les chiffres ? Parfait.
Bon, passons désormais à la problématique qui secoue la Terre entière, la question qui a délenché croisades, sang et larmes sur les wikis, finalement la seule chose qui conte… Enfin qui compte !
Contes VS Rapports
Encore mieux que la WWE
Tout le monde le sait, ça n'est une surprise pour personne, mais les contes et les rapports n'ont ni le même public, ni la même présence, ni la même popularité. Mais alors, dans quelle mesure cet écart est-il significatif ?
I- Les contes et les rapports sur FR, une situation digne de l'Ancien Régime
Pour nous aider, le meilleur ami du statisticien en herbe est, vous l'avez compris, le système de tags. Au moyen d'une petite recherche croisée sur le combo "scp + fr", on trouve (et ça n'étonnera personne, c'est facile à compter) 634 résultats. Quelques deleted pas encore sortis du site, les -EX et les -J rajoutant aux quelques 582 rapports francophones. Du côté des contes, plus durs à compter à la main, on dénombre pas moins de 767 entrées ! Avantage de +134 entrées pour les contes, soit un petit +21 %. Rien d'exagéré, mais on remarque que les francophones aiment le format libre et la narration.
Cependant, quand on passe aux upvotes, les choses se gâtent…
En effet, les contes, bien que plus nombreux, ont un score médian inférieur ! +18 à la médiane pour les rapports, quand les contes n'ont qu'un +12… On a donc 21 % de contes de plus, mais les rapports sont upvotés (et donc lus, si on part du principe — pas déconnant — que les deux stats sont liées) un tiers de plus ! Inégalité, quand tu nous tiens… À ce stade, il serait facile d'accuser la mise en avant des rapports, les problèmes de rangement des contes, le système de tagging pas très adaptés au second format, mais ne nous emballons pas.
Parce que les traductions arrivent.
En effet, si on regarde au niveau des SCP et des contes non français, on arrive sur un constat d'une autre nature… Avec un déséquilibre colossal de 3117 rapports traduits pour seulement 924 contes (soit, euh… 3,37 fois plus), on arrive à un score médian de +3 pour les rapports… et +4 pour les contes.
Ah ! Donc, en plus d'avoir un taux de lecture par les membres inscrits significativement moindre, il semblerait que les contes étrangers soient un poil plus lus que les rapports… Les gens liraient-ils donc plus ce qu'il y a de moins ? Pas certain, comme le montre la suite de cette petite analyse.
I,5 - Interlude stats : pourquoi la médiane ?
Et bien Jamy, c'est très simple ! En fait, la médiane représente le score au-dessus duquel se trouvent 50 % des pages et en-dessous duquel se trouve les 50 % restants. Moins sensible aux anomalies statistiques telles que les pages turbo-up ou turbo-down, c'est aussi plus facile pour moi de trier par upvote et de prendre la page du milieu. Enfin, d'un point de vue mathématique, les upvotes sur les pages s'organisent selon une loi log-normale, ainsi la médiane ou la moyenne géométriques (qui convergent quand le nombre de page augmente) est l'outil adapté pour comparer des courbes entre elles.
II- Et à l'étranger, alors ?
Et bien à l'étranger, les choses n'ont, pour ainsi dire… rien à voir. Et parce qu'un dessin vaut mieux que 1000 mots, 4 dessins valent évidemment mieux que 4000 mots.
Alors, qu'est-ce qu'on voit sur ces graphiques ? Et bien tout d'abord, que la branche anglaise représente une quantité de pages postées, tant en terme de SCP que de contes, assez démentielles. Mais surtout, on remarque qu'à part sur FR et sur KO, chaque branche poste plus de SCP que de contes. Mention honorables tout de même aux deux Chines (pas d'incident diplomatique ici) qui sont toutes les deux à un ratio de presque 1:1.
Et sur le graphique des upvotes, alors ?
Et bien, on voit qu'il y a de sacrés écarts. En plus de nous en apprendre un peu plus sur les habitudes de vote de chaque branche (j'ai par exemple été étonné de voir si peu de votes chez les allemands, ou autant en Thaïlande), on peut aussi se rendre compte de sacrées fluctuations : alors que FR est dans le ventre mou des "on a un peu plus de lecteurs de rapports que de contes", les anglais, lusophones et polonais frôlent le ratio de 2:1, qui est carrément éclaté par les coréens à 3:1 ! Mention spéciale à la branche russe, qui réussit l'exploit d'avoir plus de lecteurs de contes que de rapports. Peut-être est-ce lié à la tradition russe de poster en mainlist leurs meilleurs rapports…
Bon bon bon, on a fait des stats, on a fait des graphes, des petits batonnets de colin et tout, mais qu'est-ce qu'on en retient alors ? Le format conte est-il finito + ratio ? Est-ce l'avenir, une spécificité locale ou un public réduit ? Et bien, peut-être un peu de tout ça. Nous quittons ici le terrain des faits pour entrer dans celui, bien plus hasardeux, des interprétations.
La première chose à noter est l'absence claire de tendance. En dehors du fait que globalement, on a plus de rapports ET on lit plus de rapports, rien de clair, aucune corrélation sur laquelle tenter une causalité. Alors, on peut tout d'abord supposer dans les petites branches des anomalies statistiques : en effet, il suffit que 5 auteurs à succès aient chacun une série d'une dizaine de contes pour faire pencher la balance d'un côté ou de l'autre. Ensuite, on peut également noter des différences historiques, qui impliquent une différence culturelle : par exemple, là où sur FR nous avons des grosses séries de contes et ce depuis longtemps, comme par exemple l'inénarrable Afal, mais aussi au moins une série par auteur "célèbre" (Kid's Show, MM5, Gentleman Dream, les Chroniques de SAPHIR…), ce qui a probablement forgé la culture conte, les anglais ont quant à eu une liste délirante de SCP dans laquelle de nombreux contes qui font à peine l'effort de se présenter en SCP, comme SCP-4231, ce qui incite peut-être les auteurs à poster de cette façon. Le système de critique et de publication, également, qui peut entrer en jeu.
Ainsi, la conclusion à toute cette petite enquête, qui était fort intéressante à faire aussi sur son absence de résultats, c'est qu'en terme de ratio conte:scp…
FR EST CHAMPION DU MONDE !!!!!
Gloria_Gaynor-I_Will_Survive.wav
Ahlala… Merci mille fois pour ces stats Cauchy ! J'adore ce genre de trivia, et encore plus quand ça porte sur le site. La prochaine fois, est-ce qu'on pourrait avoir avoir les stats données sur les nombres d'utilisateurs mais pour les autres branches ? Merci pour cette édition en tout cas.
J'ai bien aimé la partie sur les stats du site, également, si vous aimez les nouveaux concepts, alors vous aimerez probablement le Upote.
Sinon un très bon numéro dans l'ensemble.
J'arrive à la bourre mais j'ai également beaucoup aimé la partie stat. Le côté investigation m'a bien séduit. Je comptais pas le lire en entier puis finalement, si. Une bonne rubrique et un up pour moi !