Ces mystérieux pourcentages en tournoi par paires...

Disons tout de suite que cette page ne sert à rien d'autre qu'à satisfaire des esprits curieux. Au moins son auteur. Ce n'est donc pas vraiment une "récréation", mais il ne s'agit pas non plus de résultats utilisables au bridge. Il fallait bien la mettre quelque part : sur les plus de 7 milliards d'individus qui peuplent la planète, il y en a "probablement" un autre que cela intéresse. Bienvenue, collègue ! Tu trouveras ici quelques résultats sur des tournois réels, et des réflexions sur quelques bizarreries des pourcentages en "TPP".

Nota : 9 ans après, c'est un des articles les plus lus de ce site, avec 12000 visites...

Intuitivement, si on fait un pourcentage entre 45% et 55% c'est moyen, au-dessus de 60% c'est plus que bien (tout est relatif, c'est simplement normal pour les paires de première série qui viennent s'entraîner contre des deuxième et troisième séries). Plus de 65% c'est qu'on était en super-forme et, avouons-le, que les adversaires ont été coopératifs. Moins de 40%, c'est qu'on était fatigué ou que le partenaire a particulièrement mal joué.

D'où sortent ces pourcentages ? A quoi peut-on s'attendre ? Pourquoi certains jours tout le monde est-il très serré ? Comme dirait mon dentiste, il faut creuser un peu.

On supposera dans toute la suite que toutes les donnes sont jouées le même nombre de fois dans chaque tournoi, qu'il n'y a pas de relais, pas de pénalités, de moyenne tournoi etc. Ces hypothèses ne changent d'ailleurs pas grand chose au résultat.

Votre résultat final est la moyenne des pourcentages que vous avez obtenus sur les donnes jouées.

Le "topage"

Rappelons le principe du tournoi par paires. Chaque donne est "topée". Cela consiste à mettre la meilleure note (100%) au NS qui a marqué le plus gros score, ou si ça ne marque qu'en EW, qu'au meilleur score pour NS. Peu importe si ce NS est le meilleur de 10 points (430 contre un suivant à 420) ou de 500 points (980 contre un suivant à 480), ce qui compte est le classement sur la donne.

Le suivant, deuxième NS, marquera 100% moins 100 divisé par le nombre de fois où la donne a été jouée moins 1. Exemple d'une donne qui serait jouée 11 fois : on diminue de 10% (100 divisé par 11 moins 1), le second va marquer 90%. Et ainsi de suite. Les scores ne sont pratiquement jamais tous différents sur une donne. S'il y a des ex-aequo, ils se partagent les pourcentages. A l'inverse et tout aussi exceptionnel, on peut imaginer une donne avec tous les scores identiques, tout le monde serait à 50%.

Entre les deux, par exemple en NS, on pourra trouver sur une feuille ambulante : 4 fois 980 qui marqueront 85% (ils se partagent la moyenne de 100-90-80-70), 2 fois 480 = chelem "empaillé" qui marqueront 55% (moyenne de 60 et 50), un à 450 qui marquera 40%, 3 à -50 qui marqueront 20% (moyenne de 30-20-10), et un dernier à -100 qui marquera 0%. Les pourcentages des EW sont bien sûr les complémentaires à 100%.

Même principe pour les EW, le meilleur (ou le moins mauvais) score EW marque 100%, et ça descend jusqu'à zéro.

Dans l'exemple, voilà ce que donneront les pourcentages sur cette donne. Les EW adversaires vont marquer les compléments à 100, donc 4 fois 15 pour ceux qui ont subi le chelem, 2 fois 45 pour ceux ayant laissé faire 480, etc.

score NS	% NS	commentaire
980 980 980 980 480 480 450 -50 -50 -50 -100	85 85 85 85 55 55 40 20 20 20 0	85 est la moyenne des 4 premiers pourcentages : 100, 90, 80,70 55 est la moyenne de 60 et 50 40 est le % suivant 20 est la moyenne de 30, 20 et 10 et 0 est le dernier %

Si la donne a été jouée par exemple 13 fois et pas 11, les pourcentages seront moins sympathiques à calculer, ils diminuent de 100/12 = 8,33% pour chaque paire : 100%, 91,67% ... 8,33% et 0%, hors effet d'ex-aequo bien sûr.

Si tous les scores sont différents, l'écart entre les pourcentages est de 100/(nombre de résultats - 1). Voilà pourquoi c'est simple dans l'exemple avec 11 paires : 10%.

S'il n'y a qu'un seul score, tout le monde sera ex-aequo à 50%

S'il n'y a que deux scores, avec une catégorie de B "bons" et de M mauvais" (sur cette donne, pas dans l'absolu...).
Les "bons" vont marquer (2 - (B-1)/(B+M-1))*50% et les "mauvais" vont marquer 50*(M-1)/(B+M-1)%

Encore une fois, tout ceci est indépendant des scores eux-mêmes. Qu'il s'agisse d'un partiel à 2P où certains ont fait un de mieux, d'une manche que tout le monde a demandée mais que certains ont chutée de un, d'un chelem sur table que seulement certains ont demandé... c'est pareil, seul compte le nombre de "bons" et de "mauvais". C'est la caractéristique du TPP (tournoi par paires).

S'il y a un relais et que toutes les donnes n'y passent pas, elles ne seront pas toutes jouées le même nombre de fois. Une formule complexe en tient compte et explique que parfois le top n'est pas à 100% mais à des valeurs telles que 99,60%. Je pense que l'idée est qu'un top plein sur une donnée 11 fois est un peu plus facile que sur une donne jouée 12 fois.

Moyenne et écart-type

La moyenne des résultats de tous les NS, ou de tous les EW, sur n'importe quelle donne et donc sur l'ensemble du tournoi, est bien sûr 50%.

Attention, dans le cas d'un simultané, ceci est vrai pour les résultats locaux calculés localement dans votre club, vrai aussi en national sur l'ensemble des paires, mais ne l'est pas pour la moyenne des résultats des équipes locales calculés en national. On peut obtenir plusieurs % d'écart en fonction de la force des équipes et surtout de l'écart de force entre les NS et les EW.

Plus intéressant est l'écart-type, c'est-à-dire la dispersion autour de 50%. Certains jours, les résultats sont très dispersés, entre 35% et 65% par exemple dans une diagonale, parfois très groupés avec tout le monde entre 40% et 60%, voire plus serré encore. Pourquoi ?

On rappelle que l'écart-type est la racine carrée de la moyenne des carrés des écarts à 50%. Cela paraît compliqué mais c'est simple.

Ecart-type sur une donne

Supposons par exemple une donne jouée 11 fois (le cas facile, où les pourcentages tombent juste).

C'est exceptionnel mais on peut imaginer 11 scores différents, et les NS et EW vont alors marquer sur cette donne : le top à 100%, le sous-top à 90%, puis 80%... jusqu'à la bulle à 0%. L'écart-type des pourcentages sur cette donne jouée 11 fois vaut 31,6%.

L'effet "nombre de fois"

Il intervient un peu, c'est le vieux coup des arbres et des intervalles... Explication sans calcul : sur une donne jouée 6 fois, les pourcentages, s'ils sont tous différents, seront 100, 80, 60, 40, 20 et 0. A 11 fois, vont s'insérer les dizaines impaires, 90, 70, 50, 30, et 10, qui sont moins dispersées autour de 50 que les dizaines paires, et font donc baisser l'écart-type. De fait, l'écart-type à 11 tables, 31,6%, est bien plus faible qu'à 6 tables, 34,2%.

Pour une donne jouée 3 fois (mais ferait-on un tournoi Mitchell ?), l'écart-type de trois scores différents serait de 40,8%, pour 10 fois, l'écart-type est 31,91% si tous les scores sont différents, pour 20 fois, 30,35%, pour 100 fois, 29,16%. Pour une donne jouée un très grand nombre de fois, la limite serait 100/√(12) = 28,87%. Retenons que c'est 30% sur une donne si les résultats sont très dispersés.

L'effet "fréquences"

Chaque type de fréquences va donner une suite de pourcentages sur la donne, donc un écart-type.

Une donne très dispersée avec 11 fréquences différentes donne l'écart-type maximal à 31,6%. La plus groupée avec tout le monde ex-aequo donne 0%. En réalité on est entre les deux mais beaucoup plus près de 30. L'exemple ci-dessus (fréquences de type 4-2-1-3-1-2) donne 30,5%.

Sur quelques vrais tournois de régularité : on trouve 30,1% en moyenne sur les donnes jouées 9 fois (il y en avait une presque au maximum avec 8 scores différents, et une très banale avec 7 scores identiques), sur un autre tournoi 29,5% avec des donnes jouées 10 fois, sur un troisième, 28,8% pour des donnes jouées 13 fois. Pour deux simultanés, 28,1% et 27,4% en moyenne sur des donnes de simultané jouées respectivement un peu plus de 700 fois ou un peu moins de 600.

On obtient deux conclusions :

vérification de l'effet "nombre de fois", avec un écart-type un peu plus grand sur des donnes jouées 8 ou 9 fois plutôt que 12 ou 13.
l'écart-type moyen est 0,92 à 0,93 fois celui de la donne théorique la plus dispersée, celle avec tous les scores différents. Evidemment ça dépend des jours. Ce coeffficient dépend probablement à la fois de l'homogénéité des joueurs, et de la difficulté des donnes.

Pour un simultané (Super-Ronde) l'écart-type moyen a été 0,97 fois le maximum. Pour un autre (Roy René) 0,94. Pourquoi un peu plus élevé en proportion : effet de grand nombre ? choix de donnes "intéressantes", plus sélectives ?

On pourrait considérer que l'écart-type moyen d'une donne est 28% pour un grand simultané, 29 à 30% pour un petit tournoi de régularité, 28 à 29% pour un tournoi à deux sections. Bref c'est assez stable.

Au passage, une curiosité pour matheux

L'écart-type sur une donne est donc en général autour de 30%, sa valeur dépendant des fréquences.

Une fréquence, c'est la suite des nombres de fois où des scores identiques ont été obtenus, en partant du plus grand vers le plus petit. Le nombre de telles suites de fréquences possibles sur une donne jouée N fois est, amusez-vous à le vérifier, 2 puissance (N-1).

Ce qui compte pour les résultats et leur écart-type, bien sûr, ce ne sont pas les scores, mais les fréquences. On pourrait imaginer que pour des donnes jouées 10 fois, il y ait 2 puissance 9 = 512 écarts-types possibles, autant que de fréquences... Eh non, il n'y en a que 42 (et encore, certains parmi les 42 se trouvent être égaux).

Seuls interviennent les chiffres des fréquences, et pas leur ordre (il suffit de le démontrer pour deux scores voisins, et en tout cas on peut le constater). Si le chelem avait été plus difficile, réussi une fois et 4 fois chuté d'une levée, et qu'il y ait 2 fois 450 et une fois 480, au lieu de l'inverse, donnant des fréquences 1-1-2-3-4-2 au lieu de 4-2-1-3-1-2, on aurait exactement le même écart-type de 30,5%. Idem pour 4-3-2-2-1-1 ou n'importe quelle permutation des 6 chiffres 4-3-2-2-1-1.

Et pourquoi 42 ? C'est le nombre de "partitions" du nombre 10, rien à voir avec la musique, c'est le nombre de façons de "partir", ancien français pour décomposer (d'où l'expression "avoir maille à partir"), 10 en somme de nombres entiers. Cette notion a été étudiée par le génial mathématicien Euler au XVIIIè siècle. 10 = 10, mais aussi 9+1, 8+2, 8+1+1, 7+3, et il y a au total 42 partitions différentes de 10. Tout ça aussi, ça se calcule, soit avec de belles formules théoriques avec des développements en série, soit bêtement au XXIè siècle en quelques coups d'Excel avec une astucieuse formule de récurrence. Tout fout le camp.

Au fait, le nombre de partitions de 100 est 190 569 292. Vous n'en avez rien à faire, moi non plus.

Ecart-type du pourcentage final

Si les résultats étaient indépendants entre donnes, l'écart-type sur le résultat du tournoi serait l'écart-type moyen d'une donne (28 à 30%), divisé par la racine carrée du nombre de donnes jouées (24 à 27, donc division par 5 environ). Donc un peu moins de 6% .

Mais les résultats ne sont évidemment pas indépendants : les paires de bon niveau seront beaucoup plus souvent au-dessus de la moyenne et inversement d'autres en dessous. Le pourcentage final d'une paire qui a bien marché sur quelques donnes est probablement plus grand que si ses résultats sur les autres donnes étaient équilibrés. Même chose pour les joueurs plus faibles, on peut s'attendre (en moyenne bien sûr) à ce qu'ils subissent beaucoup de mauvais coups, et ils seront plus bas que si tout le monde était de même force.

Ceci revient à réduire l'effet statistique, à diviser par moins que la racine carrée du nombre de donnes, et devrait augmenter l'écart-type des résultats.

Pour le vérifier, j'ai calculé sur quelques tournois (4) de régularité, d'une part l'écart-type des pourcentages des résultats réels des NS et des EW, d'autre part un écart-type théorique qui serait l'écart-type d'une donne typique, et enfin le rapport entre les deux.

On constate :

une forte variabilité, avec des écarts-types qui varient entre 5 et 9%
pas de lien évident entre l'écart-type dans une diagonale et dans l'autre
l'écart-type moyen est environ 6,5%, 1,15 fois ce qu'il serait en cas de décorrélation
un peu plus de la moitié des joueurs sont entre 45 et 55%

Pour consolider le dernier point avec non plus 5 mais sur 20 tournois de régularité, sans saisir l'ensemble des scores mais en comptant seulement combien sont entre 45% et 55% : sur 486 paires au total, il y en a 260 : 53,5% des paires sont entre 45 et 55%.

Attention à la dispersion statistique

Ces comportements différents d'un tournoi à l'autre sont majoritairement l'effet du hasard et il ne faut pas trop chercher à les interpréter en fonction des donnes et des joueurs en présence...

En effet si on fabrique des résultats totalement aléatoires avec une moyenne recalée à 50% et un écart-type ajusté à 6,8% (valeur choisie pour avoir environ 53% de joueurs près de la moyenne, l'écart-type est un peu différent car cette simulation utilise des variables aléatoires gaussiennes), sur un essai avec 10 tournois de régularité de 12 tables, donc 20 classements, on obtient des résultats assez comparables à ce qui a été obtenu sur les vrais tournois étudiés, et à ce que l'on rencontre dans la vraie vie :

des écarts-types des résultats qui vont de moins de 3% à plus de 9%
des minimums entre 36 et 44%
des maximums entre 54 et 68%

Une autre série d'essais a donné un tournoi avec les premiers à 72%.

Pour les simultanés

Comme c'est assez lourd, deux seulement (une Super-ronde et un Roy René) ont été traités en écart-type, prudence... : il semble que la dispersion soit un peu plus forte : 7 à 7,6% d'écart-type pour les pourcentages dans chaque diagonale.

Sans faire ce traitement qui nécessite des saisies fastidieuses, 10 gros simultanés (5 Super-rondes et 5 Roy René, avec en moyenne plus de 900 paires par ligne, ont été regardés, simplement pour voir où se situent les barres des 60, 55, 45 et 40%. Sur cet échantillon :

8,4% des paires (6,7 à 10 suivant les tournois) sont au-dessus de 60%
51% des paires (48 à 55 suivant les tournois) sont entre 45 et 55%
8,7% des paires (6,5 à 9,6 suivant les tournois) sont en dessous de 40%

Il semble que les simultanés sont légèrement plus "dispersifs" que les tournois de régularité, en tout cas sur l'échantillon traité, puisque le pourcentage de paires près de la moyenne est un peu plus faible (51% contre 53,5 sur des petits tournois). Ce constat va dans le même sens que l'estimation un peu plus forte pour l'écart-type, 1,2 fois celui que l'on aurait en divisant par racine du nombre de donnes.

Et les résultats sont forcément plus stables : comme des centaines de paires sont concernées, le profil des pourcentages en fonction du classement est sans surprise, sauf pour les très faibles et les très forts pourcentages. J'en ai vu un avec un score à 77%... à se demander si on ne rêve pas.

retour...

BridgeMD

Fréquences et pourcentages