[Dans son discours sur l’État de l’Union, Joe Biden à repris à son compte le nombre de victimes de la guerre de Gaza établi par le Hamas, sans même indiquer sa source. Il en a fait ainsi une donnée officielle américaine alors que le chiffre du Hamas est très probablement truqué. Le Bloc-note]
Abraham Wyner |
Voici le problème que posent ces données : Les chiffres ne sont pas réels. Cela est évident pour quiconque comprend le fonctionnement des nombres naturels. Les victimes ne sont pas majoritairement des femmes et des enfants, et la majorité d'entre elles sont peut-être des combattants du Hamas.
Si les chiffres du Hamas sont truqués ou frauduleux d'une manière ou d'une autre, il peut y avoir des preuves dans les chiffres eux-mêmes qui peuvent le démontrer. Bien qu'il n'y ait pas beaucoup de données disponibles, il y en a un peu, et elles sont suffisantes : Du 26 octobre au 10 novembre 2023, le ministère de la santé de Gaza a publié des chiffres quotidiens sur les victimes, qui comprennent à la fois un nombre total et un nombre spécifique de femmes et d'enfants.
Le premier élément à prendre en compte est le nombre "total" de décès. Le graphique du nombre total de morts par date augmente avec une linéarité presque métronomique, comme le montre le graphique de la figure 1.
Le graphique révèle une augmentation extrêmement régulière du nombre de victimes au cours de la période. Données agrégées par l'auteur et fournies par le Bureau de la coordination des affaires humanitaires des Nations unies (OCHA), sur la base des chiffres du ministère de la santé de Gaza.
Il est presque certain que cette régularité n'est pas réelle. On pourrait s'attendre à des variations assez importantes d'un jour à l'autre. En fait, le nombre de victimes rapporté quotidiennement au cours de cette période s'élève en moyenne à 270, plus ou moins 15 %. Il s'agit d'une variation étonnamment faible. Il devrait y avoir des jours avec le double de la moyenne ou plus et d'autres avec la moitié ou moins. Il se peut que le ministère de la bande de Gaza publie de faux chiffres quotidiens qui varient trop peu parce qu'il ne comprend pas bien le comportement des chiffres naturels. Malheureusement, les données de contrôle vérifiées ne sont pas disponibles pour tester formellement cette conclusion, mais les détails des comptages quotidiens rendent les chiffres suspects.
De même, nous devrions observer une variation du nombre d'enfants victimes qui suit la variation du nombre de femmes. En effet, la variation quotidienne du nombre de décès est due à la variation du nombre de frappes sur les bâtiments résidentiels et les tunnels, ce qui devrait entraîner une variabilité considérable des totaux, mais une variation moindre du pourcentage de décès dans les différents groupes. Il s'agit là d'une donnée statistique de base concernant la variabilité aléatoire. Par conséquent, les jours où il y a beaucoup de femmes tuées, il devrait y avoir un grand nombre d'enfants tués, et les jours où quelques femmes seulement sont déclarées tuées, quelques enfants seulement devraient être déclarés tués. Cette relation peut être mesurée et quantifiée par la statistique R-carré (R2 ) qui mesure le degré de corrélation entre le nombre quotidien de femmes tuées et le nombre quotidien d'enfants tués. Si les chiffres étaient réels, nous nous attendrions à ce que R2 soit nettement supérieur à 0 et tende vers 1,0. Mais R2 est de 0,017, ce qui n'est pas statistiquement et substantiellement différent de 0.
Le nombre quotidien d'enfants tués n'est absolument pas lié au nombre de femmes tuées. Le R2 est de 0,017 et la relation est statistiquement et substantiellement non significative.
Cette absence de corrélation est le deuxième élément de preuve circonstanciel suggérant que les chiffres ne sont pas réels. Mais il y a plus. Le nombre quotidien de femmes victimes devrait être fortement corrélé avec le nombre de personnes autres que des femmes et des enfants (c'est-à-dire des hommes). Là encore, ce phénomène est prévisible en raison de la nature des combats. Les flux et reflux des bombardements et des attaques d'Israël devraient faire évoluer le décompte quotidien de la même manière. Mais ce n'est pas ce que montrent les données. Non seulement il n'y a pas de corrélation positive, mais il y a une forte corrélation négative, ce qui n'a aucun sens et constitue le troisième élément de preuve que les chiffres ne sont pas réels.
La corrélation entre le nombre de décès quotidiens d'hommes et de femmes est absurdement forte et négative (valeur p < 0,0001).
Examinons d'autres anomalies dans les données : Tout d'abord, le nombre de décès rapporté le 29 octobre contredit les chiffres rapportés le 28, dans la mesure où ils impliquent que 26 hommes sont revenus à la vie. Cela peut être dû à une erreur d'attribution ou simplement à une erreur de déclaration. Il y a quelques autres jours où le nombre d'hommes est proche de 0. S'il ne s'agissait que d'erreurs de rapport, alors les jours où le nombre de décès d'hommes semble être erroné, le nombre de femmes devrait être normal, du moins en moyenne. Or, il s'avère que les trois jours où le nombre d'hommes est proche de zéro, ce qui suggère une erreur, le nombre de femmes est élevé. En fait, les trois jours où le nombre de victimes féminines est le plus élevé sont ceux-là.
Il y a trois jours où le nombre de victimes masculines est proche de 0. Ces trois jours correspondent aux trois jours où le nombre de victimes féminines est le plus élevé.
Dans l'ensemble, qu'est-ce que cela implique ? Bien que les preuves ne soient pas concluantes, elles suggèrent fortement qu'un processus non connecté ou vaguement connecté à la réalité a été utilisé pour rapporter les chiffres. Il est très probable que le ministère du Hamas ait fixé un total quotidien de manière arbitraire. Nous le savons parce que les totaux quotidiens augmentent trop régulièrement pour être réels. Il a ensuite attribué environ 70 % du total aux femmes et aux enfants, en répartissant ce chiffre de manière aléatoire d'un jour à l'autre. Ils ont ensuite rempli le nombre d'hommes fixé par le total prédéterminé. Cela explique toutes les données observées.
Il existe d'autres signaux d'alarme évidents. Le ministère de la santé de Gaza a toujours affirmé qu'environ 70 % des victimes étaient des femmes ou des enfants. Ce total est bien plus élevé que les chiffres rapportés lors des précédents conflits avec Israël. Un autre signal d'alarme, soulevé par Salo Aizenberg et abondamment commenté, est que si 70 % des victimes sont des femmes et des enfants et que 25 % de la population est constituée d'hommes adultes, soit Israël ne parvient pas à éliminer les combattants du Hamas, soit le nombre de victimes masculines adultes est extrêmement faible. En soi, cela suggère fortement que les chiffres sont au minimum grossièrement inexacts et très probablement carrément truqués. Enfin, le 15 février, le Hamas a admis avoir perdu 6.000 de ses combattants, ce qui représente plus de 20 % du nombre total de victimes annoncé.
Dans l'ensemble, le Hamas déclare non seulement que 70% des victimes sont des femmes et des enfants, mais aussi que 20 % d'entre elles sont des combattants. Cela n'est pas possible, à moins qu'Israël ne tue pas les hommes non combattants, ou que le Hamas affirme que presque tous les hommes de Gaza sont des combattants du Hamas.
Existe-t-il de meilleurs chiffres ? Certains commentateurs objectifs ont reconnu que les chiffres du Hamas lors des précédentes batailles contre Israël étaient à peu près exacts. Néanmoins, cette guerre n'a rien à voir avec celles qui l'ont précédée, que ce soit en termes d'ampleur ou de portée ; les observateurs internationaux qui étaient en mesure de suivre les guerres précédentes sont aujourd'hui totalement absents, de sorte que le passé ne peut pas être considéré comme un guide fiable. Le brouillard de la guerre est particulièrement épais à Gaza, ce qui rend impossible la détermination rapide et précise du nombre de morts civils. Non seulement le décompte officiel des morts palestiniens ne différencie pas les soldats des enfants, mais le Hamas impute également tous les décès à Israël, même s'ils sont dus à des tirs de roquettes erronés, à des explosions accidentelles, à des meurtres délibérés ou à des batailles internes. Un groupe de chercheurs de la Johns Hopkins Bloomberg School of Public Health a comparé les rapports du Hamas aux données relatives aux travailleurs de l'UNRWA. Selon eux, les taux de mortalité étant à peu près similaires, les chiffres du Hamas ne doivent pas être gonflés. Mais leur argument reposait sur une hypothèse cruciale et non vérifiée : les travailleurs de l'UNRWA ne sont pas plus susceptibles d'être tués que le reste de la population. Cette hypothèse ne tient plus depuis qu'il a été découvert qu'une fraction importante des travailleurs de l'UNRWA était affiliée au Hamas. Certains ont même participé au massacre du 7 octobre.
La vérité ne peut pas encore être connue et ne le sera probablement jamais. Le nombre total de victimes civiles est probablement très exagéré. Israël estime qu'au moins 12.000 combattants ont été tués. Si ce chiffre s'avère même raisonnablement exact, le rapport entre le nombre de victimes non combattantes et le nombre de combattants est remarquablement bas : au maximum 1,4 pour 1 et peut-être même 1 pour 1. Selon les normes historiques de la guerre urbaine, où les combattants sont déployés au-dessus et au-dessous des centres de population civile, il s'agit d'un effort remarquable et réussi pour éviter les pertes inutiles en vies humaines tout en combattant un ennemi implacable qui se protège lui-même avec des civils.
Les données utilisées dans l'article sont disponibles ici. Nous remercions Salo Aizenberg qui a aidé à vérifier et à corriger ces chiffres.
----------------------------------------
Références :
How the Gaza Ministry of Health Fakes Casualty Numbers, traduction Le Bloc-note
par Abraham Wyner, Tablet, 07 Mars 2024
Abraham Wyner est professeur de statistiques à la Wharton School of Business depuis 11 ans. Il préside le programme de premier cycle en statistiques et science des données à l'université de Pennsylvanie. Expert en modèles de probabilité et en statistiques, il s'est principalement consacré à la recherche sur les probabilités appliquées, la théorie de l'information et l'apprentissage statistique.