Médiane de la plage

La fonction Médiane de la plage sert à calculer une médiane à partir d’une série de données fournissant un comptage dans une plage.  Dans le cadre de ces explications, les revenus de ménages médians sont utilisés et les exemples de données sont les données AGS 2004 pour Boulder County, Colorado.

Les données fournies pour AGS pour Boulder se présentent comme suit :

Var.

Desc

Foyers

Total cumulé

HIXCYLT05

Revenu de 0 à 5 000 USD

4233

4233

HIXCY0510

Revenu de 5 000 à 9 999 USD

2991

7224

HIXCY1015

Revenu de 10 000 à 14 999 USD

4277

11501

HIXCY1520

Revenu de 15 000 à 19 999 USD

4364

15865

HIXCY2025

Revenu de 20 000 à 24 999 USD

4756

20621

HIXCY2530

Revenu de 25 000 à 29 999 USD

4991

25612

HIXCY3035

Revenu de 30 000 à 34 999 USD

5483

31095

HIXCY3540

Revenu de 35 000 à 39 999 USD

5109

36204

HIXCY4045

Revenu de 40 000 à 44 999 USD

5180

41384

HIXCY4550

Revenu de 45 000 à 49 999 USD

4709

46093

HIXCY5055

Revenu de 50 000 à 54 999 USD

4784

50877

HIXCY5560

Revenu de 55 000 à 59 999 USD

4701

55578

HIXCY6065

Revenu de 60 000 à 64 999 USD

4720

60298

HIXCY6570

Revenu de 65 000 à 69 999 USD

3637

63935

HIXCY7075

Revenu de 70 000 à 74 999 USD

3943

67878

HIXCY7580

Revenu de 75 000 à 79 999 USD

4110

71988

HIXCY8085

Revenu de 80 000 à 84 999 USD

3680

75668

HIXCY8590

Revenu de 85 000 à 89 999 USD

3057

78725

HIXCY9095

Revenu de 90 000 à 94 999 USD

2785

81510

HIXCY95100

Revenu de 95 000 à 99 999 USD

2523

84033

HIXCY10025

Revenu de 100 000 à 124 999 USD

11234

95267

HIXCY12550

Revenu de 125 000 à 149 999 USD

6186

101453

HIXCY15020

Revenu de 150 000 à 199 999 USD

5015

106468

HIXCY20050

Revenu de 200 000 à 249 999 USD

1969

108437

HIXCY25050

Revenu de 250 000 à 499 999 USD

2463

110900

HIXCYGT500

Revenu de 500 000 USD et plus

1523

112423

Ces données tiennent compte des ménages dans chaque plage de revenus.  Comment calculons-nous une médiane à partir des fourchettes?  Pour en revenir à la définition d'une médiane, "une valeur dans un ensemble ordonné de valeurs ci-dessous et au-dessus de laquelle il ya un nombre égal de valeurs (à partir de dictionary.com)", nous devons d'abord trouver la plage où le point médian doit exister.  Le tableau ci-dessus contient 112 423 ménages. Le revenu médian des ménages est le ménage pour lequel 56 211 ménages sont supérieurs et inférieurs à ce dernier. Si l’on consulte le total cumulé ci-dessus, nous pouvons constater que la médiane doit être située dans la plage 60 000-64 999 USD.

Maintenant que nous savons que le revenu médian pour Boulder County est situé dans la plage 60 000-64 999 USD, nous voulons le déterminer avec plus de précisions.  En réalité, nous ne disposons d’aucune information sur les ménages de cette plage.  Les 4 720 ménages pourraient tous bénéficier d’un revenu de 60 001 USD ou de 64 999 USD. La médiane pourrait être n’importe quelle valeur de cette plage, mais nous pouvons supposer qu’une courbe en cloche s’applique et que la répartition des ménages est équitable dans cette plage.  Nous savons que la médiane est de 633 ménages dans la plage (56 211 - 55 578 = 633), soit 13,4 % (100 * 633/4 720 = 633).  Pour simplifier, nous pouvons supposer que la médiane correspond à 13,4 % dans la plage, soit 670 ménages dans la plage (0,134 * 5 000 + 60 000 = 60670).

Organigramme des revenus des ménages pour Boulder County

Affinons à présent l’estimation afin d’obtenir le résultat le plus précis possible.  Si nous consultons l’organigramme ci-dessus des revenus des ménages de Boulder, nous constatons une forte baisse entre les groupes 60 000-65 000 USD et 65 000-70 000 USD.  Nous avons déjà supposé qu’il y avait un nombre égal de personnes bénéficiant d’un revenu dans toute la plage 60 000-65 000 USD. Toutefois, nous pouvons supposer que cette plage présente une chute similaire à celle entre les plages, et que les ménages sont plus concentrés au début de la plage.  Ainsi, la fonction RangeMedian fait un modèle très simpliste de la courbe (il ne regarde que 1 plage au-dessus et 1 plage en dessous de la fourchette médiane.)  En utilisant une petite zone sous le calcul de la courbe, nous pouvons plus précisément placer la médiane à 60653.  Les détails exacts du calcul sont un peu trop compliqués pour être exposés ici, mais le résultat est toujours très similaire à la méthode simpliste ci-dessus, juste légèrement plus précis.

Formule RangeMedian permettant de calculer le revenu médian des ménages

RANGEMEDIAN(0,[HIXCYLT05],5000,[HIXCY0510],10000,[HIXCY1015],15000,[HIXCY1520],20000,[HIXCY2025],25000,[HIXCY2530],30000,[HIXCY3035],35000,[HIXCY3540],40000,[HIXCY4045],45000,[HIXCY4550],50000,[HIXCY5055],55000,[HIXCY5560],60000,[HIXCY6065],65000,[HIXCY6570],70000,[HIXCY7075],75000,[HIXCY7580],80000,[HIXCY8085],85000,[HIXCY8590],90000,[HIXCY9095],95000,[HIXCY95100],100000,[HIXCY10025],125000,[HIXCY12550],150000,[HIXCY15020],200000,[HIXCY20050],250000,[HIXCY25050],500000,[HIXCYGT500])