Mediana da escala
A função mediana do intervalo é usada para calcular uma mediana de uma série de dados que dão uma contagem dentro de um intervalo. Para efeitos desta explicação, a renda familiar mediana será usada e os dados de exemplo serão AGS 2004 dados para Boulder County, Colorado.
Os dados como previsto para AGS para Boulder parece:
Var |
DESC |
Famílias |
Total acumulado |
---|---|---|---|
HIXCYLT05 |
Renda $0 a $5000 |
4233 |
4233 |
HIXCY0510 |
Renda $5000 a $9999 |
2991 |
7224 |
HIXCY1015 |
Renda $10000 a $14999 |
4277 |
11501 |
HIXCY1520 |
Renda $15000 a $19999 |
4364 |
15865 |
HIXCY2025 |
Renda $20000 a $24999 |
4756 |
20621 |
HIXCY2530 |
Renda $25000 a $29999 |
4991 |
25612 |
HIXCY3035 |
Renda $30000 a $34999 |
5483 |
31095 |
HIXCY3540 |
Renda $35000 a $39999 |
5109 |
36204 |
HIXCY4045 |
Renda $40000 a $44999 |
5180 |
41384 |
HIXCY4550 |
Renda $45000 a $49999 |
4709 |
46093 |
HIXCY5055 |
Renda $50000 a $54999 |
4784 |
50877 |
HIXCY5560 |
Renda $55000 a $59999 |
4701 |
55578 |
HIXCY6065 |
Renda $60000 a $64999 |
4720 |
60298 |
HIXCY6570 |
Renda $65000 a $69999 |
3637 |
63935 |
HIXCY7075 |
Renda $70000 a $74999 |
3943 |
67878 |
HIXCY7580 |
Renda $75000 a $79999 |
4110 |
71988 |
HIXCY8085 |
Renda $80000 a $84999 |
3680 |
75668 |
HIXCY8590 |
Renda $85000 a $89999 |
3057 |
78725 |
HIXCY9095 |
Renda $90000 a $94999 |
2785 |
81510 |
HIXCY95100 |
Renda $95000 a $99999 |
2523 |
84033 |
HIXCY10025 |
Renda $100, 0000 a $124999 |
11234 |
95267 |
HIXCY12550 |
Renda $125000 a $149999 |
6186 |
101453 |
HIXCY15020 |
Renda $150000 a $199999 |
5015 |
106468 |
HIXCY20050 |
Renda $200000 a $249999 |
1969 |
108437 |
HIXCY25050 |
Renda $250000 a $499999 |
2463 |
110900 |
HIXCYGT500 |
Renda $500000 Plus |
1523 |
112423 |
Isto está dando contagens das famílias em cada escala da renda. Como calculamos uma mediana dos intervalos? Voltando à definição de uma mediana, "um valor em um conjunto ordenado de valores abaixo e acima do qual há um número igual de valores (de Dictionary.com)", primeiro temos que encontrar o intervalo onde o ponto mediano deve existir. Há 112.423 famílias na tabela acima. A renda média HH é a casa onde 56.211 famílias estão acima e abaixo desse. Olhando para o total de execução acima, podemos ver que a mediana deve estar dentro da faixa de $60000 a $64999.
Assim agora que nós sabemos para a certeza que a renda mediana para o Condado de Boulder está entre $60K e $65k, nós gostaríamos de saber mais especificamente o que é. Na realidade, não temos qualquer informação sobre as famílias nesse intervalo. Todas as famílias 4720 poderia estar fazendo $60001 ou todos eles poderiam estar fazendo $64999, de modo que a mediana realmente poderia ser em qualquer lugar nessa faixa, mas podemos presumir que a maioria das áreas se encaixam uma curva de sino e há uma distribuição bastante uniforme de famílias nessa faixa. Sabemos que a mediana é 633 famílias na faixa (56211-55578 = 633) ou 13,4% (100 * 633/4720 = 633). Tão simplista podemos supor que a mediana é de 13,4% do caminho para o intervalo ou 670 de entrada no intervalo (. 134 * 5000 + 60.000 = 60670).
Boulder County renda familiar Chart
Agora, só porque não queremos ser muito simples e queremos produzir o resultado mais preciso possível, podemos levar a nossa estimativa um passo adiante. Se olharmos para o gráfico acima de invems hh em Boulder, vemos que há uma grande queda do grupo $60K-65K para o grupo $65K-70k. Acima de nós presumimos que havia um igual # de pessoas que fazem os seus próprios níveis de 65K de $60, mas podemos supor que há uma queda dentro da faixa é semelhante ao declínio entre as gamas e que o departamento de informações está mais concentrado na extremidade inferior do intervalo. Assim, a função RangeMedian faz um modelo muito simplista da curva (ele só olha para uma faixa acima e uma faixa abaixo da faixa mediana.) Usando uma pequena área o cálculo da curva, podemos mais precisamente colocar a mediana em 60653. Os detalhes exatos da matemática são um pouco complicado demais para colocar aqui, mas o resultado é sempre muito semelhante ao método acima simplista, mas um pouco mais preciso.
Fórmula RangeMedian para calcular a renda média hh
RANGEMEDIAN (0, [HIXCYLT05], 5000, [HIXCY0510], 10000, [HIXCY1015], 15000, [HIXCY1520], 20000, [HIXCY2025], 25000, [HIXCY2530], 30000, [HIXCY3035], 35000, [HIXCY3540], 40000, [HIXCY4045], 45000, [HIXCY4550], 50000, [HIXCY5055], 55000, [HIXCY5560], 60000, [HIXCY6065], 65000, [HIXCY6570], 70000, [HIXCY7075], 75000, [HIXCY7580], 80000, [HIXCY8085], 85000, [HIXCY8590], 90000, [HIXCY9095], 95000, [HIXCY95100], 100000, [HIXCY10025], 125000, [HIXCY12550], 150.000, [HIXCY15020], 200000, [HIXCY20050], 250000, [HIXCY25050], 500000, [HIXCYGT500])