Proposta de trabalho nº 2

A seguir apresentam-se 3 conjuntos de dados A, B e C, preparados pelo estatístico Frank Anscombe, para ilustrar os perigos de calcular medidas sem primeiro representar os dados. Os conjuntos de dados A, B e C têm a mesma correlação e a mesma recta de regressão (Moore, 1995):

 

A

                     
x
10
8
13
9
11
14
6
4
12
7
5
y
8.04
6.95
7.58
8.81
8.33
9.96
7.24
4.26
10.84
4.82
5.6
B                      
x
10
8
13
9
11
14
6
4
12
7
5
y
9.14
8.14
8.74
8.77
9.26
8.10
6.13
3.10
9.13
7.26
4.74
C                      
x
8
8
8
8
8
8
8
8
8
8
19
y
6.58
5.76
7.71
8.84
8.47
7.04
5.25
5.56
7.91
6.89
12.50

1.
Calcule a média da variável x e a média da variável y, em cada um dos conjuntos.
2. Calcule o coeficiente de correlação e a recta de regressão para cada um dos conjuntos e verifique que são iguais.
3. Para cada um dos conjuntos de dados represente a nuvem de pontos e a recta de regressão.
4. Em qual das situações acha que pode utilizar a recta de regressão para predizer o valor de y para x=13.5? Justifique a resposta.
Resolução Com TI83
1
Para o grupo de dados A (L1, L2), relativamente a xe y , obtemos

Para o grupo de dados B(L3,L4), obtemos

Para o grupo C(L5,L6), obtemos
2.
Para o grupo A: Realizei uma ordenação descendente STAT EDIT 3:SortD(L1,L2). O coeficiente de correlação é 0.8182293906 (VARS 5:Statistics EQ 7:r) e a recta de regressão tem equação y=0.503x+2.966636364 (VARS 5:Statistics EQ 1:RegEQ ou STAT CALC 4:LinReg(ax+b))
3.
A nuvem de pontos e a recta de regressão correspondente aos dados do grupo A é:

2.
Para o grupo B, realizei as mesmas operações tendo obtido os mesmos resultados para r e para a equação da recta. Para o grupo C, obtive os seguintes resultados r= 0.816521 4369 e para equação da recta y=0.49990909090908x+3.0017272727274
3.
As nuvens de pontos são diferentes, como se pode ver nos gráficos seguintes para B e C respectivamente:

4.
Pela análise das nuvens e das rectas, ressalta que só para o grupo A podemos presumir alguma interpolação como meio para obter o possível valor de y para x=13.5

Arsélio Martins