Curso R

Teste de Hipóteses

Alexandre Adalardo de Oliveira

Ecologia- IBUSP abril 2019

## Registered S3 methods overwritten by 'ggplot2':
##   method         from 
##   [.quosures     rlang
##   c.quosures     rlang
##   print.quosures rlang

Teste de Hipóteses

Teste de Hipóteses

  1. lógica do teste
  2. significado do p-valor
  3. tabela de anova (partição da variância)
  4. biologia <-> estatística

Teste de Hipóteses

Sir Ronald A. Fisher

Drawing

Desenho Experimental

Drawing Drawing

Referência em diferentes áreas

Drawing Drawing Drawing

Sir Ronald A. Fisher

Drawing Drawing

Pink

Inferência Estatística

Inferência Estatística

“fazer afirmações sobre um universo a partir de um conjunto de valores representativo (amostra). Tal tipo de afirmação deve sempre vir acompanhada de uma medida de precisão sobre sua veracidade”

Inferência Estatística

fazer afirmações sobre um universo a partir de um conjunto de valores representativo (amostra). Tal tipo de afirmação deve sempre vir acompanhada de uma medida de precisão sobre sua veracidade

Amostra de Palmitos

Teoria de Amostragem

Conexão entre população e amostra

Variabilidade da amostra (erro)

Lei dos grandes números

Teorema do Limite Central

Palmito (Euterpe edulis)

Drawing

Parque Estadual de Carlos Botelho

## [1] "palmcb"
##  int [1:1981] 15 15 15 15 15 15 15 15 15 15 ...

Palmitos de Carlos Botelho

Palmitos de Carlos Botelho

## [1] 32.60071
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    15.0    21.0    31.0    32.6    43.0    73.0
##  [1] 22 19 36 34 38 35 23 16 35 40
## [1] 34.8

Amostra de Palmitos

## [1] 35.3
## [1] 32.7
## [1] 30.6
## [1] 34

Palmitos de Carlos Botelho

##  [1] 26.9 25.2 34.4 39.8 33.3 24.3 32.8 35.3 32.0 38.1

Palmitos de Carlos Botelho

Lei dos Grandes Números

Teoria do Limite Central

Biologia

Pergunta

Os palmitos em Carlos Botelho são, em média, maiores que os da restinga da Ilha do Cardoso?

Hipótese Biológica

Drawing Drawing

Hipótese Biológica

Pergunta:

Os palmitos em Carlos Botelho são maiores que os da restinga da Ilha do Cardoso?

Hipótese:

Palmito em solos mais argilosos e férteis crescem mais que os de solos arenosos e pobres

Predição:

A média do perímetro dos palmitos em Carlos Botelho é maior que a média da restinga da Ilha do Cardoso

Hipótese Biológica

Pergunta:

Os palmitos em Carlos Botelho são maiores que os da restinga da Ilha do Cardoso?

Hipótese:

Palmito em solos mais argilosos e férteis crescem mais que os de solos arenosos e pobres

Predição:

A média do perímetro dos palmitos em Carlos Botelho é maior que a média da restinga da Ilha do Cardoso

Hipótese Biológica

Pergunta:

Os palmitos em Carlos Botelho são maiores que os da restinga da Ilha do Cardoso?

Hipótese:

Palmito em solos mais argilosos e férteis crescem mais que os de solos arenosos e pobres

Predição:

A média do perímetro dos palmitos em Carlos Botelho é maior que a média da restinga da Ilha do Cardoso

Amostra Palmito

## 'data.frame':    4424 obs. of  2 variables:
##  $ pap  : num  15 15 15 15 15 15 15 15 15 15 ...
##  $ local: Factor w/ 2 levels "PECB","PEIC": 1 1 1 1 1 1 1 1 1 1 ...

Amostra Palmito

Estatística de interesse

## [1] 35.64
## [1] 25.495
## [1] 10.145

Afirmação

fazer afirmações sobre um universo a partir de um conjunto de valores representativo (amostra). Tal tipo de afirmação deve sempre vir acompanhada de uma medida de precisão sobre sua veracidade

## [1] 10.145

Os palmitos de CB são maiores que na IC?

Erro Amostral

Medida de Incerteza

fazer afirmações sobre um universo a partir de um conjunto de valores representativo (amostra). Tal tipo de afirmação deve sempre vir acompanhada de uma medida de precisão sobre sua veracidade


Os palmitos de CB são maiores que da IC?

Organizando nossos resultados

##   PEIC   PECB 
## 25.495 35.640
##   PECB 
## 10.145

Cenário Nulo

A diferença observada pode ser gerada pelo acaso?

Cenário Nulo

##   PEIC   PECB 
## 29.930 31.205
##  PECB 
## 1.275
##  PECB 
## 1.025
##   PECB 
## -0.865

Distribuição Nula

Representação dos dados

Representação dos dados

Animação Nula

Null Anima

Distribuição Nula

Incerteza Sobre a Afirmação

A probabilidade da diferença observada ter sido gerada pelo acaso.


## [1] 1
## [1] 0.001

Incerteza Sobre a Afirmação

A probabilidade da diferença observada ter sido gerada pelo acaso.


## [1] 1
## [1] 0.001

p-valor

Teste Frequentista

Test T

## 
##  Welch Two Sample t-test
## 
## data:  amoscb and amosic
## t = 5.4706, df = 198, p-value = 6.723e-08
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
##  7.080347      Inf
## sample estimates:
## mean of x mean of y 
##    35.640    25.495

Vamos ao

Pink

Tabela de Anova

Anova: um exemplo

## 'data.frame':    30 obs. of  2 variables:
##  $ tipo: Factor w/ 3 levels "arenoso","argiloso",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ prod: num  6 10 8 6 14 17 9 11 7 11 ...

Anova: um exemplo

Drawing

Anova: um gráfico

Anova: um gráfico

Cálculos base

## [1] 11.9
##  arenoso argiloso   húmico 
##      9.9     11.5     14.3

Gráfico base

Adicionando linhas: desvios

Segmentos: médias

Adicionando legenda

Variação interna aos grupos

Quanto difere da média do grupo

Desvios: total

Desvios: total

Quanto difere da média geral

Desvios: entre os grupos

Quanto a média do grupo difere da geral

Anova: partição da variância

Anova: partição da variância

Médias Quadráticas: intra

Médias Quadráticas: entre

Anova: partição da variância

Tabela de Anova

Drawing

Desvios quadráticos totais

\[SS_{total} = \sum_{i=1}^k\sum_{j=1}^n (y_{ij} - \bar{\bar{y}})^2 \]

##  [1]  6 10  8  6 14 17  9 11  7 11 17 15  3 11 14 12 12  8 10 13 13 16  9
## [24] 12 15 16 17 13 18 14
## [1] 11.9
## [1] 414.7

Tabela de Anova

Drawing

Soma Quadratica: intra

\[SS_{intra} = \sum_{i=1}^k\sum_{j=1}^n (y_{i,j} - \bar{y}_{i})^2 \]

##  [1]  6 10  8  6 14 17  9 11  7 11 17 15  3 11 14 12 12  8 10 13 13 16  9
## [24] 12 15 16 17 13 18 14
##  [1]  9.9  9.9  9.9  9.9  9.9  9.9  9.9  9.9  9.9  9.9 11.5 11.5 11.5 11.5
## [15] 11.5 11.5 11.5 11.5 11.5 11.5 14.3 14.3 14.3 14.3 14.3 14.3 14.3 14.3
## [29] 14.3 14.3
## [1] 315.5

Construindo a tabela de Anova

Drawing

Soma Quadráticos: entre

\[SQ_{entre} = \sum_{i=1}^k\sum_{j=1}^n (\bar{y}_{i} - \bar{\bar{y}})^2\]

##  [1]  9.9  9.9  9.9  9.9  9.9  9.9  9.9  9.9  9.9  9.9 11.5 11.5 11.5 11.5
## [15] 11.5 11.5 11.5 11.5 11.5 11.5 14.3 14.3 14.3 14.3 14.3 14.3 14.3 14.3
## [29] 14.3 14.3
## [1] 11.9
## [1] 99.2

Construindo a tabela de Anova

Drawing

Construindo a tabela de Anova

Drawing

Construindo a tabela de Anova

Drawing

Estatística F

\[F=\frac{\sigma^2_{entre}}{\sigma^2_{intra}}\]

ou

\[F=\frac{MQ_{entre}}{MQ_{intra}}\]

## [1] 4.244691

Distribuição F

Densidade Probabilística

Drawing

Distribuição F(2,27)

Distribuição F

Distribuição F(2,27) = 4.24

Finalizando a tabela de Anova

Drawing

Lógica da Anova

Vamos ao

Pink

Atividades desta tarde

  • Até as 16h:
    • tutorial 6
    • apostila
    • dúvidas das unidades anteriores
  • Após as 16h
    • dúvidas dos exercícios