Estatística na Mão

Sem mistérios e sem complicação

Artigos sobre Estatística



Visualizações: 410

Realizando Análises de Dados com PAST

Introdução

O PAST (PAleontological STatistical) é sem sombra de dúvidas um software de fácil uso. Outro ponto positivo para o PAST em comparação ao R trata-se dos gráficos, que são mais fáceis de serem criados, por não exigirem nenhum conhecimento da linguagem de sript do R ou qualquer outra, finalizando sobre os gráfico, temos ainda qualidade e estética, que em nada deixa a desejar.

Neste artigo trabalharemos com versão 3.15 - Current version (March 2017), que pode ser adquirido gratuitamente aqui .

Dados

Trabalharemos com dados fictícios, que trata-se de três locais e a frequência absoluta de 10 espécies de insetos. Conforme segue abaixo. O arquivo de dados pode ser baixado aqui .

	A	B	C
sp01	21	54	32
sp02	25	32	21
sp03	18	45	24
sp04	25	21	25
sp05	14	28	22
sp06	32	25	22
sp07	21	41	25
sp08	24	26	26
sp09	16	25	21
sp10	21	22	32

Em referência aos dados acima e a Figura 1 (abaixo), temos nas colunas os locais e nas linhas a frequência absoluta para cada espécie. Desta forma, temos uma matriz de 3x10.

Figura 1. Janela prncipal do PAST v 3.15, contendo os dados de três locais e frequência absoluta de 10 espécies (dados fictícios).

Análise dos Dados

Antes de iniciar as análises devemos elabora a hipótese nula a ser testada, aliás as hipóteses, a primeira para o teste de normalidade, como segue:

H0: A distribuição dos dados é NORMAL entre os locais estudados
H1: A distribuição dos dados é NÃO NORMAL entre os locais estudados

Para realizar a análise de normalidade dos dados, através do teste de Shapiro-Wilk (W), selecione as três colunas e em seguida acesse o menu Univariate, opção Normality tests. Será exibida a imagem conforme a Figura 2.

Figura 2. Testes de normalidades executado pelo PAST v3.15, para três locais e frequência absoluta de 10 espécies (dados fictícios).

Na aálise de normalidade dos dados verificamos que o local C, tem o valor de p-normal igual a 0,03905, que é menor que 0,05, portanto á dois caminhos a seguir: 1. Realizar a transformação dos dados em geral usa-se raiz(x+0,5), para miores detalhes acesse o artigo Transformação de Dados e 2. Continuar a análise considerando todos dados como não paramétricos, o que nem sempre é recomendado.

Para efeitos da análise faremos a transformação dos dados com raiz(x+0,5), uma vez que a propocionalidade entre as médias e a variância, exceto para o local C (Figura 3). Este sumário estatístico pode ser obtido, acessando o menu Univariate opção Summary statistics.

Figura 3. Análise de estatística básica ou descrição estatística ou sumário estatístico realizado através do PAST v3.15, para três locais e frequência absoluta de 10 espécies (dados fictícios).

Tansformação de Dados

Para proceder a transformação será necessário que você copie e cole os dados das colunas localA, localB e localC, nas colunas E, F e G (Figura 4)

De forma mais descritiva, os passo para a transformação dos dados são:

1. Copie e cole os dados das colunas localA, localB e localC, nas colunas E, F e G;
2. Seleciona a coluna E e em seguida acesse o menu Transform opção Evaluate Expression;
3. No parte inferior da tela que é exibida, sigite a seguinte expressão matamática, reconhecida pelo PAST sqrt(%E+0.5) em seguida clique em Compute;
4. Para transformar os dados da coluna F e G, refaça os passos 2 e 3, para cada coluna. Lembre-se de alterar o a coluna no campo de expressão matemática, que ficará assim para cada coluna sqrt(%F+0.5) e sqrt(%G+0.5).

Animação da Figura 4, permite que você entenda cada passo, para que a transformação seja realizada.

Figura 4. Procedimentos para a transformação de dados com PAST v3.15, para três locais e frequência absoluta de 10 espécies (dados fictícios).

Teste a ser utilizado

Antes de iniciar as análises devemos elabora a uma nova hipótese nula a ser testada, agora para verificar a nulidade ou não entre os locais estudados, quando a distribuição das espécies, como segue:

H0: Não há diferença na distribuição de espécies dos locais estudados
H1: Há há diferença na distribuição de espécies dos locais estudados

Como os dados estão distribuídos em três tratamentos, não poderemos usar o teste t-student, procederemos com a ANOVA (Análise de Variância), considerando que há repetições (espécies) e há apenas um único fato de variação (local).

Para proceder a análise, selecionamos as clunas E, F e G e em seguida selecionamos o menu Univariate opção ANOVA etc. (several samples) e em seguida Several-sample test (ANOVA, Krwskal-Wallis). Assim teremos os resultados conforme a Figura 5.

Figura 5. ANOVA (Análise de Variância) realizada com PAST v3.15, para três locais e frequência absoluta de 10 espécies (dados fictícios).

O valor de F é igual a 5,158, que por si só não diz muita coisa, valor de p(same) sim, pois rejeitaremos a hipóte nula (H0) caso ele seja p<0,05. Em nossa análise, temos a rejeição da hipótese nula, pois p(same)=0,01267e portanto verificamos que existe, ao menos, uma diferença entre os locais estudados quanto a distribuição das espécies. Desta forma, devemos selecionar na mesma janela a Aba Tukey's pairwise (Figura 6), que nos mostrará onde está ou estão as diferenças.

Figura 6. Teste de Tukey para médias realizada com PAST v3.15, para três locais e frequência absoluta de 10 espécies (dados fictícios).

Verificamos que a diferença está entre E e F, ou seja, localA e locaB, pois o campo está marcado de cor diferente (Figura 6).

Desta forma, concluímos que há diferença entre os locais no que se refere a distribuição das espécies, segundo o teste F (ANOVA) a 5% de probabilidade, sendo os locais A e B diferente entre si, mas não diferentes de C.

Similaridade entre Espécies ou Locais

Procederemos na análise da similaridade entre as espécies e entre os locais. Para isso usaremos o índice de similaridade de Morisita, que pode ser acessado, através do menu Multivaruiate opção Clustering e em seguidda Classical. Na janela que é exibida selecione a opção Morisita no campo Similarity index, depois seleciona a opção Two-way, por final presione o botão Compute (Figura 7). Será exibida um gráfico conforme a Figura 8.

Com os gráficos, podemos tirar algumas conclusões básicas, mas fundamentais para entender os dados. Desta forma, na Figura 7 verificamos que os locais A e C, são amis similares em termo de número de insdivíduos e que as espécies sp1 3 sp3, são da mesma forma similares (Figura 8 e 9)

Figura 7. Gráfico de similaridade através do índice de Morisita para locais e espécies, criado no PAST v3.15, para três locais e frequência absoluta de 10 espécies (dados fictícios).

Figura 8. Gráfico de similaridade através do índice de Morisit para espécies, criado no PAST v3.15, para três locais e frequência absoluta de 10 espécies (dados fictícios).

Gráficos

Aproveitaremos este artigo para dar uma pequena domonstração do gráficos gerados pelos PAST, ams este será assunto e outro artigos.

Na Figura 9, vemos o gráfico da distribuição normal do resíduo da análise de variância, um gáfico simple. Já na Figura 10, temos o grafico de barra com as barras de erro (Erro padrão), podendo ser exibido o desvio padrão.

Figura 9. Gráfico da distribuição de probabilidade normal do resíduo, através do PAST v3.15, para três locais e frequência absoluta de 10 espécies (dados fictícios).

Figura 10. Gráfico de barra com as barras do erro padrão, criado no PAST v3.15, para três locais e frequência absoluta de 10 espécies (dados fictícios).

Conclusão

O software PAST atende a demanda de uma análise de variância ou outra análise de dados. E em sendo uma ferramenta freeware, permite ao pesquisador obter excelentes resultados com custo extremamente baixo.

Referências

Hammer, Ø., D.A.T. Harper & P.D. Ryan, 2001. PAST: Paleontological statistics software package for education and data analysis. Palaeontologia Electronica 4(1): 9pp. Disponível em: http://palaeo-electronica.org/2001_1/past/issue1_01.htm

Como citar este artigo:
Rodrigues, William Costa, 2017. Realizando Análises de Dados com PAST. Estatística na Mão. Disponível em: http://estatisticanamao.agroamb.com.br/estatisticanamao/artigos.aspx?ID=17?ID=17. [Acesso em: 20.10.2017].



Topo