Estatística na Mão

Sem mistérios e sem complicação

Artigos sobre Estatística



Visualizações: 222

Calculando Diversidade com R - Parte II

Introdução

Vimos no artigo Calculando Diversidade com R (Rodrigues, 2016) como calcular a diversidade inserindo dados diretamente no script. Neste artigo, demonstraremos como fazer a partir da leitura de um arquivo csv ou txt, onde os dados são separados por ponto-vírgula (;).

A vantagem de criar um arquivo de dados ou datafile está na facilidade de correções dos dados se necessário, na inserção de várias espécies e levantamentos, por exemplo. Detectar onde há erro com maior facilidade, uma vez que há separação dos dados.

Preparo do arquivo de dados

Para preparar um arquivo de dados, você pode usar uma planilha Excel, um arquivo texto, um arquivo CSV (Comma Separated Value), que são os mais comuns no R. Estes aequivos devem ser padronizados. Trabalharemos neste artigo com arquivos CSV, como extensão CSV, mas resaltando que você pode montar a estrutura deste tupo de arquivo em um arquivo com extensão txt.

Primero você precisa determinar o tipo de separador se vírgula (,) ou ponto e vírgula (;), pois no momento de montar o script do R isso fará toda a diferença na leitura dos dados.

Você pode usar vários editores de textos para preprarar seu arquivo CSV, por exemplo, Bloco de Notas do Windows, Microsoft Excel, LibreOffice Calc, CSVed, KW Online CSV Editor, dentre outros.

Usaremos o Bloco de Notas, por ser de fácil uso e ter uma interface limpa. Inicialmente abriremos o Bloco de Notas e inciaremos a construção do arquivo. Nesse ponto, cabe uma explicação de como montar o arquivo: A primeira linha é dedicada ao cabeçalho do arquivos, ou seja, nesta linha constará o nome do levantamento, o númeo da amostra, o nome do lugar e etc. Aqui poderemos usar caracteres numéricos e não numéricos. Da segunda linha em diante, apenas podemos usar caracteres numéricos, com excessão da vírgula ou ponto e vírgula (separador de valores).

Ressaltando que o número de indivíduos é exato (inteiro), portanto, não trabalharemos decimais. Ressalta-se ainda, que os valores a serem avaliados não podem ser valores médios, mas sim a frquência absoluta ou frequência observada.

Formatação dos dados

Os dados devem estar dispostos conforme a Figura 1 abaixo. Verifique que são cinco amostras e portanto em cada linha deve conter cinco dados, caso não exista a ocorrência da espécies, substitua por 0 (zero)

Figura 1. Construção do arquivo no formato CSV usando o Bloco de Notas.

Note que para salvar o arquivo com extensão CSV, você precisa alterar, na caixa de diálogo de salvar ou salvar como, a opção tipo de "Documento de testo (*.txt)", para "Todos os arquivos (*.*)". No momento de nomerar o arquivo, ao final escreva .csv, por exemplo, diversidade.csv

Figura 2. Salvando arquivo do bloco de Notas como CSV.

Detalhes das Fórmulas de Diversidade

Para detalhes das fórmulas recomendamos a leitura do artigo Calculando Diversidade com R (Rodrigues, 2016), que contém tanto as fórmulas quanto as funções para script em R.

Calculando com R

Script

Abaixo disponibilizaremos o script em R,contendo comentários, para melhor entendimento, mas você pode baixar aqui Da mesma forma vocês pode baixar aqui o arquivo CSV modelo.

#################################################################################
## Este Script R foi criado pelo projeto Estatística na Mão
## Autor: William Costa Rodrigues
## Data: 28/v/2017
## Versão: 1.0
#################################################################################
##Carrega a biblioteca vegan, para proceder as análises
library(vegan)
##Lê o arquivo localmente, note que o separador (sep) está configurado como  vírgula, 
##se você usar ponto e vírgula em seu arquivo mude este parâmetro
##Por padrão a linha da função 'dados=read.csv...' e 'dados', abaixo serão marcado como comentário, para usá-la,
##basta retirar o caractere # e em seguida alterar o parâmetro 'file' para o caminho do seu arquivo salvo no computador
#dados=read.csv(file="c:/xampp/htdocs/estatisticanamao/files/diversidade_especies.csv",header = T, sep=",")
##Exibe os dados do arquivo lido
##dados

#Usaremos a leitura do arquivo de exemplo hospedado no site Estatística na Mão
dadosurl=read.csv(url("http://estatisticanamao.agroamb.com.br/files/diversidade_especies.csv"),header = T, sep=",")
##Exibe os dados do arquivo lido
dadosurl

##Calcularemos a divesidade pelo índice de Shannon-Wiener
##Note que usamos a base log (base=2.718282...), mas pode ser usada a base 2 ou 10, a critério do usuários
DivSW=diversity(dadosurl,index="shannon", base=2.718282)
##Exibe os valores das diversidades de Shannon-Wiener por amostra
DivSW
##Calcularemos a divesidade pelo índice de Simpsom
DivSimp=diversity(dadosurl,index="simpson")
##Exibe os valores das diversidades de Simpson por amostra
DivSimp
##Calcularemos a divesidade pelo índice de Simpson inverso (1/D) ou (1/DivSimpson)
invSimpson=diversity(dadosurl,index="invsimpson")
##Exibe os valores das diversidades de Simpson inverso 
invSimpson
##Calcularemos o valor alfa para cada amostra
fa= fisher.alpha(dadosurl)
##Exibe os valores de Alfa Fisher
fa

##Fim do Script

Resultados

Abaixo são exibidos os resultados das diversidades com base nos dados do arquivo CSV modelo.

> #################################################################################
> ## Este Script R foi criado pelo projeto Estatística na Mão
> ## Autor: William Costa Rodrigues
> ## Data: 28/v/2017
> ## Versão: 1.0
> #################################################################################
> ##Carrega a biblioteca vegan, para proceder as análises
> library(vegan)
> ##Lê o arquivo localmente, note que o separador (sep) está configurado como  vírgula, 
> ##se você usar ponto e vírgula em seu arquivo mude este parâmetro
> ##Por padrão a linha da função 'dados=read.csv...' e 'dados', abaixo serão marcado como comentário, para usá-la,
> ##basta retirar o caractere # e em seguida alterar o parâmetro 'file' para o caminho do seu arquivo salvo no computador
> #dados=read.csv(file="c:/xampp/htdocs/estatisticanamao/files/diversidade_especies.csv",header = T, sep=",")
> ##Exibe os dados do arquivo lido
> ##dados
> 
> #Usaremos a leitura do arquivo de exemplo hospedado no site Estatística na Mão
> dadosurl=read.csv(url("http://estatisticanamao.agroamb.com.br/files/diversidade_especies.csv"),header = T, sep=",")
> ##Exibe os dados do arquivo lido
> dadosurl
  amostra.1 amostra.2 amostra.3 amostra.4 amostra.5
1        12        15        21         6        32
2        15        26        35        10        15
3         6        18        32        36        12
4        25        18        31        20        18
5        25        22        19        21        21
> 
> ##Calcularemos a divesidade pelo índice de Shannon-Wiener
> ##Note que usamos a base log (base=2.718282...), mas pode ser usada a base 2 ou 10, a critério do usuários
> DivSW=diversity(dadosurl,index="shannon", base=2.718282)
> ##Exibe os valores das diversidades de Shannon-Wiener por amostra
> DivSW
[1] 1.477269 1.512001 1.447214 1.585521 1.605380
> ##Calcularemos a divesidade pelo índice de Simpsom
> DivSimp=diversity(dadosurl,index="simpson")
> ##Exibe os valores das diversidades de Simpson por amostra
> DivSimp
[1] 0.7471606 0.7597294 0.7389053 0.7900191 0.7983539
> ##Calcularemos a divesidade pelo índice de Simpson inverso (1/D) ou (1/DivSimpson)
> invSimpson=diversity(dadosurl,index="invsimpson")
> ##Exibe os valores das diversidades de Simpson inverso 
> invSimpson
[1] 3.955080 4.161975 3.830028 4.762339 4.959184
> ##Calcularemos o valor alfa para cada amostra
> fa= fisher.alpha(dadosurl)
> ##Exibe os valores de Alfa Fisher
> fa
[1] 1.156875 1.104586 1.095615 1.073675 1.084347
> 
> ##Fim do Script
> 

Referências

Oksanen, J., F.G. Blanchet, M. Friendly, R. Kindt, P. Legendre, D. McGlinn, P.R. Minchin, R.B. O'Hara, G.L. Simpson, P. Solymos, M.H.H. Stevens, E. Szoecs & H. Wagner, 2017. Community Ecology Package - Package ‘vegan’: Version 2.4-3, 292 p. Disponível em: https://cran.r-project.org/web/packages/vegan/vegan.pdf.

Rodrigues, William Costa, 2016. Calculando Diversidade com R. Estatística na Mão. Disponível em: http://estatisticanamao.agroamb.com.br/artigos.aspx?ID=14 [Acesso em: 28.05.2017].

Como citar este artigo:
Rodrigues, William Costa, 2017. Calculando Diversidade com R - Parte II. Estatística na Mão. Disponível em: http://estatisticanamao.agroamb.com.br/estatisticanamao/artigos.aspx?ID=15?ID=15. [Acesso em: 14.12.2017].



Topo