Estatística na Mão

Sem mistérios e sem complicação

Artigos sobre Estatística



Visualizações: 285

Usando R: Introdução

Introdução

Este não é apenas mais um tutorial da liguagem R. A ideia por trás deste artigo é apresentar o R de uma visão diferenciada para os Entomólogos (Entomologistas). Porém alguns poderão achar igual à outros tutoriais ou textos disponíveis, mas com um apelo mais prático e com exemplos para cada situação. O foco desta série de artigos técnicos é voltado para área de Entomologia, mas se aplica a qualquer área biológica.
O R é uma linguagem orientada a manipulação de objetos, que interpreta scripts gerados em arquivo de texto, salvos com a extensão R, por exemplo, meu_script_1.R ou meu_script_1.r
Para usar a linguagem R, basta acessar o site do Projeto R e baixar a última versão gratuitamente, pois o R segundo o R Core Team (2015) é um ambiente de software livre para computação estatística e gráficos. Desta forma, você pode usar livremente o software sem a necessidade de pagar por ele, você pode inclusive contribuir para o crescimento dessa comunidade que cresce a cada dia.
Recomendo que você baixe o R Studio, uma IDE (Integrated Developement Environment) ou Ambiente de Desenvolvimento Integrado, também gratuito e de código aberto (Open Source).

R Logo
R studio logo

Our introduction to the R environment did not mention statistics, yet many people use R as a statistics system. We prefer to think of it of an environment within which many classical and modern statistical techniques have been implemented (R Development Core Team Project).

Em tradução livre seria algo do tipo:

Nossa introdução ao ambiente R não mencionou estatísticas, mas muitas pessoas usam R como um sistema de estatísticas. Preferimos pensar nela de um ambiente no qual muitas técnicas estatísticas clássicas e modernas foram implementadas.

Desta forma, iremos trabalhar nossos artigos, o R como um ferramenta a nosso dispor para que possamos melhorar nossa análises estatísticas e nos dar mior precisão aos nosso objetivos.

Sintaxe da Linguagem

Segundo o Eco R, o software R é uma linguagem interativa, permitindo ao usuário executar um comando por vez e receber o resultado. Para isso, usamos a linha de comando, que tem o sinal ”>” quando o R está pronto para receber um comando*.

A sintaxe é simples e rapidamente o novo usuário aprenderá a lidar com ela. Essa é uma das vantagens do R. A facilidade e o escalonamento de aprendizagem, permite a quem desejar, aprender a linguagem. Outra vantagem é a vasta documentação disponível na rede mundial de conputadores. O projeto mantém um área de Documentação.

function( arglist ) expr
return(value)
function(argument1 = value, argument2 = value , …)

Exemplo das funções média e variância e a otenção do desvio padrão no R Studio

dados =c(1,6,3,3,9,3.5,5.2,2.5)
mean(dados)
var(dados)
desvio=sqrt(var(dados))
desvio

Resultando em:

> dados =c(1,6,3,3,9,3.5,5.2,2.5)
> mean(dados)
 [1] 4.15
> var(dados)
 [1] 6.251429
> desvio=sqrt(var(dados))
> desvio
 [1] 2.500286	

A IDE do R Studio permite o uso de menu suspenso a medida que IntelliSense que permite ao usuário selecionar o argumento para cada função. Ainda é possível obter a lista de argumento para cada função presionando a tecla tab (↹)

Figura 1. Exemplo da exibição do ferramenta IntelliSense no R Studio.

Comandos Sensível e Comentários

Comandos Sensiveis

Em R, temos que ter em mente que media ≠ de Media ≠ MEDIA. O R faz destinção de minúscula e maiúscula. Assim ao criar uma variável, sempre use letras minusculas, pois as funções do R são em minúscula. Caso queira diferenciar uma função da outra use media1, media2, media3, etc.
Mesmo o R aceitando o acentos em Português-Brasil (pt-BR) é recomendado para mlhorar o entendimento do script evitar variáveis acentuadas.

Normalmente, todos os símbolos alfanuméricos são permitidos (e em alguns países isso inclui letras acentuadas) mais '.' E '_', com a restrição de que um nome deve começar com '.' Ou uma letra e se começar com '.' O segundo caracter não deve ser um dígito. Os nomes são efetivamente ilimitados em comprimento (R Development Core Team Project). Em tradução livre
Os comandos elementares consistem em expressões ou atribuições. Se uma expressão for dada como um comando, ela é avaliada, impressa (a menos que especificamente tornada invisível) e o valor seja perdido. Uma atribuição também avalia uma expressão e passa o valor para uma variável, mas o resultado não é automaticamente impresso(R Development Core Team Project). Em tradução livre
Os comandos são separados por um ponto-e-vírgula ( ';'), ou por uma nova linha. Os comandos elementares podem ser agrupados em uma expressão composta por chaves ( '{' e '}'). Os comentários podem ser colocados em quase qualquer lugar, começando com um hashmark ( '#'), tudo até o final da linha é um comentário (R Development Core Team Project). Em tradução livre

Comentários

O R permite e é extremamente recomendado que antes ou após cada linha de comando ou bloco de comandos. Os comentários são iniciados sempre com o caractere # (tralha ou jogo da velha ou sharp ou hashmark). Veja o exemplo a seguir:

#atribuindo a variável dados o conjunto de valores
dados =c(1,6,3,3,9,3.5,5.2,2.5)
#Calculando a média e atribuindo o valor a variável media1, calculando a variância e o desvio
media1= mean(dados); media1
var(dados)
desvio=sqrt(var(dados))
desvio

Erros no R

Ao inserir um comando inválido ou um argumento não pertencente à função o R gera erro, que é exibido no Console. No R Studio da mesma forma exibe-se o(s) erro(s). Cabe ressaltar que o R Studio usa o R, como back-end, ou seja, por trás do R Studio, quem calcula ou executa todos o comando é o software R.

Os Erros podem ser gerados, principalmente quando inadivertidamente, o usuário quer executar uma função, mas ela pertence a um pacote.

> source("commands.R")
Error in file(filename, "r", encoding = encoding) : 
	não é possível abrir a conexão
	Além disso: Warning message:
	In file(filename, "r", encoding = encoding) :
	não foi possível abrir o arquivo 'commands.R': No such file or directory
	Gerado no R
> #atribuindo a variável dados o conjunto de  valores
> dados =c(1,6,3,3,9,3.5,5.2,2.5)
> #Calculando a média e atribuindo o valor a variável  media1, calculando a variância e o desvio
> media1= mean(dados); media1
[1] 4.15
> var(dados)
[1] 6.251429
> desvio=sqrt(var(dados))
> desvio
[1] 2.500286
> chart.correlation(dados)
Erro: não foi possível encontrar a função "chart.correlation"

Atribuição de valores

A atribuição de valores de uma função ou comando pode ser realizada basicamente de duas forma:

variável<-funcão(argumentos) ou variável=função(argumentos)

Entretanto há uma forma pouco usual:

função(argumentos)->variável

As três formas são aceitas pelo R e pelo R Studio, assim você pode escolher a melhot forma. Uso basicamente o =, mas as vezes opto por usar o menor que e o hífen (<-).

Ajuda no R e R Studio

No R para obter ajuda para qualquer função, basta inserir no console o comando help('function_name')

> help('mean')
starting httpd help server ... done

O R acessará a documentação em seu navegador padrão. No caso da função mean o software retorna o endereço: http://127.0.0.1:18788/library/base/html/mean.html, que pode ser variável.

No R Studio há uma janela específica para isso. Você apenas insere o comando e ele exibe no próprio programa o arquivo referente a função.

R Studio janela de ajuda

Figura 2. Janela de acesso e exibição da documentação do R, dentro do R Studio.


Referências

Eco R – Using R - http://ecologia.ib.usp.br/bie5782/doku.aspx?id=start

R Development Core Team Project- http://www.r-project.org

R Studio - https://www.rstudio.com/

Como citar este artigo:
Rodrigues, William Costa, 2016. Usando R: Introdução. Estatística na Mão. Disponível em: http://estatisticanamao.agroamb.com.br/estatisticanamao/artigos.aspx?ID=6?ID=6. [Acesso em: 24.02.2018].



Topo