Estatística Básica com Excel - Chico

Estatística Básica com Excel - Chico

(Parte 1 de 7)

Estatística Básica com Excel

Prof. Francisco Carlos Benedetti 2008

CAPÍTULO I – Estatística Descritiva: Definições, Tabelas e Gráficos

CAPÍTULO I – Medidas Estatísticas: Medidas de Tendência Central e Medidas de Dispersão

CAPÍTULO I – Medidas Estatísticas de Posição

CAPÍTULO IV – Probabilidades

CAPÍTULO V – Probabilidades: Distribuições Binomiais

CAPÍTULO VI – Distribuições de Probabilidades: Histogramas e Medidas

CAPÍTULO VII – Distribuições Normais Probabilidades: A famosa Curva de Gauss

CAPÍTULO VIII – Distribuições Amostrais

CAPÍTULO IX – Intervalos de Confiança para a Média: desvio padrão conhecido

CAPÍTULO X – Intervalos de Confiança para Média – desvio padrão desconhecido: a Distribuição T de Student

CAPÍTULO XI – Distribuições Amostrais e Intervalos de Confiança para uma Proporção

CAPÍTULO XII – Correlação entre Variáveis Regressão Linear Outros tipos de Regressão

Estatística Descritiva: Definições, Tabelas e Gráficos

•Como usar Excel para construir gráficos (a fim de praticar a famosa expressão: “muitas vezes, uma figura fala mais do que mil palavras”);

•Como saber qual tipo de gráfico usar (gráfico de barras ou histogramas?);

4.1 Introdução geral ao curso

Estatística é a ciência que lida com dados, o que envolve coleta, classificação, resumo, organização, análise, interpretação e inferência dos mesmos; geralmente nos leva a predições e estimativas. Nas mais diferentes áreas do conhecimento e da atividade humana é possível observar uma grande massa de informações que nos apresentam, seja pela tv, jornais e revistas impressos ou Internet. Não há limites para o uso da Estatística e, para quem está ou quer estar no mercado de trabalho, deve atentar ao fato de que Estatística não éapenas uma forma de apresentar números, tabelas e gráficos para que alguém os entenda, mas sim, a partir de tais informações, concluir fatos, descobrir relações para, após análise e reflexão, tomar decisões. Este será o caminho que percorreremos neste curso.

Vamos à primeira parte de nosso estudo em Estatística, que se refere à apresentação e organização de dados. Durante todo o curso utilizaremos a planilha eletrônica Excel,etambém um software estatístico chamado R. Note que o objetivo não é usar o Excel para fazer uma bela apresentação de dados (para isso você tem a disciplina específica), mas sim para usufruirmos suas funções, seus cálculos facilitadores e suas formas de análise de dados.

4.2 Estatística descritiva

Estatística Descritiva: éaosegmento da Estatística que está relacionada àorganização, resumo, descrição e apresentação dos dados. Não é nosso curso todo, é apenas o começo, já que estudaremos também cálculo de probabilidades, amostragem e tomadas de decisão.

População é o conjunto de dados que descrevem algum fenômeno de interesse. Amostra éum subconjunto, ou seja, uma parte da população.

4.3 Tipos de variável

Uma variável éuma característica que difere, ou varia, de uma observação para outra.

As medidas de alturas de pessoas são variáveis numéricas, enquanto o grau de satisfação de um consumidor com determinado produto (baixo, médio, alto) não é uma variável numérica (é uma categoria, uma qualidade). Perceba, dessa forma, que há diferenças entre os tipos de dados que obtemos.

Variáveis quantitativas (numéricas) são medidas sobre uma escala numérica. Exemplos: valores em reais (preços, salários), medidas de comprimento (de área, de volume), índices (porcentagens diversas), tempos de realização de certos processos.

Variáveis qualitativas (categorizadas) não são numéricos, podem ser classificados em um grupo de categorias (certo-errado, V-F, sim-não, ótimo-bomregular-ruim).

4.4 Apresentação de dados qualitativos (categorizados)

Aapresentação de dados qualitativos costuma ser mais imediata, sem tantas dificuldades para análise; costumam ser ilustrados por meio de tabelas e gráficos de barras. Também podemos citar o sectograma, conhecido como gráfico tipo “pizza”.

Oprofessor Reinaldo, de Logística, realizou amostragens com seus alunos em determinada turma de graduação em Informática. Propôs uma análise proveniente de coleta de dados em supermercados para avaliar a possibilidade de criação de caixas com serviços exclusivos. O arquivo super1.xls ilustra tal pesquisa, que será detalhada em outro texto. Para o momento, utilizaremos esse conjunto de dados para ilustrarmos a apresentação de uma variável qualitativa.

Essa variável será “tipo de pagamento”, que significa a forma como os clientes pagaram suas compras. Os valores que essa variável pode assumir são: cartão de crédito, cartão de débito, dinheiro, cheque ou vale (tíquete). A seguir uma ilustração do conjunto de dados; utilizaremos, desse exemplo, a coluna intitulada “forma de pagamento”.

Nossa intenção é observar as quantidades (porcentagens) que ocorreram para cada valor da variável “tipo de pagamento”. Para construir qualquer tipo de gráfico (como o de barras e o tipo “pizza”), devemos antes construir uma tabela com essas quantidades. Em Estatística, chamamos essas tabelas de “tabelas de distribuição de freqüências”.

Atabela de distribuição de freqüências, feita com auxílio de lápis-e-papel e calculadora simples, pode ser assim apresentada:

Forma de pagamento

Freqüência absoluta

Freqüência relativa

Dinheiro 118 4,70% Cheque 43 16,29%

Cartão de crédito 19 7,58% Cartão de débito 83 31,4% Tíquete 0 0,0%

Total 264 100%

Como fazê-la no Excel? Construa a primeira linha e a primeira coluna da tabela acima, usando à vontade seus conhecimentos de digitação e de Excel (itens de embelezamento para apresentações ficarão por sua conta, ok?). Usaremos a função =CONT.SE desse programa para fazer a contagem de cada valor da variável em questão.

Na célula B2 (veja a figura anterior) digitamos =CONT.SE (intervalo dos dados, expressão que se deseja contar). O intervalo dos dados neste exemplo é a coluna já indicada (“formas de pagamento”); veja que ela está na planilha um do arquivo super1.xls,mas estamos usando a planilha 2 para construir atabela. A expressão que se deseja contar é o valor da variável em questão, no caso, “dinheiro” (escreva entre aspas, exatamente como está no conjunto de dados).

Em seguida, proceda de modo análogo com as células B3, B4, B5 e B6. O total de dados pode ser obtido com a função =SOMA, conforme ilustra a próxima figura.

Já é possível construir um gráfico de barras, relacionando as formas de pagamento com a freqüência absoluta. Como trabalharemos com porcentagens, construiremos a coluna de freqüências relativas e, em seguida, construiremos o gráfico de barras e o tipo pizza, usando esses valores.

Na coluna das freqüências relativas, podemos usar a opção de dividir 118 pelo total 264, obtendo 0,446969696 (=B2/B$7). Fazendo-se isso para as células seguintes, você obterá as respectivas proporções; para apresentar esses cálculos na forma percentual com o número de casas decimais que desejar, basta usar os botões circulados na figura a seguir.

Vamos ao gráfico de barras: 1º) Clique no assistente de gráfico, selecione o “tipo colunas” (é o primeiro e já vem selecionado!) e pressione avançar; 2º) Na etapa 2 de 4, há duas abas: na aba intervalo de dados selecione a coluna de freqüências relativas; na aba série digite o nome que deseja ao gráfico (como “Forma de Pagamento”) e em rótulos do eixo das categorias

Formas de Pagamento 4,70%

DinheiroChequeCartão de créditoCartão de débitoTíquete

(X) avançar

4.5 Apresentação de dados quantitativos – HISTOGRAMAS

(Parte 1 de 7)

Comentários