Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Iniciação ao SPSS, Notas de estudo de Economia

UNIVERSIDADE DE AVEIRO ? Departamento de Ciências da Educação

Tipologia: Notas de estudo

2010

Compartilhado em 06/05/2010

leandro-costa-42
leandro-costa-42 🇧🇷

1

(1)

2 documentos

Pré-visualização parcial do texto

Baixe Iniciação ao SPSS e outras Notas de estudo em PDF para Economia, somente na Docsity! UNIVERSIDADE DE AVEIRO – Departamento de Ciências da Educação LEIES – PACGI (Módulos 2006) Análise estatística de dados para as Ciências Sociais – Utilização do SPSS Módulo 1 – Iniciação ao SPSS Formador - José Bessa 1 Folha de Apoio - Iniciação ao SPSS O SPSS (Statistical Package for Social Sciences) é uma aplicação de tratamento estatístico De dados que qualquer utilizador familiarizado com o Windows pode usar. A análise estatística é acessível para todos os utilizadores, incluindo os menos experientes. O SPSS é um pacote estatístico usado para a análise de dados que permite manipular, transformar, criar tabelas e gráficos que resumam a informação obtida. Mas as suas potencialidades vão mais além do que a simples análise descritiva de um conjunto de dados. È também possível realizar, com este software, procedimentos mais avançados que vão desde a Inferência Estatística, teste de hipóteses e estatísticas multivariadas para dados qualitativos e quantitativos. 1. Iniciar o SPSS - A janela de abertura do SPSS_ Para fazer correr o SPSS: colocar o cursor sobre o ícone SPSS, e premir o botão esquerdo do rato duas vezes, numa sucessão rápida. É Para sair do SPSS: usar a opção File >Exit. Figura 1. Janela de iniciação do SPSS. Quando se inicia o programa SPSS surge a seguinte informação no ecrã: ? Run the tutorial que permite iniciar o manual, construir uma nova base de dados; ? Type in data , para importar dados através de uma base de dados já existente; ? Run an existing query, Create new query using DataBase Capture Wizard, … ? Open an existing data source ou Open another type of file para abrir uma base de dados já existente ou abrir um outro tipo de ficheiro respectivamente. Neste último caso a janela mostra-nos uma listagem de bases de dados e de ficheiros, usados Análise estatística de dados para as Ciências Sociais – Utilização do SPSS Módulo 1 – Iniciação ao SPSS 2 recentemente no SPSS. Se a base de dados pretendida estiver na lista apresentada basta seleccioná-la e de seguida OK. Caso contrário é necessário fazer duplo clique sobre More Files, na referida lista. Figura 2. Janela SPSS for Windows Se o SPSS já estiver a ser usado (ou depois de aberto) pode-se seleccionar o menu File > Open > Data a partir da janela de edição (SPSS Data Editor). Aparecerá a caixa de diálogo Open File e o procedimento será semelhante ao descrito anteriormente. Nesta caixa de diálogo usam-se as teclas de direcção do teclado para procurar a base de dados pretendida e após se seleccionar a base de dados pretendida clique no botão Open. Para se procurar os dados numa localização diferente usar Open File > Procurar em …Se os dados armazenados se encontram num outro formato de dados que não o do SPSS (.sav) selecciona-se a opção Ficheiros do tipo no fundo da janela Open / Other. Por exemplo, se seleccionarmos a opção Type in data e depois fizermos <OK>, acedemos ao editor de dados (Data Editor). Se a janela de abertura não aparecer (ou se aparecer, mas fizermos <Cancel>), entramos directamente no Data Editor (editor de dados). Análise estatística de dados para as Ciências Sociais – Utilização do SPSS Módulo 1 – Iniciação ao SPSS 5 Figura 4. Janela de resultados (Output Viewer) Janela de comandos - Syntax Editor - É, em termos práticos, uma janela de texto para onde as escolhas feitas nos menús e nas caixas de diálogo do SPSS podem ser copiadas, aparecendo aí sob a forma de uma sintaxe de comandos. Para esse efeito, basta clicar no botão Paste de cada caixa de diálogo, depois de introduzida/ seleccionada toda a informação necessária para a execução do procedimento pretendido. O programa que vai sendo assim construído pode mais tarde ser editado para inserir certas capacidades especiais de análise estatística que só são acessíveis no SPSS em modo programado, e não através das caixas de diálogo. Estes comandos podem ser gravados em ficheiros, e utilizados em sessões de trabalho posteriores. Para se fazer correr um programa de uma janela de sintaxe, basta seleccionar Run na barra de menus do Syntax Editor. (Esta janela não será abordada no módulo).que não será abordada neste módulo . Figura 5. Janela de commandos (Syntax Editor) Análise estatística de dados para as Ciências Sociais – Utilização do SPSS Módulo 1 – Iniciação ao SPSS 6 Regra geral, quando se faz correr o SPSS, há duas janelas Data Editor e Viewer que abrem automaticamente: Se a janela Viewer não abrir nessa altura, abrirá de forma automática quando se solicitar uma análise estatística ou um gráfico. Todas as janelas descritas possuem uma barra de menus (Figura 6) com as opções disponíveis no topo de cada janela e uma barra de ferramentas (Figura7) que permite um acesso facilitado às tarefas mais comuns. Se colocar o ponteiro do rato sobre o botão de uma ferramenta, aparece uma breve descrição dessa ferramenta. Figura 6 - Barra de menus da janela de edição Figura 7 - Barra de ferramentas de edição A maioria das selecções feitas em menus gera uma caixa de diálogo (Exemplo1). Estas caixas servem para seleccionar variáveis e opções de análise. Exemplo 1: Caixa de diálogo do menu 3. Editar e criar um ficheiro de (Base) dados no SPSS Os dados são editados na janela SPSS Data Editor. As linhas da grelha de edição representam casos distintos, enquanto que as colunas representam as variáveis que se pretendem estudar a partir de uma amostra de uma determinada população. Os nomes das variáveis aparecem no início de cada coluna. A introdução dos dados é feita como em qualquer folha de cálculo. Selecciona-se uma célula e introduz-se o valor correspondente. Também se pode importar dados de ficheiros mais usuais como seja tipo Excel e do Word ou outros. Análise estatística de dados para as Ciências Sociais – Utilização do SPSS Módulo 1 – Iniciação ao SPSS 7 Nas variáveis quantitativas introduz -se os valores observados, e para as variáveis qualitativas introduzimos os valores correspondentes ás etiquetas atribuídas a esses valores. Os valores, missing , numa variável deixam-se em branco, a menos que esteja definida uma etiqueta (rótulo) para os valores desconhecidos. Apresenta-se um exemplo para a construção de uma base de dados (Ficheiro demo da pasta SPSS\Tutorial\Examples\demo.sav) que pode ser explorado em termos de introdução no SPSS mas também em Excel e depois copiar e colar para o SPSS. Variáveis: ? Idade - scale (discreta) ? Estado Civil - nominal (não casado e casado) ? Anos na actual morada - scale (discreta) ? Rendimento familiar- scale (contínua); Rendimento familiar por categorias (1--- rendimentos inferiores a 25 ; 2--- rendimentos entre 25 e 49 ; 3--- rendimentos entre 50 e 74; 4--- rendimentos a partir de 75). ? Preço do veículo principal – scale (contínua); Preço do veículo por categorias (1=Económico--- preço do veículo inferior a 15; 2=Standard---- preço do veículo entre 15 e 29; 3=Luxo--- preço do veículo a partir de 30) ? Gender- nominal (Feminino, Masculino). 3.1. Definição das variáveis Antes de se inserir dados é necessário definir as variáveis e suas propriedades. Ou seja, preparar o ficheiro de dados para a introdução dos dados. Ao clicar na célula do canto inferior esquerdo da janela de dados e que diz precisamente (Variable View) entramos na janela de vista de variáveis Análise estatística de dados para as Ciências Sociais – Utilização do SPSS Módulo 1 – Iniciação ao SPSS 10 Scale –Os atributos quantitativos em escalas de Intervalo ou de Razões (Absolutas) resultam de características da informação susceptível de serem medidas, quantificadas e apresentando-se com diferentes intensidades. Possibilitam a determinação da distância entre elementos, fixação de parâmetros estatísticos de tendência central e de dispersão. OBS: Repete-se o processo para todas as variáveis que se criarem na base de dados. Depois de definir todas as variáveis podemos então passar à introdução dos dados e guardar o ficheiro. Do mesmo modo, utiliza-se a janela de edição (SPSS Data Editor) para guardar uma base de dados, seleccionando as opções correspondentes do menu File. Podemos guardar uma base de dados já existente e na mesma localização seleccionando o menu File > Save , ou podemos guardar uma base de dados com um nome diferente usando Save Data As… É possível também seleccionar parte das variáveis da base de dados que se pretende guardar, seleccionando Variables da caixa de diálogo Save Data As. . 4. Organização e transformação dos dados 4.1. A transformação de dados. O Menu Transform O SPSS possui um conjunto de ferramentas que permitem transformar as variáveis, alterar os valores a uma variável ou até criar novas variáveis a partir de outras, e se necessário também seleccionar casos a analisar. a) Compute- Comando que calcula novos valores de acordo com uma expressão matemática. Por exemplo se temos uma variável que vai ser alterada por uma percentagem (um aumento de salário de 20% - novo salário=1.2 salário anterior) podemos criar uma nova variável com os novos valores salariais. Neste caso usamos Compute variable e escrevemos o nome da nova variável NovoSalario" na caixa de texto e em Target Variable a expressão numérica 1.2*salario (Variável anterior) Clique OK. Outro exemplo com os resultados de exames numa grelha de 0 a 100 transformar num resultado de 0 a 20- NotaFinal= 0.2*Nota0_100. NOTA: Procure explorar as funções e operadores que se encontram na caixa de comandos relativas à função de Compute b) Recode - Comando que permite codificar valores de uma variável em novos valores. Útil para conseguir categorizar variáveis (contínuas ? ?classes), ou para agrupar ou transformar valores nominais em numéricos. Por exemplo se temos uma variável Análise estatística de dados para as Ciências Sociais – Utilização do SPSS Módulo 1 – Iniciação ao SPSS 11 Peso que vai ser dividida por classes. Por exemplo: Leve ? ?1- até 50 Kg; Normal ? ?2- de 50 a 70 Kg(69.9); Pesado ? ?3- de 70 a 90 kg; e, Muito Pesado ? ?4- pelo menos 90 Kg.. c) Transform, Recode Into Different Variables. Os novos valores serão alterados com o uso a outra janela. Podemos transformar "Peso" em outra variável Numeric Variable -> Output Variable box. Designando-a por "PesoCat" em Output Variable Name e de seguida em Change. Em Old and New Values seleccionamos os intervalos para cada grupo a definir e no fim de estarem todos definidos OK. Exemplo, para definir os novos valores com intervalos há a opção Range: ? ___ Lowest Through (do menor até 49.9) - escrever em New Value o valor 1 e Add; ? --- Through (de 50 até 69.9) - escrever em New Value o valor 2 e Add. ? --- (de 70 até 89.9) - escrever em New Value o valor 3 e Add. ? __ Through highest (de 90 até ao maior) - escrever em New Value o valor 4 e Add E para outros exemplos de igual forma..... Finalmente, clique em Continue e de seguida em Ok, a recodificação estará terminada. No Editor de Dados aparecerá mais uma nova coluna com os pesos por categorias. Poderá depois voltar à Vista de varáveis para rotular os valores 1, 2 , 3 e 4 como Leve, Normal, Pesado, Muito Pesado. EXERCÍCIO (Para praticar). Abra o ficheiro demo.sav e tente recodificar as seguintes variáveis: Inccat, rendimento familiar, com as seguintes categorias: (1=rendimentos inferiores a 25; 2=rendimentos entre 25 e 49; 3=rendimentos entre 50 e 74; 4=rendimentos a partir de 75. E a variável categórica, carcat, preço do veículo: em: 1=Económico- preço do veículo inferior a 15, 2=Standard- preço do veículo entre 15 e 29, 3=Luxo- preço do veículo a partir de 30) Análise estatística de dados para as Ciências Sociais – Utilização do SPSS Módulo 1 – Iniciação ao SPSS 12 d) O argumento If. No exemplo anterior algo parece não estar totalmente correcto. O Peso não é uma variável que tenha o mesmo comportamento para o sexo Feminino e Masculino. No caso do salário também poderíamos querer só o aumento para aqueles que trabalham na empresa há mais de 10 anos. Nestes casos, e outros, em que temos que seleccionar os indivíduos que vão ter aumento de saláriode entre todos, ou alterar categorias -classes de peso - conforme o indivíduo é mulher ou homem, surge o argumento - If (condition is satisfied). Ao seleccionar esta opção outra janela abre que permite escolher somente os casos que verificarem a condição If. Por exemplo no caso do salário se tivermos a variável anos no emprego -AnosEmp-(há quanto tempo trabalha na empresa) poderemos seleccionar os casos com valor maior ou igual que 10- If AnosEmp >9. Nos casos nominais ou ordinais colocar entre aspas os nomes ou colocar o número correspondente. No caso do peso será mais complexo, tendo-se que formar duas variáveis distintas com 0 (zeros) para valores que não correspondam ao do sexo em análise e só depois apresentar uma variável final obtida por soma destas. e) Outros procedimentos do Menu Transform: Count- Comando que permite criar uma variável que faz a contagem de determinado caso numa variável. Categorize variables- transforma variáveis quantitativas em variáveis ordinais controlando somente o número de categorias a criar. Rank Cases- cria scores , ordens, para os casos de acordo com os valores de uma variável . Automatic Recode – Converte as categorias de uma variável Nominal ou Ordinal em valores numéricos e automaticamente cria rótulos para os valores. O Recode é mais usado porque permite controlar as categorias e atribuição de rótulos. 4.2. O Menu Data. No menu data estão alguns dos comandos directamente relacionados com os dados, dos quais destacamos os procedimentos mais importantes para uma primeira abordagem. Sort Cases- Ordena os casos de acordo com uma variável. Transpose - Transpõe linhas para colunas o que significa que as variáveis passam a ser casos e as observações variáveis. Merge files- permite acrescentar valores (casos ou variáveis) de outro ficheiro de dados do SPSS. Split Files – permite dividir ficheiros de dados em função de categorias de uma variável categórica. Útil quando é necessário compara resultados para dois grupos distintos. Exemplo – comparação para duas empresas,.....) Análise estatística de dados para as Ciências Sociais – Utilização do SPSS Módulo 1 – Iniciação ao SPSS 15 Na Tabela, observa-se que 3179 dos inquiridos são do sexo feminino o que corresponde a 49,7% dos inquiridos. A percentagem acumulada embora apresentada não faz muito sentido para variáveis do tipo nominal. Outra forma de apresentar as frequências é usando informação gráfica: um gráfico circular, Gráfico 2, ou um gráfico de barras, Gráfico 3. Relativamente ao gráfico circular, o círculo representa os 100% dos indivíduos e cada 'fatia' é proporcional à frequência de observações em cada categoria. Relativamente ao gráfico de barras cada barra representa a frequência relativa (ou absoluta) em cada categoria, isto é percentagem (ou o número) de indivíduos por classe. Para obter tabelas de frequências e gráficos de barras no SPSS- Menu Analyze/ Descriptive Statistics/Frequencies ----Graph/Bar ou Pie b) Variáveis ordinais Relativamente às variáveis ordinais, a informação sumária das variáveis é semelhante ao descrito anteriormente para as variáveis nominais, no entanto não se pode alterar a ordem das categorias uma vez que estas têm uma ordem própria. O gráfico de barras e a tabela de frequências (Tabela 3 e Gráfico 4) apresentam a satisfação no emprego relativamente aos Análise estatística de dados para as Ciências Sociais – Utilização do SPSS Módulo 1 – Iniciação ao SPSS 16 6400 inquiridos. Nesta tabela inclui-se também uma coluna com a percentagem acumulada, que indica soma da percentagem da categoria respectiva com as percentagens das categorias anteriores. Na tabela de frequências já faz sentido “ler” as percentagens acumuladas , desta forma 58,9% (17,3+19,8+21,8) é a percentagem de inquiridos cujo nível de satisfação no emprego é no máximo neutral (indiferente). Podem observar que os rótulos e títulos em cada coluna já foram alterados. Para tal deve clicar duas vezes na tabela e usar o editor de gráficos para alterar as propriedades do gráfico. c) Variáveis Contínuas e Discretas Para descrever ou sumariar variáveis discretas que assumam poucos valores ainda é possível usar uma tabela de frequências e/ou gráficos de barras. Mas para variáveis discretas, que assumam vários valores, ou para variáveis contínuas uma tabela de frequências não é, normalmente, muito útil, pois grande parte dos valores terão frequência muito baixa. A tabela de frequências será uma lista de valores que torna a informação a extrair da variável muito complexa. Da mesma forma um gráfico de barras para dados contínuos seria composto por uma séria de pequenas barras. Uma opção que permite uma visualização dos dados melhor que a obtida com um gráfico de barras é o histograma. O histograma é semelhante ao gráfico de barras com a diferença que cada barra representa a frequência de valores num intervalo ou Análise estatística de dados para as Ciências Sociais – Utilização do SPSS Módulo 1 – Iniciação ao SPSS 17 classe (de valores). Cada intervalo de valores tem a continuação no intervalo da barra seguinte. Por isso as barras são representadas todas juntas. Normalmente o ensino da construção destes histogramas pode implicar dois casos distintos: classes de amplitude iguais ou amplitudes diferentes. Iremos abordar somente a construção de classes de amplitudes iguais conforme aparece no SPSS. No Gráfico 5 o histograma refere-se ao preço do veículo principal da família da pessoa inquirida. O Gráfico 6 é relativo às idades dos inquiridos com a opção de apresentar a curva normal (Display normal curve). Optamos por referir a idade como uma das variáveis que, pelo que se apresenta na curva, sugere algum arredondamento de idade dos inquiridos. Como sabemos é regra geral as pessoas arredondarem a idade, as horas,….. e, neste caso o histograma sugere que tal Análise estatística de dados para as Ciências Sociais – Utilização do SPSS Módulo 1 – Iniciação ao SPSS 20 centrais) têm uma idade compreendida entre 31 e 51 anos ) conjunto já ordenados, 2, 2, 3, 4, 5, 6. O valor mediano é 3.5. b) Medidas de dispersão dos dados. ? Leque ou amplitude (range) (máximo–mínimo) ? Amplitude inter-quartis Resulta da diferença entre os quartis Q3-Q1. ? Variância e desvio padrão (Std. Devaition). A variância por ter unidades quadradas não pode ser usada em operações (diferenças) com os valores da variável, sendo por isso mais comum apresentar o valor de desvio padrão (não esquecer que tendo unidades um valor numérico elevado ou outro muito pequeno não implicam muita ou pouca variabilidade dos dados). Na variável idade o desvio-padrão é de 12,29 anos e indica a variação dos dados em torno da média. Obs: A escolha das medidas de posição e dispersão apropriadas Um dos factores que se deve ter em conta na escolha das medidas a usar é o tipo de distribuição da variável. A média pode parecer mais informativa do que a mediana pois no seu cálculo são utilizados os valores da variável, no entanto a mediana que apenas usa a posição relativa de cada valor não está sujeita a observações extremas (outliers). Consideremos o exemplo seguinte do conjunto de valores 2, 3, 5, 6, 9. A média é (2+3+5+6+9)/5 = 5 e a mediana também é 5. Mas, se for alterado o último valor para 29, isto é 2, 3, 5, 6, 29 a mediana continua a ser 5 mas a média foi alterada para 7. Em situações em que a variável apresenta valores muito extremos, deve -se optar pela apresentação da mediana, dando assim uma indicação mais correcta da tendência Análise estatística de dados para as Ciências Sociais – Utilização do SPSS Módulo 1 – Iniciação ao SPSS 21 central da distribuição. Uma regra geral muitas vezes utilizada é apresentar a média em distribuições simétricas e a mediana em distribuições assimétricas. O parâmetro de simetria (skewness) observa-se na tabela sumário da variável. Outra forma prática para visualizar essa assimetria tem a ver com a comparação dos valores de localização média, mediana e moda. Relativamente às medidas de dispersão, estas dever ser escolhidas em função da medida de tendência central. O desvio padrão só deverá ser apresentado se estiver associado à média, uma vez que esta medida se refere a desvios em relação à média. No caso de se apresentar a mediana poder-se-á optar por indicar o âmbito, por exemplo interquartil, ou apresentar dois percentis. Os pares de percentis mais frequentemente usados são o (percentil 5, percentil 95) e o (percentil 25, percentil 75).
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved