Resumo de Matemática - Estatística

Estatística

A estatística é um método científico que visa coletar, organizar, analisar e apresentar dados. O termo deriva do latim status (estado) + pseudo prefixo latino isticum (contar).

Essa ciência exata está presente no nosso cotidiano, sendo utilizada por várias áreas de conhecimento como:

  • Social: censo populacional;
  • Industrial: confiabilidade de sistemas;
  • Agropecuária: identificação de melhores formas de manejo;
  • Bancária: concessão de crédito;
  • Marketing: pesquisas de mercado.

Alguns dados são incompletos e não nos fornece informações úteis sobre um problema. Sendo assim, a estatística fornece técnicas para extrair informações sobre esses dados e auxiliar na melhor compreensão das situações que envolvem um problema.

Áreas da estatística

A estatística é dividida em três grandes áreas:

  • Estatística descritiva: a primeira etapa da análise visa descrever e organizar os dados com objetivo de facilitar a compreensão e utilização das informações que serão extraídas. Gráficos, tabelas e medidas são as principais ferramentas utilizadas na estatística descritiva.  
  • Probabilidade: a teoria de probabilidade permite a descrição de fenômenos aleatórios oriundos das incertezas.
  • Estatística inferencial: ligada a teoria de probabilidades, a inferência estatística pode ser definida como um conjunto de procedimentos estatísticos que têm por finalidade generalizar conclusões de uma amostra para uma população. Um bom exemplo de aplicação dos métodos de estatística inferencial, presente no nosso cotidiano, são as pesquisas eleitorais.       

Conceitos básicos

Dada a importância da estatística, dois conceitos são fundamentais para a análise: população e amostra. 

  • População: representa um conjunto de pessoas ou elementos com características comuns. Essas característica devem delimitar corretamente quais elementos pertencem e não pertencem a população.
  • Amostra: corresponde a um grupo representativo da população. A amostra deve ser representativa, de modo que ela represente todas as características da população.

Por exemplo, na pesquisa de opinião pública, a população corresponde ao número total de habitantes de um país e a amostra é uma parte dessa população.

Mas porque estudar uma amostra em vez da população?

Geralmente é impossível estudar uma população em sua totalidade, pois os custos, a logística, o tempo, entre outros motivos, podem dificultar a realização do estudo. Nesses casos, a alternativa indicada é fazer um estudo com uma amostra confiável, afim de tirar conclusões da população.

Outro conceito importante em estatística é a variável, definida como conjunto de possíveis resultados para um determinado fenômeno que será analisado em uma população. De acordo com os níveis de mensuração, a natureza das variáveis podem ser classificadas em:

  • Qualitativas           
    • Nominais
    • Ordinais
  • Quantitativas
    • Discretas
    • Contínuas

Variáveis qualitativas

As variáveis qualitativas não podem ser expressas numericamente, pois são resultados de uma classificação por tipos ou atributos.  Como a cor da pele, sexo, estado civil, cidade, entre outras.

Essas variáveis podem ser divididas em ordinais e nominais.

  • Nominais: estão relacionadas a nomes, não sendo possível fazer um ordenamento, seja numericamente ou alfabeticamente. As cores (azul, preto, rosa, vermelho, etc.) são variáveis nominais, bem como cidades (Salvador, Rio de Janeiro, Recife, Aracaju, etc.).
  • Ordinais: não são numéricas, mas obedecem a uma relação de ordem hierárquica. São exemplos: faixa de idade (criança, adolescente, adultos e jovem) e satisfação (péssimo, ruim, regular e ótimo).

Variáveis quantitativas

Descrevem quantidades por meio de representações numéricas. Podem ser classificadas em discretas ou contínuas.

  • Discretas: são representadas apenas por números inteiros, obtidos mediante um critério de contagem. Idade das pessoas em anos (12,13,14,15…) e quantidade de escolas em um município (100,101,102,103…) são exemplos.
  • Contínuas: sempre é expressa por uma medida com valor real dentro de um intervalo contínuo ou não. Exemplos: peso de um produto (52,6 Kg) e altura dos alunos de uma creche (… 99 cm; 1,1m; 1,2m …)

Tipos de amostragem

A amostra é obtida a partir de uma população bem definida. A amostragem por sua vez, é o processo que procura extrair da população informações com o uso ou não de cálculos probabilísticos, afim de prover dados inferenciais da população analisada.

Amostragem
Probabilística Não Probabilística
1. Aleatória simples 1. Acidental ou conveniência
2. Aleatória estratificada 2. Intencional
3. Conglomerado 3. Quotas ou proporcional
4. Sistemática 4. Desproporcional

Amostragens probabilísticas

É o método mais seguro para a investigação de uma hipótese, pois normalmente os indivíduo e/ou elementos têm a mesma probabilidade de serem selecionados na amostra.

  • Aleatória simples: prática e eficaz, esse tipo de amostra é a mais utilizada. Geralmente os indivíduos são selecionados de forma aleatória, através de sorteio em uma tabela.
  • Aleatória estratificada: quando se deseja obter uma proporcionalidade em uma população. Divide-se cada subpopulação com o uso de critérios como sexo, idade, classe social e renda.
  • Conglomerado: neste caso, a população já está definida por diferentes grupos (conglomerados) e são extraídos alguns elementos dos grupos selecionados e não de toda população. Mas só é recomendado se semelhantes internamente e diferentes entre si.
  • Sistemática: o critério de escolha dos elementos se estabelece através da aleatorização da primeira unidade amostral. Por exemplo: na linha de produção de sapatos, a cada 10 itens produzidos 1 é retirado para avaliação da qualidade.

Amostragens não probabilísticas

Para esse tipo de método os elementos da população não são escolhidos de forma aleatória, mas sim em critérios definidos pelo pesquisador. Em via de regra, o método não probabilístico sempre encontrará desvantagem se comparado ao método probabilístico.

  • Acidental ou conveniência: utilizado geralmente para pesquisas de opinião ou por supermercados, no teste de produto. Nesse tipo de amostragem, os elementos selecionados de acordo com a disponibilidade imediata.
  • Intencional: o pesquisador tem a liberdade de escolher alguns elementos para fazerem parte da amostra, com base no seu julgamento. Esse método é geralmente utilizado em estudos qualitativos.
  • Quotas ou proporcional: o pesquisador precisa conhecer previamente as características da população estudada. A realização desse método acontece por meio das etapas de classificação da população; determinação da proporção da população para cada classe e; fixação de cotas de acordo com as proporções.
  • Desproporcional: utilizada quando a escolha da amostra for desproporcional à população. Para essa metodologia são atribuídos pesos para os dados, e assim obtém-se resultados ponderados representativos para o estudo.

Medidas estatísticas

Frequentemente é necessário resumir algumas características das distribuições de dados em quantidades, as quais chamamos de medidas. Na estatística, essas medidas podem ser classificadas em tendências centrais ou dispersão.

  • Tendências Centrais ou posição
    • Média
    • Moda
    • Mediana
  • Dispersão ou variabilidade
    • Amplitude
    • Variância
    • Desvio padrão
    • Coeficiente de variação

As medidas de tendência central servem para identificar listas inteiras de dados, por meio de um valor inteiro. Já as medidas de dispersão são utilizadas para determinar o grau de variação dos números de uma lista em relação à média.