Questões de Esquema de Cinco Números e Boxplot (Estatística)

Limpar Busca

Os outliers são dados que se distinguem significativamente dos demais no conjunto. Um outlier é um valor que se desvia substancialmente da normalidade e pode causar anomalias nos resultados gerados por algoritmos e sistemas de análise.
A seguir, é apresentado um gráfico de boxplot, que ilustra os retornos mensais das ações de uma empresa 


Imagem relacionada à questão do Questões Estratégicas



Nesse contexto, analise as seguintes afirmações.

I. Outliers nunca devem ser removidos, pois sempre carregam informações importantes e não têm a capacidade de distorcer resultados ou enviesar modelos de análise.
II. A partir da análise visual do boxplot apresentado, é possível afirmar que o valor 14% é um outlier, pois ele está visivelmente distante do corpo principal dos dados, fora do intervalo interquartil (IQR).
III. Para a detecção de outliers, além da identificação visual, é possível utilizar métodos estatísticos e técnicas baseadas em aprendizado de máquina.

Está correto o que se afirma em

  • A , apenas.
  • B I e II, apenas.
  • C I e III, apenas.
  • D II e III, apenas.
  • E , II e III.

Um analista estuda discrepâncias salariais entre os seguintes setores: manufatura, serviços financeiros e tecnologia. A figura a seguir apresenta os box-plots dos salários desses setores, em reais.


Imagem relacionada à questão do Questões Estratégicas


Dentre as afirmativas a seguir, a única correta é:

  • A o primeiro quartil de todos os setores é superior a 4.000 reais;
  • B a amplitude interquartil dos salários do setor de tecnologia vale aproximadamente 2.000 reais;
  • C um salário de 5.500 seria identificado como uma observação discrepante, ou seja, um outlier, para todos os três setores;
  • D a mediana dos salários do setor de serviços financeiros é menor do que o primeiro quartil do setor de tecnologia;
  • E o menor salário observado para o setor de tecnologia é maior do que a mediana dos salários do setor de manufatura.

O agente de fiscalização João está analisando um conjunto de dados que representa o salário mensal de funcionários de uma empresa. João utilizará o Diagrama de Boxplot para identificar a presença de outliers nos dados. As estatísticas resumidas para os dados são as seguintes:

Valor mínimo: R$ 1.200,00 Primeiro quartil (Q1): R$ 2.500,00 Mediana (Q2): R$ 3.200,00 Terceiro quartil (Q3): R$ 4.800,00 Valor máximo: R$ 10.000,00 

Em relação à identificação de outliers usando o Diagrama de Boxplot, pode-se afirmar que serão considerados outliers:

  • A valores abaixo de R$ 2.500,00;
  • B valores acima de R$ 4.800,00;
  • C valores entre R$ 2.500,00 e R$ 4.800,00;
  • D valores acima de Q1 - 1,5 * (Q3 - Q1) ou abaixo de Q3 + 1,5 * (Q3 - Q1);
  • E valores abaixo de Q1 - 1,5 * (Q3 - Q1) ou acima de Q3 + 1,5 * (Q3 - Q1)

Qual gráfico é indicado para apresentar o primeiro e terceiro quartis, a mediana e a possível presença de outlier?

  • A Histograma.
  • B Dispersão.
  • C Box-plot.
  • D Setor.

Considerando que Y seja uma variável que representa o número diário de erros registrados em certo sistema gerencial e que o conjunto de dados {1, 1, 4, 5, 5, 5, 14} represente os registros dessa variável em sete diferentes dias, julgue o seguinte item. 
Se um diagrama boxplot fosse produzido a partir desse conjunto de dados, o valor 14 seria considerado outlier

  • Certo
  • Errado