Questões de Data Mining (Banco de Dados)

Limpar Busca

Data Mining é o processo de explorar grandes conjuntos de dados para identificar padrões, tendências e informações valiosas que não são imediatamente evidentes. Utiliza técnicas de estatística, aprendizado de máquina e análise de dados para extrair conhecimento útil a partir de dados brutos. No contexto de Data Mining, a seguinte técnica é mais adequada para descobrir padrões ocultos em grandes conjuntos de dados categóricos sem a necessidade de rótulos de classe:

  • A Regressão Linear.
  • B Análise de Componentes Principais (PCA).
  • C K-means.
  • D Apriori.
  • E Support Vector Machine (SVM).

Sobre o Modelo de Referência Cross- Industry Standard Process for Data Mining (CRISP-DM), avalie as afirmativas a seguir:

I. Após a fase de “Preparação dos dados” ocorre a fase de “Compreensão dos dados”.
II. Durante a fase de “Mineração de Dados” ocorre a aplicação de algoritmos de mineração de dados buscando a extração de padrões.
III. Durante a fase de “Preparação dos Dados”, pode ocorrer a construção de novos atributos a partir de outros já existentes.

Está correto o que se afirma em

  • A I, apenas.
  • B III, apenas.
  • C I e III, apenas.
  • D II e III, apenas.
  • E I, II e III.

No que se refere a Big Data e analytics, julgue o item a seguir.


No CRISP-DM, os modelos de dados são definidos na etapa de preparação de dados, com a utilização de técnicas de machine learning.

  • Certo
  • Errado

No que se refere a Big Data e analytics, julgue o item a seguir.


Nas técnicas de classificação e clusterização de dados, as classes, ou categorias, devem existir previamente à sua aplicação.

  • Certo
  • Errado

Associe adequadamente os itens referentes a bancos de dados às suas respectivas características.
1. Data Warehouse.
2. Data Mining.
3. OLAP.
4. ETL.
( ) Abordagem para integrar, limpar e transformar dados para uso em análises e relatórios.
( ) Técnica de armazenamento de dados em formato multidimensional para análise rápida e flexível.
( ) Processo de extração, transformação e carga de dados de várias fontes para um local centralizado para análise.
( ) Método de explorar grandes conjuntos de dados para descobrir padrões e tendências.
A sequência está correta em

  • A 3, 4, 2, 1.
  • B 1, 3, 4, 2.
  • C 4, 3, 1, 2.
  • D 2, 4, 3, 1.