Filtrar


Questões por página:
O algoritmo k-vizinhos mais próximo (k-NN) é utilizado em tarefas de análise preditiva. Analise as afirmativas a seguir relativas ao algoritmo k-NN.

I O algoritmo k-NN classifica os pontos com base nas distâncias entre eles e seus k vizinhos mais próximos.

II O valor de k deve ser escolhido aleatoriamente e não tem impacto no desempenho do modelo k-NN.

III O algoritmo k-NN é sensível à escala das variáveis de entrada e geralmente requer normalização dos dados antes de ser aplicado.

É correto o que se afirma em
Descobrir regras de associação consiste em analisar as relações entre os atributos de uma base de dados transacional para tentar correlacioná-los.

Sobre regras de associação, assinale a afirmativa correta.
Uma das etapas fundamentais da Ciência de Dados é o tratamento dos dados, que podem com frequência apresentar incorreções, pela maneira como foram adquiridos em suas fontes. O tratamento de dados é, então, essencial para aprimorar a sua qualidade e corrigir possíveis desvios.
Dessa maneira, relacione os principais problemas que podem ser solucionados pelo tratamento de dados com as suas respectivas definições.

1. Enviesamento 2. Ruídos 3. Inconsistência 4. Redundância

( ) Ocorre quando existem alguns desvios dos valores verdadeiros, em geral por imprecisões existentes nos dispositivos que realizam a coleta dos dados.

( ) Ocorre quando dados repetem informações já presentes no conjunto obtido.

( ) Ocorre quando os dados não reproduzem bem a situação a ser analisada e produzem um modelo frequentemente preconceituoso.

( ) Ocorre quando atributos de dados são preenchidos de maneira incorreta, seja por engano ou com intenções fraudulentas, por exemplo.


Assinale a opção que indica a relação correta na ordem apresentada.
A Ciência de Dados é uma área multidisciplinar, que engloba conceitos de Matemática, Estatística e Computação.
Sobre os fundamentos da Ciência de Dados, assinale a alternativa que contém a afirmação correta.
A análise da complexidade de algoritmos é essencial para avaliar seu desempenho e eficiência, especialmente em cenários com grandes volumes de dados.
Assinale a opção que representa a complexidade O (n log n) mais comummente observada em algoritmos de ordenação eficientes.