Filtrar


Questões por página:

Relacione a Coluna 1 com a Coluna 2 e assinale a alternativa que apresenta a sequência numérica correta.



Coluna 1 Ferramentas



1. Apache Spark


2. Apache Kafka


3. Power BI



Coluna 2 Descrição



( ) é um framework de computação distribuída de alta velocidade para processamento de Big Data.


( ) é uma plataforma de streaming de eventos distribuída, utilizada para construir pipelines de dados em tempo real.


( ) é uma ferramenta de Business Intelligence da Microsoft para visualização de dados e criação de dashboards interativos.



Assinale a alternativa que indica a sequência correta, de cima para baixo.

O conceito de Big Data refere-se a conjuntos de dados extremamente grandes e complexos. Uma arquitetura comum para lidar com Big Data é o Data Lake.



Qual a principal característica de um Data Lake?

Big Data é tipicamente definida por três V’s: Quais são os V’s do Big Data?
O Big Data é caracterizado por três principais atributos: volume, variedade e velocidade. Esses fatores influenciam diretamente o armazenamento, o processamento e a análise dos dados. Em relação aos dados estruturados e não estruturados, assinale a alternativa correta.
MapReduce é um modelo de programação utilizado no processamento de grandes volumes de dados. Seu sucesso é decorrente do uso facilitado para processar dados de forma distribuída. Em seu uso, o usuário precisa especificar uma função de Map para gerar os pares de chave/valor. Além disso, torna-se necessário definir a função de Reduce para juntar os valores intermediários processados associados a uma mesma chave. Qual das seguintes ferramentas implementa esse modelo de programação?