Filtrar


Questões por página:
Uma equipe do Ministério Alfa conduz um projeto baseado em Big Data para entender o perfil de acesso da população a atividades financiadas com recursos federais. A base integra milhões de registros oriundos de plataformas digitais de ingressos, editais culturais, visitas a museus federais e interações nas redes sociais de equipamentos culturais.
Como a pesquisa ainda não tem uma variável-alvo definida, o objetivo inicial é identificar grupos latentes de usuários com padrões semelhantes de comportamento, considerando variáveis como frequência de participação, região e faixa etária. Após essa etapa, a equipe pretende avaliar os fatores que contribuem para o engajamento cultural em regiões com baixa participação e, por fim, recomendar estratégias de ampliação de acesso.
Considerando os modelos multivariados, a natureza da base de dados e os objetivos e etapas propostos para a pesquisa, a equipe responsável deveria:
Uma equipe técnica do Ministério da Integração e do Desenvolvimento Regional está avaliando a satisfação de beneficiários de um programa habitacional. Para isso, foi realizada uma amostra aleatória de 625 famílias, extraídas de uma população de 2.500 famílias participantes
A média da nota de satisfação foi de 7,2 (em uma escala de 0 a 10), e a variância populacional previamente estimada é de 1,44. A equipe deseja construir um intervalo de confiança de 95% para estimar a média da população com base na amostra. Utilize a tabela abaixo com valores da curva normal padrão (Z):

Imagem associada para resolução da questão


Com base nesses dados, o intervalo de confiança de 95% para a média populacional é, aproximadamente:
Uma equipe técnica de avaliação de políticas públicas culturais precisa planejar uma pesquisa amostral para estimar a proporção de municípios que apresentam execução satisfatória de metas pactuadas em um programa federal.
O desempenho é considerado satisfatório quando até 5% das metas pactuadas não são cumpridas. Em contrapartida, é considerado insatisfatório quando 20% ou mais das metas pactuadas não são cumpridas.
Os dados prévios são limitados, e a equipe deseja garantir decisões estatisticamente robustas — especialmente quanto à aceitação ou rejeição de municípios com base nos indicadores reportados. Para definir o tamanho da amostra e a regra de decisão sobre o desempenho dos municípios, a equipe técnica estabeleceu os seguintes critérios:

• a margem de erro máxima permitida para estimar a proporção populacional de municípios com desempenho satisfatório é de 4%;
• o nível de confiança deve ser de 95%;
• os erros do tipo I e II devem ser controlados de modo que:
▪ municípios com desempenho considerado bom sejam rejeitados erroneamente em, no máximo,5% dos casos;
▪ municípios com desempenho considerado ruim sejam aceitos erroneamente em, no máximo,10% dos casos.

Com base nessas informações, uma interpretação adequada dos parâmetros definidos pela equipe é a de que:
Uma equipe do governo federal está utilizando ferramentas de Big Data para analisar os padrões de engajamento digital da população com campanhas de utilidade pública promovidas pelos ministérios. O objetivo é compreender quais fatores aumentam a efetividade dessas campanhas nas redes sociais, como cliques em links, curtidas, compartilhamentos e comentários positivos. A base de dados analisada inclui milhões de registros provenientes de diferentes fontes: interações em redes sociais, dados demográficos anonimizados, horários de publicação, características das postagens e conteúdos associados a cada campanha.
Sabe-se que, em pesquisas como essa, é comum serem utilizadas diferentes análises (descritiva, preditiva, prescritiva, diagnóstica ou exploratória) de acordo com os objetivos e a maturidade dos dados disponíveis. Porém, nesse momento, após analisar o desempenho passado de campanhas similares e identificar padrões temporais e temáticos, a equipe deseja usar esses padrões para planejar melhor as futuras postagens e sugerir ações que ampliem o alcance e a interação com o público.
Diante do contexto apresentado, nesse momento, o tipo de análise a ser utilizado pela equipe corresponde à:
A tipologia sobre mecanismos de dados faltantes, estabelecida por Rubin (1976), define diferentes tratamentos estatísticos adequados no tratamento de tais dados.
Uma equipe de analistas do governo federal está tratando os dados de uma pesquisa aplicada a jornalistas, comunicadores institucionais e profissionais da imprensa. O objetivo do estudo é entender como a cobertura de temas sociais evoluiu nos veículos de comunicação entre 2022 e 2024.
Durante o tratamento da base, dois padrões de ausência chamaram atenção:

• parte dos respondentes deixou em branco a variável “tempo de leitura semanal de portais de notícia”, o que ocorreu com mais frequência entre comunicadores de áreas como cultura, entretenimento e arte;
• parte dos respondentes deixou em branco a variável “data de início da carreira”, o que ocorreu com mais frequência nos respondentes com menor tempo de atuação profissional.

Considerando essa pesquisa, os analistas podem concluir que tais dados ausentes: