Um framework, baseado em duas funções principais, para o processamento de grandes quantidades de dados em clusters computacionais homogêneos, no qual problemas como integridade dos dados, disponibilidade dos nós, escalabilidade da aplicação e recuperação de falhas ocorrem de forma transparente ao usuário é o Hadoop