Criação e benchmark de um algoritmo de previsão de avaliações baseado em LSH (Locality Sensitive Hashing) para grandes volumes de dados do dataset MovieLens. O objetivo é prever a avaliação de um utilizador para um filme específico, utilizando técnicas avançadas de hashing para otimizar a procura por similaridades entre utilizadores e filmes.

O algoritmo foi implementado em ambiente de high performance computing, com execução via SSH e jobs distribuídos em Apache Spark. Esta abordagem permite análise e recomendação de filmes em datasets de grandes dimensões, desde 100 mil até 25 milhões de avaliações, demonstrando a escalabilidade e eficiência do sistema em contextos de big data.