O principal objetivo de não armazenar os dados diretamente no Data Lake do Observatório de Dados Educacionais do Paraná é garantir a flexibilidade, a segurança e a eficiência na gestão dos dados. Ao invés de centralizar o armazenamento, a abordagem adotada permite que os dados sejam baixados e processados localmente pelos usuários. Essa metodologia oferece vários benefícios, tanto para os gestores de dados quanto para os pesquisadores e analistas que utilizam essas informações.
Ao não armazenar os dados de forma centralizada, o Observatório permite que os usuários adaptem a estrutura e o armazenamento dos dados conforme suas necessidades específicas. Pesquisadores podem escolher os formatos de dados e as ferramentas de análise que melhor se adequam aos seus projetos, sem ficarem restritos a uma única solução de armazenamento. Além disso, essa abordagem facilita a integração dos dados com sistemas locais existentes, permitindo uma análise mais contextual, personalizada e mais barata.
A decisão de não centralizar o armazenamento dos dados também está ligada a preocupações com segurança e privacidade. Armazenar grandes volumes de dados sensíveis, como informações educacionais, em um único local pode representar um risco significativo em caso de violações de segurança. Ao distribuir o armazenamento e permitir que os dados sejam gerenciados localmente, o Observatório reduz o risco de acesso não autorizado e garante que os dados possam ser protegidos de acordo com as políticas de segurança específicas de cada organização ou indivíduo.