A base de dados do Observatório de Dados Educacionais do Paraná é uma ferramenta poderosa e acessível que pode ser utilizada por pesquisadores externos para análises detalhadas e desenvolvimento de estudos educacionais. A seguir, apresentamos um guia passo a passo para orientar pesquisadores na utilização desta base de dados.
Acesso ao Repositório GitHub
O primeiro passo para utilizar a base de dados é acessar o repositório GitHub onde estão hospedados os scripts, notebooks e documentação necessária. O repositório pode ser encontrado no seguinte link: IND-EDU-PR-META04.
Configuração do Ambiente de Desenvolvimento
Para utilizar os scripts e notebooks, é necessário configurar um ambiente de desenvolvimento adequado. Siga os passos abaixo para configurar o ambiente:
- Instalação do WGET: Baixe e instale o WGET para Windows a partir do link fornecido no README do repositório: wget-1.11.4-1-setup.exe.
- Instalação do Python: Instale o Python e marque a opção “Add Python to environment variables” durante a instalação.
- Criação de um Virtual Environment (opcional):
- Abra o terminal e execute os seguintes comandos para criar e ativar um virtual environment:
bash
Copiar código
pip install virtualenv
virtualenv indicadores
.\indicadores\Scripts\activate
- Instalação das Dependências: Instale todas as dependências necessárias executando o comando:
bash
Copiar código
pip install -r requirements.txt
- Abra o terminal e execute os seguintes comandos para criar e ativar um virtual environment:
Extração e Consolidação de Dados
Os scripts no repositório permitem a extração e consolidação de diversos conjuntos de dados, Os dados serão consolidados em arquivos CSV e XLSX, prontos para análise. Abaixo estão os principais passos para utilizar esses scripts:
- Microdados do INEP:
- Para extrair microdados, navegue até o diretório de scripts e ative o ambiente virtual:
bash
Copiar código
.\indicadores\Scripts\activate
- Execute o script de extração dos microdados:
bash
Copiar código
python -m scraper_microdados
- Para especificar um ano, utilize o seguinte comando:
bash
Copiar código
python -m scraper_microdados 2021
- Para extrair microdados, navegue até o diretório de scripts e ative o ambiente virtual:
- Indicadores Educacionais:
- Execute o script para baixar os indicadores:
bash
Copiar código
python -m scraper_indicadores
- Extraia os dados para o diretório de dados com o comando:
bash
Copiar código
python -m extrair_zips_indicadores
- Execute o script para baixar os indicadores:
- Dados Financeiros do Portal da Transparência:
- Utilize o script para baixar os dados de despesas da Secretaria de Educação:
bash
Copiar código
python -m scraper_despesas_sec_educacao
- Utilize o script para baixar os dados de despesas da Secretaria de Educação: