A História da Educação e as Origens da Desigualdade Regional no Brasil Bruno Komatsu, Naercio Menezes Filho, Pedro Oliveira, Leonardo Viotti Policy Paper | Nº 27 Setembro, 2017 A História da Educação e as Origens da Desigualdade Regional no Brasil Bruno Komatsu Naercio Menezes Filho Pedro Oliveira Leonardo Viotti Bruno Kawaoka Komatsu Insper Instituto de Ensino e Pesquisa Centro de Políticas Públicas (CPP) Rua Quatá, nº300 04546-042 - São Paulo, SP - Brasil brunokk@insper.edu.br Naercio A. Menezes Filho Insper Instituto de Ensino e Pesquisa Centro de Políticas Públicas (CPP) Rua Quatá, nº300 04546-042 - São Paulo, SP - Brasil naercioamf@insper.edu.br Pedro Augusto Costa Oliveira Insper Instituto de Ensino e Pesquisa Centro de Políticas Públicas (CPP) Rua Quatá, nº300 04546-042 - São Paulo, SP - Brasil pedroaco@insper.edu.br Leonardo Viotti The World Bank Group Development Impact Evaluation (DIME) 900 19th St NW, MC Building. 20006 - Washington, DC – United States of America lviotti@worldbank.org Copyright Insper. Todos os direitos reservados. É proibida a reprodução parcial ou integral do conteúdo deste documento por qualquer meio de distribuição, digital ou impresso, sem a expressa autorização do Insper ou de seu autor. A reprodução para fins didáticos é permitida observando-se a citação completa do documento. 2 A História da Educação e as Origens da Desigualdade Regional no Brasil Bruno Komatsu Naercio Menezes Filho Pedro Oliveira Leonardo Viotti Centro de Políticas Públicas do Insper Resumo Esse artigo busca descrever a trajetória da desigualdade educacional, para entender as origens da desigualdade regional no Brasil. Combinamos diversas fontes de dados históricos do final do século XIX e início do século XX, para construir medidas precisas de estoque de pessoas por escolaridade e o índice de Gini educacional, de 1900 a 2000 para o Brasil e suas regiões. Nossos resultados mostram que a elevada desigualdade educacional do início do século passado não diminuiu até 1920, declinando lentamente entre 1920 e 1950 e mais rapidamente a partir de então. Além disso, nossos resultados mostram que os níveis de desigualdade educacional de cada região brasileira, que eram semelhantes entre si em 1900, tiveram trajetórias diferenciadas, declinando mais rapidamente nas regiões Sul e Sudeste. Palavras-Chave: Educação, Desigualdade, Índice de Gini. Abstract This paper aims to describe the trajectory of educational inequality in order to understand the origins of regional inequality in Brazil. We combine several sources of historical data from the late nineteenth and early twentieth centuries to calculate precise measures of stocks of people by schooling and the educational Gini index from 1900 to 2000 for Brazil and its regions. Our results show that the high level of educational inequality of the beginning of the last century did not reduce until 1920, declining slowly between 1920 and 1950 and more rapidly thereafter. In addition, our results show that the levels of educational inequality in each Brazilian region, which were similar to each other in 1900, had different trajectories, declining more rapidly in the South and Southeast regions. Key Words: Education, Inequality, Gini Index. JEL: I24 – Education and Inequality, I25 – Education and Economic Development 3 1. Introdução Apesar das importantes transformações econômicas e do mercado de trabalho no Brasil ocorridas no período recente e que levaram à acentuada redução da desigualdade de renda na última década (Lustig, Lopez-Calva e Ortiz-Juarez, 2013), o país figura ainda hoje entre os países com maior nível de desigualdade no mundo (Tsounta e Osueke, 2014; CIA, 2013). Os elevados níveis históricos de desigualdade social do Brasil são compartilhados entre países latino americanos e possuem raízes profundas nos processos de colonização. Um importante mecanismo de perpetuação da desigualdade de renda entre países se constitui nas diferenças de investimento e distribuição de capital humano (De Ferrenti et al., 2004). Nos países da América Latina, a educação formal se desenvolveu tardiamente e priorizando o acesso das elites, o que gerou uma escassez de mão de obra qualificada e desigualdades regionais (Camps e Engerman, 2014). Após entrar na agenda de agentes da independência no século XIX, a expansão da educação à população foi esquecida com a consolidação de regimes conservadores no período pós-independência e permaneceu como privilégio dos ricos até o último quarto daquele século (Frankema, 2009). Adicionalmente, as ondas de migrantes europeus ao Brasil entre o final do século XIX e início do século XX representaram choques positivos nos estoques da capital humano e reforçaram as desigualdades regionais de renda (Rocha, Ferraz e Soares, 2015). Esse artigo pretende contribuir para a literatura com novas medidas e uma análise detalhada da evolução da desigualdade educacional do Brasil no período que vai do início do século XX até a década de 1960. Nossa principal contribuição é a construção de medidas mais precisas de estoques da população por educação para a primeira metade do século XX, utilizando dados históricos dos Anuários Estatísticos do Brasil (AEBs) e dos Censos Demográficos. Com isso, estimamos o índice de Gini para a distribuição da educação no Brasil e suas regiões. A trajetória dessa medida de desigualdade educacional nos dá um panorama mais claro de como esta respondeu às reformas empreendidas pelo governo, na tentativa de expandir o sistema de ensino. Além disso, o índice de Gini educacional nos permite avaliar como a desigualdade na educação se comportou em algumas regiões do país e em que medida esta é responsável pela desigualdade regional existente ainda hoje. A problemática da desigualdade social vem ganhando destaque nas mais diversas áreas de pesquisa nos últimos anos, tendo em vista que estudos recentes apontam um 4 aumento da desigualdade em todo o mundo (Dabla-Norris, 2015). Há na literatura um conhecido debate sobre as possíveis causas para a alarmante desigualdade na América Latina. De um lado, a hipótese central é de que a atual desigualdade nos países latino- americanos tem raízes históricas e uma forte associação com a qualidade das instituições fundadas no período colonial e aquelas existentes hoje em dia (Acemoglu et al., 2001; De Ferrenti et al., 2004). Do outro lado, a alta desigualdade da América Latina como um fenômeno relativamente recente, tendo surgido em meio a transformações nos séculos XIX e XX, como o aumento dos preços internacionais das commodities e o isolacionismo dos países latino americanos após a Primeira Guerra Mundial (Williamson, 2015). A evolução dos preços diferenciada por tipo de commodity (cana de açúcar e café) também determina diferenças de desenvolvimento das regiões produtoras no Brasil (respectivamente as regiões Nordeste e Sudeste) (Leff, 1972). Além dessas hipóteses, a educação parece desempenhar um papel muito relevante na perpetuação da desigualdade de renda. Os efeitos da desigualdade de capital humano sobre a desigualdade de renda foram bastante estudados na literatura (veja, por exemplo, Lam e Levison (1991), Lorel (2008), Barros (2011)). A transmissão intergeracional de escolaridade constitui o canal principal pelo qual a distribuição desigual de capital humano afeta a desigualdade de renda (Lorel, 2008). A desigualdade educacional pode afetar a desigualdade de renda por meio da dispersão da escolaridade e dos efeitos da escolaridade sobre os rendimentos.1 Além disso, a educação pode afetar a desigualdade de renda através de externalidades positivas do capital humano, relacionadas à tecnologia (Barros, 2011). Além do ganho de eficiência e aumento da produtividade dos indivíduos com maior nível de instrução, a tecnologia é desenvolvida respeitando as restrições dos outros fatores de produção. Portanto, regiões com maior disponibilidade de capital humano terão tecnologias que usam mais intensivamente este fator, e em consequência serão mais produtivas. Além disso, a importância da educação para a desigualdade é maior nas regiões menos desenvolvidas do Brasil, a saber a região Nordeste, uma vez que o diferencial salarial por grau de escolaridade nessas regiões é maior (Paes de Barros e Reis, 1991). 1 Embora intuitivamente a desigualdade de escolaridade seja positivamente correlacionada com a desigualdade de renda, Lam, Leibbrandt e Finn (2015) argumentam que não há fundamento formal para que essa relação tenha esse sinal. 5 Nesse sentido, a má distribuição de fatores de produção, especialmente do capital humano, acaba por impedir a convergência do nível de renda per capita entre as regiões, esperada por um modelo neoclássico (Barro e Sala-i-Martin, 1992). Para o Brasil, cerca de 33% do aumento da desigualdade de renda ocorrido entre as décadas de 1960 e 1970 pode ser explicado pela variável educação (Langoni, 1973). Adicionalmente, a distribuição desigual de capital humano tende a persistir, uma vez que a acumulação de capital humano dos pais é positivamente relacionada à dos filhos. A ausência de políticas públicas que busquem redistribuir educação de forma mais igualitária entre as regiões, a desigualdade regional tende a se manter por tempo indeterminado (Barros, 2011). Alguns estudos anteriores estimaram medidas de desigualdade educacional no longo prazo. Thomas, Wang e Fan (2001) calculam um índice de Gini educacional para diversos países a partir de 1960 e concluem que a tendência geral na segunda metade do século XX é de redução da desigualdade educacional, que é negativamente associada à média de anos de estudo e à riqueza do país. A associação do nível de escolaridade com a dispersão (medida pelo desvio padrão) segue o padrão de uma curva de Kuznets. Resultados semelhantes são encontrados por Lorel (2008) para o Brasil, entre 1950 e 2000, quando compara os estados brasileiros. Lee e Lee (2016) constroem uma medida de estoque educacional para o período entre 1870 e 2010 para 11 países, a partir de estimativas de taxas de matrícula no período entre 1820 e 1945 e das estimativas educacionais de Barro e Lee (2001) para o pós II Guerra. Nossa principal contribuição é de que estimar a evolução da desigualdade educacional no Brasil para a primeira metade do século XX, para quando não há microdados de pesquisas censitárias disponíveis. Nós adicionamos à literatura resultados obtidos a partir de fontes históricas não exploradas em outros estudos, como os relatórios estatísticos da antiga Diretoria Geral de Estatísticas (DGE), relatórios estatísticos do final do século XIX e taxas de mortalidade calculadas separadamente por nível de escolaridade. Nosso trabalho também dialoga com estudos que tentam explicar as causas da distribuição desigual de capital humano entre as regiões brasileiras, examinando a questão das diferenças de acesso à educação. A estrutura produtiva e de poder político da região parecem explicar em parte a concentração da educação. O acesso à educação era restrito às elites locais até o final do século XIX. A expansão do acesso com as reformas educacionais no final do século XIX e início do século XX, além disso, beneficiou 6 especialmente brancos (incluindo imigrantes europeus) e relegou nativos americanos, negros e mestiços ao segundo plano (Camps e Engerman, 2014). Há evidências de que a interação entre a qualidade das instituições locais e o aumento dos preços internacionais das commodities afeta os níveis regionais de acumulação de capital humano. Musachio et al. (2014) encontram uma relação positiva entre o preço dos produtos regionais exportados, as receitas tributárias destes produtos, a qualidade das instituições locais e o gasto per capita em educação. As regiões brasileiras se especializaram na produção de bens diferentes e aumento dos preços das commodities ocorreu de forma diferenciada por produto, beneficiando especialmente o preço do café. Em um contexto de descentralização da arrecadação fiscal e de responsabilidade de investimento educacional no nível dos estados, as receitas de arrecadação com exportação favoreceram estados produtores de commodities com alta demanda. Com isso, regiões exportadoras de café – como é o caso da região Sudeste – dispunham de um volume maior de recursos, o que possibilitava um maior investimento em educação. Já onde se exportava açúcar, algodão e tabaco, as receitas eram limitadas, o que inviabilizava grandes investimentos em educação. Soma-se a estes pontos o papel das instituições, isto é, não bastava a região ter sido beneficiada pelo boom das commodities para que obtivesse resultados educacionais melhores, pois as instituições é que determinavam em que medida as receitas de exportação decorrentes do boom seriam direcionadas a investimentos no sistema educacional. As diferenças educacionais por região também são explicadas por choques de capital humano devido aos influxos de migrantes internacionais, cujos níveis de capital humano eram relativamente maiores do que os da população local (Rocha, Ferraz e Soares, 2015). Esses migrantes se direcionaram principalmente à região sudeste e passaram também a demandar maior investimento em educação, o que fez com que a desigualdade regional de educação se perpetuasse. Em síntese, embora não haja na literatura uma total concordância quanto às origens e às explicações para a alta desigualdade existente no Brasil, a relevância da educação para compreender e explicar a desigualdade de renda é inegável. Nesse sentido, nossa principal contribuição é construir índices de Gini educacionais desde o início do século XX para o Brasil e suas regiões, para documentar a evolução da composição educacional brasileira e seu impacto nas desigualdades regionais. 7 O artigo está dividido em sete partes, além desta breve introdução. Na segunda seção realizamos um breve histórico da educação brasileira. Na terceira parte, faremos uma descrição dos dados utilizados, bem como de suas fontes suas especificidades. Em seguida, explicaremos detalhadamente a metodologia utilizada no trabalho. Por fim, apresentamos os resultados obtidos e algumas conclusões sobre o assunto. 2. Breve Histórico da Educação no Brasil Durante boa parte do século XIX, o Brasil – assim como outros países latino- americanos – esteve entre os países com os piores indicadores educacionais do mundo, em termos de nível e desigualdade escolar (Lustig, Lopez-Calva e Ortiz-Juarez, 2013). Isto, porque enquanto colônia ibérica o continente viu pouco progresso educacional. Figura 1 - Média de anos de estudo para países selecionados Fonte: Clio-Infra (Leeuwen et al., 2013). Elaboração própria. Dados para população de 15 anos ou mais. A Figura 1 compara a evolução da média de anos de estudo para quatro países: Brasil, Argentina, Estados Unidos e Espanha. Percebe-se que a média de anos de estudo no Brasil era muito baixa no final do século XIX (0,7 anos de estudo em 1900) e assim permaneceu durante as três primeiras décadas do século XX. A partir de 1940 este indicador passou a apresentar crescimento mais acelerado no Brasil, tornando a curva mais inclinada. Somente na década de 1990 é que a média de anos de estudo do Brasil chega ao nível observado nos Estados Unidos no início do século XX, o que explicita o grande atraso educacional do país. As trajetórias do indicador na Argentina foram bem 8 semelhantes à do Brasil, porém num patamar mais elevado, com crescimento comparativamente mais equilibrado ao longo de todo o período, exceto por uma década de estagnação entre 1980 e 1990, década em que o Brasil mais avançou nesse indicador. A Figura 2 traz uma comparação direta entre o Brasil e o país de fronteira, os Estados Unidos, em relação aos estoques populacionais com ensino médio e superior. Apesar do período relativamente mais curto, vemos que o grau de escolaridade dos brasileiros está muito aquém daquele dos norte-americanos: somente em 2010 é que a proporção de indivíduos com ensino médio no Brasil se igualou a que já era observada nos Estados Unidos na década de 1940 (IBGE, 2012), e a proporção de indivíduos no Brasil com o ensino superior, atingiu os níveis observados nos Estados Unidos em 1970. Figura 2 – Evolução da Escolaridade – EUA e Brasil a) Ensino Médio b) Ensino Superior Fonte: Censos Demográficos/IBGE para o Brasil e Census Bureau para o EUA. Elaboração própria. Dados para população de 25 anos ou mais. Obs: Para o Brasil, dados de 1940 e 1950 são aproximados. Há diversos fatores que explicam o atraso relativo do Brasil. De acordo com Colistete (2016), em contraste com outras colônias, como os Estados Unidos e Canadá, o padrão educacional observado nas colônias latino americanas seguia o das metrópoles, sendo extremamente restrito, focado no ensino secundário e superior e voltados para as elites. Além disso, no Brasil havia um descaso político com o ensino primário, que se refletia no baixo nível de gastos por aluno (dez vezes inferior ao dos Estados Unidos). 9 Ainda nesta linha, Lee e Lee (2016) analisam a evolução da taxa de matrículas nos três níveis de ensino (primário, secundário e terciário), e constatam que o período de crescimento mais acelerado das matrículas se deu após a Segunda Guerra Mundial. No período anterior, apenas os países mais desenvolvidos, que implementaram políticas de escolarização básica obrigatória entre os séculos XVIII e XIX, viram uma expansão real do número de indivíduos matriculados, em especial nos ensinos primário e secundário. No que tange aos países menos desenvolvidos, o crescimento da taxa de matrículas ganhou relevância somente após a década de 1950, o que também pode ser visto na Figura 1 onde o crescimento da média de anos de estudo do Brasil fica mais evidente após a década de 1940. Além do atraso relativo do Brasil, também se verificam disparidades regionais em educação internas ao país, contribuindo para geração de desigualdade social. A Figura 3 ilustra esse ponto usando a taxa de alfabetização da população. Apesar do grande aumento da proporção de alfabetizados em todo o país, entre o final do séc. XIX e o começo do século XXI, se verifica um relativo atraso de algumas regiões. No Censo de 1872, as regiões com maior proporção de alfabetizados eram Norte e Sul, enquanto não havia grande distinção entre Sudeste, Nordeste e Centro-Oeste. Antes do final do século XIX, a região Sudeste já apresenta acelerado crescimento em comparação com as demais. A região Centro-Oeste, no entanto, só chega ao nível de alfabetização das regiões que em 1872 eram mais avançadas depois de 1900, enquanto a região Nordeste só chega a esse nível depois de 1920. Essa região permanece com a menor taxa de alfabetização no período e mesmo no ano final, 2010, a ela chega a um nível que foi atingido pelas regiões mais alfabetizadas já em 1980. 10 Figura 3 - Alfabetização nas Regiões Brasileiras Fonte: Censos Demográficos/IBGE. Elaboração própria. Dados para a população de 5 anos ou mais. Obs: o Censo de 1900 omitiu alguns distritos da pesquisa, e por esse motivo não o incluímos nesse gráfico. Esse panorama geral da educação no Brasil reflete políticas educacionais ao longo de todo o século XX, que afetam as matrículas e conclusões nos graus escolares. Essas taxas dão um panorama do comportamento do sistema educacional brasileiro e expõe o baixíssimo nível de matrículas em todos os graus escolares e o ainda menor nível de conclusões. Também chama atenção quão pequena foi a evolução do acesso à educação no período, em especial no ensino superior, que em 1960 possuía menos de 2% da população matriculada. A Figura 4 mostra a proporção de matriculados em cada grau escolar e a população na faixa etária considerada ideal para o nível. Todas as regiões brasileiras apresentam um crescimento das taxas de matrícula em todos os graus escolares, ocorrendo primeiro e de forma mais acentuada no ensino primário. 11 Figura 4 – Taxas de Matrícula a) Ensino Primário b) Ensino Secundário c) Ensino profissional d) Ensino Superior Fonte: Os dados de matrículas são provenientes dos Anuários Estatísticos do Brasil, de diferentes anos (DGE, 1912-1936; IBGE, 1932-1968). Para se chegar à taxa de matrícula, dividimos o número de indivíduos matriculados pelo total da população na faixa etária aproximada de frequência ideal de cada nível escolar (Primário: 5 a 14 anos; Secundário: 10 a 19 anos; Profissional: 10 a 19 anos; Superior: 20 a 24 anos). O ensino secundário e o profissional possuem níveis iniciais comparativamente muito mais baixos e, em todas as regiões, o primeiro só começou a apresentar crescimento a partir de 1932. No caso do ensino superior, apesar de aumento significativo nas primeiras décadas do século XX nas regiões Norte, Sul e Sudeste, só há uma tendência de crescimento sistemático da taxa nas demais regiões a partir de 1942. 12 Comparando as regiões, é perceptível que as regiões Sul e Sudeste apresentam as maiores taxas em quase todos os níveis de ensino. Particularmente, o crescimento da taxa para essas duas regiões no nível superior é expressivo a partir da década de 1940. Em contrapartida, a região nordeste apresenta as menores taxas em toda a série para o ensino primário e, com exceção de alguns pontos, também nos níveis secundário e profissional, mas com níveis de matrícula ainda muito baixos. As regiões Norte e Centro-Oeste têm taxas medianas em comparação com as demais regiões para os níveis primário e secundário, mas em particular, a região centro-oeste tem as piores taxas de matrícula no ensino superior durante o período. Na Figura 5 apresentamos as taxas de conclusão, calculadas como a proporção de concluintes em relação à população na faixa de idade correspondente ao grau escolar. A taxa de conclusão reflete de forma mais precisa o incremento de um grau escolar em uma faixa de idade, porém, exceto pelo ensino superior, cuja série se inicia em 1912, os demais graus escolares possuem dados disponíveis somente a partir de 1932. Enquanto as regiões Sul e Sudeste apresentam crescimento entre 1932 e 1942, a taxa nas demais regiões permanece praticamente constante. A região Norte é aquela cuja taxa mais destoa do comportamento da curva de taxa de matrículas, o que é explicado em parte pela imprecisão das informações, em particular para locais mais distantes do centro político e intelectual do país e com maiores dificuldades de acesso. Na região Centro- Oeste, a queda no percentual de concluintes entre as décadas de 1950 e 1960 pode ter sido causada por fatores demográficos, uma vez que na metade final da década de 1950 a cidade de Brasília foi construída, causando um grande aumento do número de habitantes da região. De maneira semelhante à taxa de matrículas, a taxa de conclusões para os ensinos secundário, profissional e superior são muito pequenas em todas as regiões brasileiras. O ensino superior também apresenta crescimento das taxas de conclusão das regiões Sul e Sudeste com relação às demais após 19402. Comparando a taxa de conclusão à taxa de matrícula é possível ter uma noção da magnitude da taxa de evasão escolar no período, principalmente no ensino primário. Isto se deve ao fato de que a principal barreira para a continuidade dos estudos se encontrava na transição entre o ensino primário e o ensino secundário, de forma que boa parte dos 2 Apresentamos no Apêndice gráficos com o número indivíduos na faixa etária correspondente a cada grau de ensino dividido pelo número de escolas deste mesmo grau. 13 indivíduos que abandonavam os estudos o faziam ainda no ensino primário (Marcílio, 2005). Figura 5 – Taxas de Conclusão a) Ensino Primário b) Ensino Secundário c) Ensino profissional d) Ensino Superior Fonte: Os dados de conclusão de curso são provenientes dos Anuários Estatísticos do Brasil de diferentes anos (DGE, 1912-1936; IBGE, 1932-1968). Para se chegar a taxa de conclusão, dividimos o número de concluintes pelo total da população na faixa etária aproximada de frequência ideal de cada nível escolar (Primário: 5 a 14; Secundário: 10 a 19; Profissional: 10 a 19; Superior:20 a 24). Os resultados acima descritos podem, em parte, ser explicados pela forma de organização e evolução do sistema educacional brasileiro. Inicialmente, antes do século XX, o sistema educacional brasileiro evoluiu muito lentamente, principalmente durante o período em que o país foi colônia portuguesa. Mesmo em comparação aos demais países 14 da América Latina, o Brasil iniciou tardiamente uma expansão do acesso ao ensino básico, como fica evidenciado pela baixa média de anos de estudo na Figura 1. Apenas nas décadas finais do Império é que se iniciou um lento processo de difusão de escolas públicas e aumento do número de alunos matriculados. Surgiu assim a fase chamada de “Ilustração brasileira”, em que as preocupações se voltaram às reformas educacionais e que tinham como objetivo colocar o país “ao nível do século” (Marcílio, 2005, p. 115). Com a Proclamação da República no final do século XIX, inaugurando o período conhecido como Primeira República ou República Velha, ocorreram diversas mudanças no campo educacional. Em primeiro lugar, a Constituição Republicana de 1891 estabeleceu que apenas indivíduos alfabetizados tinham direito ao voto, portanto somente uma parcela reduzida da população seria considerada apta a votar. Dessa forma, fornecer maior acesso à educação passou a ser também uma questão política, uma vez que não somente satisfaria as demandas da população, como tornaria possível angariar um maior número de eleitores. Além disso, a nova Constituição, assim como a anterior (primeira Constituição brasileira, de 1824), descentralizava a administração do sistema educacional, tornando-a responsabilidade dos estados e municípios. O fato de o governo brasileiro ter delegado a administração do ensino aos estados durante boa parte da história educacional é incluído como uma das causas para o atraso educacional do país (Colistete, 2016) e para as desigualdades regionais, pois os estados não possuíam o mesmo volume de recursos e apenas o governo central conseguiria arrecadar os recursos necessários para democratizar a educação. Dessa forma, os estados mais desenvolvidos e urbanizados tiveram um progresso educacional sensivelmente mais rápido (como é o caso de São Paulo e outros estados das regiões Sul e Sudeste, como é possível notar nas Figuras 6 e 7). Adicionalmente, o sistema educacional brasileiro pouco evoluiu e as políticas educacionais adotadas pelos governantes do período foram, em grande parte, controversas e pouco efetivas. Trata-se de um período com diversas reformas educacionais, por vezes conflitantes entre si, que levou a uma desorganização ainda maior da educação brasileira. O resultado foi um crescimento pífio do número de matriculados e concluintes em quase todos os graus de ensino, como é possível constatar nas Figuras 4 e 5. De acordo com Kang (2010) isso pode ser explicado pela distribuição altamente desigual de poder político no período. Ele argumenta que uma expansão da educação pública significativa 15 dependeria de uma maior participação política das classes que mais seriam beneficiadas por esta expansão, isto é, os mais pobres. Aumentando a participação política da população, através de suspensão das restrições ao voto, os indivíduos teriam maior poder para demandar educação pública, de forma que a alfabetização da população, bem como a taxa de matrículas se elevaria. Contudo não foi isto o que ocorreu no caso brasileiro, as restrições ao voto permaneceram nas décadas iniciais do século XX e a educação evoluiu muito pouco, como mencionado acima. Também, é importante ressaltar a diferença na causalidade das explicações de Kang (2010) e Marcílio (2005) acerca da influência do sistema de representação política da República Velha sobre os resultados educacionais do período. Apesar dos resultados ruins, houve um pequeno crescimento nas taxas de matrícula do ensino primário, resultado das ações dos governos estaduais, como pode ser visto no painel a) da Figura 4. Contudo, vale destacar, essa pequena expansão se deu de forma muito concentrada, principalmente em regiões mais ricas e urbanizadas ao passo que áreas rurais e mais pobres ficaram em segundo plano. Essa alocação desigual de recursos aliada à supracitada descentralização administrativa do sistema de ensino e das receitas tributárias, promoveram processos de acesso à educação bastante distintos entre as regiões brasileiras. Após a crise 1929 e seus reflexos para a economia brasileira, o Estado adotou uma postura mais intervencionista, especialmente no que diz respeito à educação. Somando- se a isto à Revolução de 1930, uma nova reforma do ensino foi proposta, com a intenção de criar um sistema nacional de ensino. Em 1931 foi criado o Ministério da Educação e Saúde, e logo se seguiu a criação da primeira universidade pública, em 1934, localizada em São Paulo. A partir daí o número de universidades cresceu lenta e continuamente. No que se refere ao ensino secundário a reforma estabeleceu diretrizes mais claras que nas décadas anteriores. O ensino profissional também se expandiu no período, estimulado pelo processo de substituição de importações, que se intensificaria futuramente. Os ensinos de nível secundário e entraram em foco nesse período, o que é evidenciado no painel b) da Figura 4 onde a taxa de matrícula no ensino secundário se mantém praticamente a mesma entre 1907 e 1932, e a partir de então passa a crescer. Mesmo durante a década de 1930 a pequena expansão do ensino secundário era voltada principalmente às elites, ao passo que para as classes sociais menos favorecidas surgia 16 como opção o ensino médio profissionalizante, representado principalmente pelo ensino industrial, o que promovia um processo de segmentação social da educação (Marcílio, 2005). Na década de 1940, com a troca do ministro da Educação, voltam as reformas parciais, chamadas de Leis Orgânicas. Essas reformas tangenciavam principalmente o ensino primário e secundário e, em alguns casos, cursos do ensino profissional, como é o caso das Leis Orgânicas de 1942 e 1946. Estas passaram a reconhecer os cursos Industrial, Comercial, Normal e Agrícola como sendo de nível secundário. Seus efeitos podem ser notados na Figura 6, onde se registra um grande aumento no número de indivíduos com ensino primário e médio entre 1940 e 1950. Ainda, influenciado por propostas internas e externas, no período entre 1945 e 1964 o sistema educacional brasileiro passou por algumas transformações. Foram criadas campanhas com o intuito de promover a alfabetização de adultos, e a expansão do ensino primário e superior. 3. Dados A fim de estimar as estatísticas apresentadas neste artigo, foram combinadas diversas fontes históricas. Para estatísticas como taxa de alfabetização ou grau de escolaridade da população, utilizamos os Censos Demográficos, divulgados aproximadamente a cada dez anos pelo Instituto Brasileiro de Geografia e Estatística (IBGE). O primeiro recenseamento nacional ocorreu em 1872, abrangendo todas as regiões do território, exceto o atual estado do Acre. Também utilizamos os Anuários Estatísticos do Brasil (AEB) também publicados pelo IBGE, na época chamado Diretoria Geral de Estatística (DGE). O primeiro AEB foi divulgado em 1916, contendo dados para os anos entre 1907-1912. Apenas a partir de 1936 a publicação passou a ser anual. Os Anuários reúnem uma grande quantidade de informações sobre educação, saúde, gasto público, trabalho, política, entre outros temas, entretanto, estes dados não são sempre comparáveis. Utilizamos as informações disponíveis acerca de matrículas, conclusões de curso e números de instituições de ensino. Com o intuito de obter um percentual de indivíduos matriculados no nível escolar correspondente a cada faixa etária, cruzamos os dados dos AEBs com as estimativas populacionais dos Censos Demográficos. Porém, devido às faixas etárias dos censos não serem exatamente compatíveis às de cada nível escolar, foi necessário realizar uma aproximação. Assim, para o ensino primário foi considerada a população de cada estado, 17 entre 5 e 14 anos. Para o ensino secundário e técnico, o total de pessoas por estado entre 10 e 19 anos, e para o ensino superior indivíduos entre 20 e 24 anos. Para 1930 utilizamos estimativas populacionais feitas pelo DGE, uma vez que nesta década não foi realizado Censo Demográfico. Entretanto, estas estimativas eram apenas para o total da população de cada estado. Para chegar à população por faixa etária, foi feita uma média entre o percentual da população em cada faixa etária por estado dos Censos de 1920 e 1940. Em seguida, este resultado foi multiplicado pela população total do estado correspondente em 1930. Dados de matrículas no ensino primário, secundário e técnico no final do século XIX foram obtidas dos Relatórios Anexos ao Ministério dos Negócios do Império, da Diretoria Geral de Estatística (Directoria Geral de Estatística, 1875; Secretaria d’Estado dos Negocios no Imperio, 1887). Utilizamos dados de mortalidade da publicação Estatísticas do Século XX do IBGE para o Brasil, sem distinção de regiões. A única exceção é o estado de São Paulo, em que há informações mais precisas disponíveis no projeto Memória das Estatísticas Demográficas (SEADE, 2010). Com esses dados foi possível calcular um Gini educacional para o Brasil como um todo e para algumas de suas regiões. A estimação do Gini foi feita com base em estimativas da escolaridade da população brasileira ao longo do século XX. O estoque inicial, para o ano de 1900, foi calculado com base nos dados de matrículas e conclusões dos AEBs e de outros trabalhos e relatórios do DGE, especificados acima. Contamos também com dados de estoque populacional por escolaridade nos Censos Demográficos de 1940 a 1960. 4. Metodologia A metodologia deste artigo consiste em calcular o índice de Gini agregado com estimativas de estoques populacionais por nível de escolaridade ao longo do tempo. A principal dificuldade enfrentada é de que não há dados estatísticos ou censitários sobre o estoque da população por escolaridade no Brasil ou estado até o Censo Demográfico de 1940. Até então, a informação sobre a escolaridade disponível era somente de quantos sabia ou não ler na população. Por esse motivo, para construir os estoques por escolaridade, partimos de estimativas do estoque de pessoas com cada nível de escolaridade em 1900 e, usando informações sobre os concluintes de cada nível, 18 construímos a série para a primeira metade do século XX. Também, utilizamos a mesma metodologia de cálculo do Gini para os dados disponíveis nos censos demográficos de 1940 a 2000 com o intuito de dar continuidade à série. Fazemos adicionalmente estimações separadas para as Unidades da Federação, o que nos permite agregar em regiões. 4.1 Metodologia das Estimativas da Distribuição da População por Escolaridade em 1900 Para a estimação do estoque inicial da população por escolaridade em 1900 nós nos inspiramos na metodologia de inventário perpétuo descrito por Foldvári e Leeuwen (1914) para chegar a valores aproximados da participação relativa dos grupos de escolaridade na população de 5 anos ou mais em 1900. Nós trabalhamos com cinco categorias de escolaridade: sem escolaridade, ensino primário incompleto, ensino primário completo, ensino secundário completo (incluindo o ensino profissional), e ensino superior completo.3 Em linhas gerais, a metodologia consiste em obter a distribuição da população de uma determinada faixa etária por grau de ensino em algum período do século XIX, e aplicar esses percentuais para a mesma coorte em 1900. Por exemplo, se em 1880 a proporção das pessoas com entre 5 e 10 anos de idade matriculadas no primário fosse de 10%, então supomos que o mesmo percentual das pessoas com entre 25 e 30 anos de idade em 1900 possivelmente possuem o ensino primário. Nas estimativas populacionais do século XIX, nós consideramos também a população escrava nos cálculos (sem nenhuma escolaridade). Há duas hipóteses implícitas para a realização dessa estimativa. Em primeiro lugar, supomos que todos os matriculados em um grau escolar de uma coorte irão se formar (taxa de evasão nula). Essa hipótese será relaxada mais adiante, porém os resultados não se alteraram de forma relevante. A segunda hipótese é de que a taxa de mortalidade e migração daqueles é homogênea entre pessoas com diferentes graus escolares. Apesar de forte, não é possível estimar taxas de mortalidade e migração diferenciadas por grau escolar com os dados disponíveis. Somente estudos utilizando dados muito recentes são 3 O ensino primário equivale ao que atualmente é chamado de primeiro ciclo do ensino fundamental. O secundário constitui um grau de ensino que compreende o segundo ciclo do ensino fundamental e o ensino médio. Para essa análise, consideramos o ensino profissional como parte do ensino médio. 19 capazes de realizar esse tipo de estimação de forma precisa, porém nós fizermos um teste de robustez com estimativas de mortalidade. Para obter as proporções de matriculados por faixas etárias, nós calculamos as proporções de crianças e jovens matriculados no primário e no secundário em relação ao total de indivíduos nas faixas de idade consideradas adequadas para cada grau. Essa estimação foi possível para o início dos anos 1870 (com dados do Recenseamento de 1872 e dos Relatórios e Trabalhos Estatísticos de 1875) e dos anos 1880 (com dados dos Censos de 1872 e 1890, e dos Trabalhos da Seção de Estatística de 1886). Para a década de 1880, também foi possível estimar a proporção de adultos matriculados no ensino superior.4 Com as estimativas de taxas de matrículas em mãos, nós aplicamos essas proporções de pessoas com primário completo, secundário completo e ensino superior completo para a população de 1900 por estado da seguinte forma. As proporções de pessoas com primário completo em 1880 foram aplicadas para as faixas com 10 a 29 anos em 1900, enquanto para as coortes mais velhas no mesmo ano, aplicamos as proporções de 1870. As proporções de pessoas com secundário completo de 1880 foram aplicadas às pessoas entre 15 e 29 anos em 1900, e para os mais velhos, aplicamos as proporções de 1870. Por fim, as proporções de pessoas com ensino superior foram aplicadas à população com 25 anos ou mais em 1900. Como aqueles que fizeram um grau escolar mais elevado passaram obrigatoriamente pelos graus mais elementares, nós evitamos que eles fossem contados duplamente nos graus escolares anteriores. Entre aqueles que não foram designados a algum grau escolar, nós dividimos entre aqueles que sabiam ou não ler. O número de analfabetos foi obtido a partir do Censo Demográfico de 1900, e esse grupo foi considerado sem escolaridade. Os demais, que sabiam ler, porém não se encaixaram em nenhum dos graus escolares completos, foram considerados como tendo primário incompleto. Como mencionamos anteriormente, é possível relaxar a hipótese de que todos os matriculados se formam. Se tivermos a proporção dos concluintes em relação aos matriculados, podemos obter uma estimativa mais real do número de formados em um grau escolar. Dessa forma, tentamos lidar com o problema aplicando a taxa de conclusão aos matriculados, e multiplicando o valor resultante (número de concluintes em um ano) pelo tamanho da faixa etária que frequentaria aquele grau escolar. 4 Detalhamos os procedimentos para obtenção dos percentuais de adultos com ensino superior no Apêndice. 20 Os primeiros dados de concluintes para todos os níveis de ensino estão disponíveis somente a partir da década de 1930. No entanto, como a taxa de conclusão por matriculado é relativamente estável entre 1932 e 1949, nós utilizamos essa taxa para estimar a proporção de concluintes por faixa etária em 1870 e 1880. Em seguida, calculamos novamente as proporções de formados em 1900, como descrito anteriormente. Apesar de cada alteração implementada para lidar com um problema diferente gerar modificações na distribuição de pessoas por escolaridade, essas distribuições não se alteram significativamente. 4.2 Composição Educacional e População ao Longo do Século XX Para estimar os estoques populacionais por escolaridade, nós tratamos de forma diferenciada os grupos com níveis de ensino completos (primário completo, secundário completo e superior completo) das pessoas sem escolaridade ou com primário incompleto. Para estimar o número de pessoas com cada nível de ensino completo, partimos da estimativa do estoque inicial de 1900 e, iterativamente para cada ano subsequente, descontamos os óbitos e somamos o número de concluintes, subtraindo o número de concluintes do nível seguinte. Por exemplo, o estoque total de pessoas com ensino primário em um determinado ano é calculado como a soma entre o estoque do ano anterior e o número de concluintes do ensino primário daquele ano menos os concluintes do ensino secundário do mesmo ano. Para um grau escolar 𝑗 no ano 𝑡, o estoque populacional será dado por: Pop𝑗𝑡 = Pop𝑗,𝑡−1 × (1 − Mortality Rate𝑗𝑡) + (Concl𝑗𝑡 − Concl𝑗+1,𝑡) (1) onde Pop𝑗𝑡 é a população com escolaridade 𝑗 no ano 𝑡, Mortality Rate𝑗𝑡 é a taxa de mortalidade e Concl𝑗𝑡 é o número de concluintes no grau 𝑗 no ano 𝑡. A disponibilidade de dados de concluintes varia bastante ao longo dos anos, mas estão disponíveis para quase todas as Unidades da Federação entre os anos de 1907 a 1912, 1932 a 1949 e 1951 a 1962. As séries de concluintes para cada nível educacional foram interpoladas para os anos em que os AEBs não foram publicados, ou em que estes não apresentam essa informação. Assumiu-se que a quantidade de matrículas e as taxas de conclusão pouco mudam entre os anos de 1899 e 1908, para os estados em que existe informações sobre o número de concluintes em 1908. Para os estados em que não há 21 informações do número de concluintes em 1908, fizemos uma interpolação, supondo que o número de concluintes de cada nível de ensino era zero em 1899. Dessa forma, é possível construir uma série de concluintes de cada nível educacional ininterrupta entre 1900 e 1960. Dessa forma, é possível prever a composição educacional para todos os anos entre 1900 e 1960. Para que as estimativas fossem comparáveis com os censos de 1940 e 1950, os concluintes dos níveis secundário e profissional foram agrupados para estimar o estoque de pessoas com ensino médio. Para as pessoas sem escolaridade e o primário incompleto, procedemos da seguinte forma. O estoque da população sem escolaridade é dado imediatamente pelo número de pessoas que não sabem ler. Essa informação e o dado da população total estão disponíveis em todos os Censos Demográficos, desde 1872, para o Brasil como um todo e para as Unidades Federativas. Para preencher a população total e as subpopulações nos anos intercensitários, foi utilizada uma interpolação linear simples. Dessa forma, só faltaria estimar o estoque da população com ensino primário incompleto. Calculamos esse estoque como a diferença entre a população total e os demais estoques já estimados. Adicionalmente, os óbitos foram calculados a partir das informações sobre a taxa de mortalidade. A taxa de mortalidade média do Brasil foi obtida dos Censos Demográficos (IBGE, 2007) e assumiu-se que a taxa é a mesma entre todas as Unidades da Federação, com exceção de São Paulo, cuja taxa de mortalidade para o período analisado é divulgada pela Fundação SEADE (SEADE, 2010). É razoável pensar que a taxa de mortalidade varia de acordo com o nível de instrução (que é positivamente correlacionado com a renda). Para tentar obter uma taxa de mortalidade diferenciada por instrução, utilizamos os dados de alfabetização dos indivíduos por faixa etária, disponíveis nos Censos Demográficos de 1940 e 1950, para calcular a mortalidade relativa. Consideramos no cálculo indivíduos com 40 anos ou mais, uma vez que até esta faixa etária ainda havia uma parcela considerável da população se alfabetizando. Para o cálculo, agregamos separadamente indivíduos que sabiam ou não ler, com entre 40 e 69 anos no Censo de 1940 e comparamos com os grupos correspondentes de indivíduos com entre 50 e 79 anos no Censo de 1950. A taxa é calculada dividindo o número de pessoas por faixa etária no período final pelo número de pessoas na faixa etária anterior no período inicial. Com isso, obtivemos os resultados apresentados na Tabela 2. 22 Tabela 2 – Taxas de mortalidade decenais Comparação 40 a 49/50 a 59 50 a 59/60 a 69 60 a 69/70 a 79 Agregado* Alfabetizados -21,41% -30,01% -49,72% -28,25% Analfabetos -24,07% -28,32% -49,10% -29,78% Total -22,96% -29,00% -49,33% -29,16% Fonte: Censos Demográficos/IBGE. Elaboração Própria. Ainda, um ajuste foi feito no período inicial da comparação, incluindo nos alfabetizados e subtraindo dos analfabetos, os indivíduos que na data da pesquisa estavam frequentando a escola, porém ainda eram analfabetos. O diferencial a partir da taxa média de -29,16% é de 0.97 para os alfabetizados e de 1.02 para os analfabetos. 4.3 Gini Educacional Para cada categoria educacional das cinco utilizadas, atribuiu-se a quantidade de anos de educação formal equivalente à duração de todos os níveis concluídos pelos indivíduos presentes no grupo. Assim, para o ensino primário considerou-se, 4 anos de estudo, para o ensino médio, 11 anos de estudo e para o ensino superior 15 anos de estudo. Dessa forma, como os anos de educação são constantes para cada grupo, não é possível mensurar a dispersão de escolaridade intra-grupo. Para os indivíduos analfabetos optamos por atribuir uma quantidade de anos de estudo igual a zero (0 anos). Também, para aqueles com o nível primário incompleto, devido à falta de informações no período, atribuiu-se um valor ad hoc de 1 ano de estudo formal. Por ser uma medida comumente utilizada para medir desigualdade e de fácil interpretação, optou-se pelo índice de Gini para medir a desigualdade na distribuição de educação. A metodologia usada é uma adaptação da forma usual de cálculo da medida (Cowell, 2011). Como as informações existentes sobre o nível de escolaridade para o período analisado e nossas estimações de estoque de pessoas por nível de ensino estão agregadas, isto é, não temos informações em nível individual, adaptamos a fórmula do índice de Gini para a estrutura de nossos dados. A forma de cálculo é muito similar à utilizada por Thomas, Wang e Fan (2001). O Gini educacional (𝐺) para um determinado ano e região é calculado como a média da diferença entre todos os possíveis pares de indivíduos, dividida pela média de anos de 23 escolaridade (?̅?). Como há apenas cinco tipos distintos de indivíduos a formula pode ser simplificada da seguinte maneira: ∑5𝑖=1 ∑ 5 𝑗=1 𝑄𝑖𝑄𝑗𝑑𝑖𝑗 𝐺 = 2𝑁2?̅? Onde 𝑁 é a população com 5 anos ou mais; ?̅? é a média de anos de estudo; 𝑄𝑖 é a quantidade de pessoas do grupo 𝑖; de maneira análoga 𝑄𝑗 é a quantidade de pessoas do grupo j; e 𝑑𝑖𝑗 é a diferença de anos de estudo entre os grupos 𝑖 e 𝑗. 5. Resultados Em primeiro lugar, a Figura 6 mostra nossa primeira contribuição empírica principal, os estoques populacionais por escolaridade estimados para o Brasil a partir dos níveis iniciais calculados para o ano de 1900. As linhas representam os níveis estimados de pessoas em cada grau escolar (primário, secundário e ensino superior), enquanto os pontos mostram os totais obtidos a partir dos Censos Demográficos de 1950 a 1960. Figura 6 – Composição Educacional do Brasil Fonte: Elaboração própria. As linhas representam as estimativas para todo o período e os pontos representam os dados observados nos Censos Demográficos (IBGE, 1940-1960). Para o ensino primário, maioria da população educada no período, nossa estimativa é semelhante aos observado no Censo Demográfico de 1950. Em 1960, subestimamos o número de pessoas com esse nível de ensino. Uma possível explicação, entretanto, deve- 24 se ao fato de que no Censo Demográfico deste ano os indivíduos declararam sua escolaridade independentemente da modalidade de ensino que haviam cursado, ao passo que os dados utilizados para estimar a população com ensino primário neste período, provenientes dos AEBs, não incluíam aqueles que haviam cursado o ensino supletivo, restringindo-se apenas aos indivíduos que frequentavam o ensino primário fundamental comum. Soma-se a isto o fato de que ao longo da década de 1950 a quantidade de pessoas cursando o ensino supletivo elevou-se significativamente, devido às modificações introduzidas pela mudança na legislação pós Estado Novo (Kang, 2010). Para os outros dois níveis de ensino, nossas estimativas estão mais próximas aos níveis observado em 1950 e 1960, o que aumenta nossa confiança sobre elas para a primeira metade do século XX. Como mostra a Figura 6, a quantidade de pessoas com o primário completo é muito superior àquele dos demais níveis educacionais, e apresenta crescimento explosivo a partir de 1940. Essa trajetória é consistente com o intuito dos governantes do período, que desejavam expandir a educação elementar a partir do início do século. Vale mencionar que parte desse crescimento registrado após a década de 1940 pode se relacionar às mudanças na legislação ocorridas nesta década, mais especificamente a implementação das Leis Orgânicas de 1942 e 1946, que contribuíram para expandir o número de matriculados no ensino médio e primário, respectivamente. Somam-se a estas, mudanças legislativas, a redemocratização do país após 1945 e o aumento da demanda populacional por direitos civis. Por sua vez, na década de 1950 não houve mudanças significativas no sistema educacional brasileiro. A despeito do elevado crescimento econômico e do ambicioso Plano de Metas do presidente Juscelino Kubistchek, apenas 3,4% dos recursos deste seriam destinados à educação. Ainda, o plano priorizou o ensino superior devido ao fato deste prover os trabalhadores qualificados que o crescimento econômico e a industrialização demandavam. Nosso segundo resultado principal é a estimação do índice de Gini educacional durante a primeira metade do século XX, para o Brasil e quatro das cinco regiões brasileiras, que mostramos na Figura 7. A região Norte foi excluída da análise devido à baixa qualidade das informações para o começo do século XX, porém, no cálculo do índice para o Brasil, estão incorporadas todas as cinco regiões. Adicionalmente, é utilizada a mesma metodologia de agregação em cinco grupos de escolaridade para os dados dos Censos de 1950 a 2000, para fins de comparação. 25 Figura 7 – Gini Educacional Estimado vs Real Fonte: Elaboração própria. As linhas para o período entre 1900 e 1960 representam as estimativas do Gini educacional feitas a partir da composição educacional anteriormente estimada. Os pontos entre 1950 e 2000 representam o Gini educacional calculado a partir dos dados dos Censos Demográficos (IBGE, 1950-2000). Em primeiro lugar, nossas estimativas chegam a 1950 e 1960 muito próximas aos níveis obtidos a partir dos estoques populacionais por educação observados nos dados dos Censos Demográficos, o que nos traz confiança sobre os movimentos do indicador na primeira metade do século XX. Como era esperado, o nível de desigualdade educacional em 1900 é bastante elevado e, ao invés de cair com o aumento de indivíduos escolarizados, a desigualdade educacional brasileira se mantém praticamente estável em um nível elevado durante boa parte da primeira metade do século XX. Esse fato chama bastante a atenção e significa que a série de reformas ocorridas durante a República Velha parece não ter contribuído para reduzir as desigualdades educacionais na população brasileira. Além disso, nem todos os estados acompanharam o período de transição política da República Velha ao mesmo passo (Martínez-Fritscher et al., 2010). Enquanto alguns aceitaram mais rapidamente o sistema republicano, como é o caso dos estados produtores de café, outros mantiveram maior afinidade com a monarquia. Consequentemente, as políticas praticadas nessas regiões eram diferentes, com os estados mais receptivos ao novo regime gastando 26 mais em educação. Ainda, esses investimentos em educação seriam incentivados por fatores como: imigração, industrialização e alterações no sistema político eleitoral. É possível que a ênfase no primário tenha tido alguma contribuição para a redução do índice a partir de 1920, e as transformações ocorridas durante o período do Estado Novo e podem ter gerado efeitos sobre a desigualdade somente na década seguinte. É mais provável, no entanto, que as mudanças no acesso ao secundário e ao ensino superior a partir da redemocratização após a II Guerra Mundial tenham tido maior impacto. Entre 1930 e 1964 não houve, nenhuma mudança muito significativa no ritmo de expansão do ensino primário (Figura 4, painel (a)), devido à destinação de recursos destinados predominantemente ao ensino superior (Kang, 2010). No entanto, como a população crescia a taxas elevadas, mesmo com uma proporção fixa da população jovem indo para a escola, é possível que o estoque de pessoas com alguma escolaridade tenha aumentado. Isso é evidenciado pelo acentuado crescimento da proporção de alfabetizados (Figura 3). A partir dos anos 1960, há a promulgação das Leis de Diretrizes e Bases da Educação (em 1961 e 1971) que também eliminaram um dos principais pontos de estrangulamento do sistema educacional brasileiro, a transição entre ensino primário e ginasial (Marcílio, 2005). Com isso, o número de indivíduos com maior escolaridade cresce mais rapidamente, fazendo com que o índice de Gini caia de forma mais pronunciada. Além disso, examinando as mudanças educacionais do período militar, Romanelli (1983 apud Anazawa, 2011) coloca que o principal objetivo do governo era aumentar a escolarização da população, independente da qualidade desta educação, e assim preparar melhor os indivíduos para o mercado de trabalho. O aumento da demanda por educação, como produto da industrialização, aliado ao baixo investimento público, levou a uma crise educacional entre 1964 e 1968. A condição econômica do país impediu que a oferta de ensino se expandisse. Assim, o acesso à educação ainda era desigualmente distribuído, o que implicava numa alta desigualdade de renda, como observado por Langoni (1973). No painel inferior da Figura 7, mostramos os índices separadamente por região. Em 1900, as quatro séries estão relativamente próximas entre si (entre 0,73 para a região Sul e 0,80 para as demais). A desigualdade interna às regiões tem variação perceptível ao longo do tempo. Nas primeiras décadas do século, apenas a região Sul apresenta declínio no índice de Gini, enquanto as outras três regiões analisadas e o Brasil apresentam um aumento de desigualdade. Notadamente, a região Nordeste mantem-se com a maior 27 desigualdade durante todo o período analisado. A região Sul permanece até a o fim da década de 1950 com a menor desigualdade, mas a região Sudeste, que tem queda expressiva desde a década de 1920, aproxima-se consideravelmente desde meados do século. A queda de desigualdade para as regiões Centro-Oeste e Nordeste, entretanto, passa a ser expressiva apenas no início da década de 1950. A região Centro-Oeste, que até a metade do século estava consideravelmente próxima da região Nordeste, em 2000, encontra-se muito mais próxima das regiões Sul e Sudeste em termos de desigualdade educacional. Enquanto as regiões Sudeste e Centro-Oeste, obtiveram melhoras na distribuição educacional que as aproximaram da região Sul, a região Nordeste manteve- se afastada das demais regiões permanecendo com a maior desigualdade educacional. É possível diferenciar a dinâmica do Sul e Sudeste das demais regiões, e também notar que a desigualdade educacional nestes locais sempre foi menor. Diversas explicações são apresentadas para este resultado. Rocha, Ferraz e Soares (2015) apontam como causa o grande influxo de imigrantes que estas regiões receberam entre o final do século XIX e as décadas iniciais do século XX, uma vez que estes imigrantes eram, em média, mais escolarizados que os brasileiros, levando assim a um aumento no nível de instrução dos locais onde se estabeleciam. Musachio, Martinez e Viarengo (Op. cit.), por outro lado, citam a descentralização administrativa do ensino, que além de criar múltiplos sistemas de ensino, deixava nas mãos dos estados e municípios os investimentos em educação, e dado que o nível de arrecadação dos estados era distinto, também o eram os investimentos realizados. As diferenças regionais em termos de distribuição de educação refletem características de um processo de expansão do acesso à educação que ocorreu de maneira distinta entra as regiões brasileiras, mas também é consequência de um processo histórico mais amplo e influencia outras características sociais e econômicas dessas regiões. As regiões com menor desigualdade educacional no ano 2000, Sul e Sudeste, também são aquelas que apresentam os maiores PIBs per capita no mesmo ano, R$7 692 e R$ 8 774 respectivamente.5 Já a região Centro-oeste que em 2000 apresentava um PIB per capita não muito distante de R$ 6 559, por outro lado, tinha a pior desigualdade de renda6. 5 Contas Regionais do Brasil 1997 - 2000: Produto Interno Bruto per capita do Brasil, por Grandes Regiões e Unidades da Federação. IBGE. Consultado em 08 de novembro de 2016. 6 Censo Demográfico - 2000 - Resultados da Amostra. Tabela 2.7.12. Disponível em: http://www.ibge.gov.br/home/estatistica/populacao/censo2000/primeiros_resultados_amostra/tabela_regi oes.shtm. Consultado em 21/11/2016. 28 Os gráficos a seguir servem como uma base para verificação e comparação dos resultados das nossas estimativas do índice de Gini educacional. Através dessas comparações, notamos que nossas estimativas estão bastante próximas daquelas obtidas a partir de microdados, bem como a tendência de redução da desigualdade educacional, especialmente a partir da década de 1950, se confirma quando observamos cada coorte individualmente. A Figura 8 apresenta a comparação entre o cálculo do índice de Gini usando a metodologia de agregação por níveis educacionais (i.e. sem variação intra- grupo) e o cálculo utilizando dados em nível individual. Ambas as séries fazem uso dos dados do Censo Demográfico, porém apenas a partir de 1960 é possível utilizar micro dados. A estimação com dados agregados situa-se acima daquela de nível individual em todos os anos. Como para definir os 5 grupos de nível de ensino foi considerado apenas o último nível concluído por cada indivíduo, ao desconsiderar a variação intra-grupos, a agregação provavelmente subestima os anos de estudo da parcela educada da população e superestima o índice. No entanto, é possível observar que as tendências de longo prazo das duas séries são muito semelhantes, o que nos dá maior confiança sobre as séries estimadas para a primeira metade do século XX. 29 Figura 8 – Gini Educacional Microdados vs Agregados Fonte: Censos Demográficos/IBGE. Elaboração própria. É possível perceber, entretanto, que a diferença é menor nos anos de 1960 e 1970. Dado que a proporção de pessoas com educação formal aumenta ao longo do tempo, a diferença entre as duas séries tende a aumentar com o passar do tempo. Assim, a superestimação do índice tende a ser menos expressiva do começo à metade do século, período de interesse dessa análise. A Figura 9 mostra uma forma alternativa de se estimar a evolução do índice de Gini educacional, separando os dados por coorte de nascimento de 1900 a 1990, observados nos microdados dos Censos a partir de 1960. Podemos observar que os valores do índice se reduzem continuamente a cada nova coorte, o que contrasta com a estabilidade inicial do índice de Gini educacional para todo o estoque populacional até 1940 (como visto na Figura 7). Essas diferenças podem ser explicadas por dois fatores. Em primeiro lugar, com a expansão do sistema de ensino ao longo do tempo, a tendência de redução da desigualdade educacional significa que a cada geração, mais indivíduos foram incorporados ao sistema educacional, de modo a torna-los mais homogêneos entre si em termos de escolaridade. Apesar dessas mudanças nas coortes de nascimento, as transformações ocorridas para o estoque populacional são mais lentas, uma vez que, a cada instante, há várias coortes coexistindo, e cada coorte corresponde a apenas uma pequena parcela da população total, com diferentes níveis de desigualdade educacional. O segundo fator seria uma seleção possivelmente diferenciada por escolaridade ao longo do tempo (devido às diferenças das taxas de mortalidade), de forma que somente 30 os mais escolarizados sobrevivem até as idades mais avançadas e são abrangidos pelos Censos a partir de 1960. No entanto, e possível notar que as linhas não se distanciam muito umas das outras, o que significa que essa seleção é pequena em comparação com a variação entre as coortes. Dessa forma, nossa metodologia nos permite chegar a estimativas mais adequadas, uma vez que com ela conseguimos estimar o índice de Gini para todas as coortes em um dado instante, e não incorremos no viés de seleção devido à diferenciação das taxas de mortalidade por nível de escolaridade. Figura 9 – Gini Educacional por Coortes de Nascimento Fonte: Dados dos Censos Demográficos (IBGE, 1960-2000). Cada uma das linhas representa um Censo Demográfico, e os pontos representam o Gini Educacional calculado para aquela coorte naquele Censo Demográfico. Por fim, realizamos uma comparação dos nossos resultados com aquele de Van Leeuwen e Van Leeuwen-Li (2015) para o Brasil, mostrada na Figura 10. A partir de um ponto inicial muito semelhante em 1900, fica claro que, em contraste com nossa estimativa, o Gini educacional calculado pelos autores decresce sistematicamente desde o início do século XX. A partir de 1950, quando já é possível realizar diretamente estimativas de estoques educacionais, as tendências das duas séries se igualam. Conforme já argumentamos, no início do século, o estoque que fazia maior diferença para a desigualdade educacional era de analfabetos. 31 Figura 10 – Comparação de Gini Educacional por Coortes de Nascimento Fonte: Van Leeuwen e Van Leeuwen-Li (2015); Censos Demográficos; AEB. Elaboração própria. A linha para o período entre 1900 e 1960 representam as estimativas do Gini educacional feitas a partir da composição educacional anteriormente estimada. Os pontos entre 1950 e 2000 representam o Gini educacional calculado a partir dos dados dos Censos Demográficos (IBGE, 1950-2000). 6. Conclusões Este artigo tem o intuito de contribuir para o debate acerca dos determinantes da elevada desigualdade social observada no país. Apesar da recente tendência de queda da desigualdade de renda, o Brasil ainda é um dos países mais desiguais do mundo, e parte dessa situação parece ser resultado do processo diferenciado de expansão educacional nas regiões brasileiras. Para verificar essa hipótese, construímos séries de um índice de Gini educacional desde o início do século XX para o Brasil e as regiões analisados. Nossos resultados indicam que a desigualdade educacional era bastante elevada em 1900. De acordo com as nossas estimativas, naquele ano a grande maioria da população brasileira com mais de 5 anos era composta por analfabetos (68,7%) ou por pessoas sem o primário completo (25%), o que gera um índice de Gini de 0,78. O sistema educacional, em geral, pouco acessível à população também contribuiu para a manutenção da desigualdade, de modo que a geração nascida entre 1900 e 1910 manteve uma desigualdade relativamente elevada (com índice de Gini de 0,69 em 1960). Entre 1900 e 1920 a desigualdade educacional brasileira aumentou: consequência de um sistema educacional em expansão, mas ainda bastante restrito. Ao longo das décadas, no entanto, as novas gerações tornaram-se cada vez menos desiguais, o que é medido pelo declínio sistemático do Gini educacional. Para os nascidos na década de 32 1980 o índice é próximo de 0,3, tendo como referência o censo de 2000. Esse movimento foi concretizado pelo aumento de matrículas inicialmente no ensino primário, e posteriormente no secundário e superior, uma vez que no começo do século a grande maioria da população tinha escolaridade muito próxima de zero. Dessa forma, a redução da desigualdade educacional coincide com um aumento do nível médio de escolaridade. A introdução sucessiva das novas gerações mais educadas no estoque foi reduzindo a disparidade geral de educação, resultando em um movimento de redução da desigualdade no total da população entre 1920 e 2000. No início do século XX, a desigualdade educacional era semelhante nas regiões brasileiras, com um índice de Gini entre 0,73 e 0,81. Ao longo do século, ordenação dessas regiões em termos de desigualdade educacional não mudou, mas a diferença entre as regiões aumentou sensivelmente, em 2000, as regiões com maior e menor desigualdade educacional, a região Nordeste 0,59 e a região Sudeste, tinham índices de 0,59 e 0,43 respectivamente O acesso ao sistema de ensino e a distribuição de educação não somente são reflexos de um processo histórico de desenvolvimento, mas têm influência expressiva sobre esse mesmo processo. A região nordeste apresenta no fim do século a pior distribuição de educação é também aquela com pior distribuição de renda de PIB per capta7. Em contrapartida, a região sul, que durante a maior parte da série analisada permaneceu com a menor desigualdade de educação, no final do século figura com as primeiras colocações em distribuição de renda e PIB per capta8. Distinguir esses efeitos é uma tarefa que vai além do escopo deste trabalho, mas fica nítido que há relação entre esses indicadores. Essa evolução apresentada da desigualdade escolar ajuda a esclarecer, em parte, a desigualdade social entre as regiões. O aumento da escolaridade, associado à redução da desigualdade, parece ter um papel relevante para explicar as diferenças de renda observadas ao longo do século XX e que ainda persistem atualmente. 7 Instituto de Pesquisa Econômica Aplicada (IPEA). http://www.ipeadata.gov.br/ Consultado em 21 de setembro de 2016. 8 Instituto de Pesquisa Econômica Aplicada (IPEA). http://www.ipeadata.gov.br/ Consultado em 21 de setembro de 2016. 33 7. Referências Bibliográficas ACEMOGLU, D.; JOHNSON, S.; ROBINSON, J. A. The Colonial Origins of Comparative Development: An Empirical Investigation. American Economic Association, v. 91, n. 5, p. 1369-1401, dez. 2001. BARROS, A. R. Desigualdades Regionais no Brasil: Natureza, causas, origens e soluções. Rio de Janeiro: Elsevier, 2011, 336 p. CAMPS, E.; ENGERMAN, S. L. The Impact of Race and Inequality on Human Capital Formation in Latin America During the Nineteenth and Twentieth Centuries. Economics Working Papers 1436, Departament of Economics and Business, Universitat Pompeu Fabra, 2014. CENTRAL INTELLIGENCE AGENCY (CIA). The World Factbook 2013-14. Washington, DC: Central Intelligence Agency, 2013. COWELL, F. A. Measuring Inequality. Oxford University Press, 2009, 236 p. DABLA-NORRIS, E.; KOCHHAR, K.; RICKA, F.; SUPHAPHIPHAT, N.; TSOUNTA, E. Causes and Consequences of Income Inequality: A Global Perspective. International Monetary Fund (Discussion Note), jun. 2015. DE FERRENTI, D.; PERRY, G. E.; FERREIRA, F. H. G.; WALTON, M. Inequality in Latin America: Breaking with History?. World Bank Latin American and Caribbean Studies; Washington, DC: World Bank, 2004. DIRECTORIA GERAL DE ESTATISTICA. Relatorio Annexo ao do Miniterio dos Negocios do Imperio, de 1875. Rio de Janeiro: Typographia de Pinto, Brandão e Comp., 1875. DIRETORIA GERAL DE ESTATÍSTICA. Anuário Estatístico do Brasil. Rio de Janeiro: IBGE, 1912-1936. ENGERMAN, S. L.; SOKOLOFF, K. L. Factor Endowments, Institutions, and Differential Paths of Growth Among New World Economies: A View from Economic Historians of the United States. National Bureau of Economic Research, n. 66, dez. 1994. 34 FERRARI, M. A migração nordestina para São Paulo no segundo governo Vargas (1951-1954) - seca e desigualdades regionais. 2005. 160p. Dissertação de Mestrado – Universidade Federal de São Carlos. São Carlos, 2005. FOLDVARI, P.; LEEUWEN, B. Educational and Income Inequality in Europe, ca. 1870- 2000. Cliometrica, v. 8, p. 271-300, 2014. FRANKEMA, E. The Expansion of Mass Education in Twentieth Century Latin America: a Global Comparative Perspective. Journal of Iberian and Latin American Economic History, v. 27, n. 3, p. 359-395, 2009. FUNDAÇÃO SISTEMA ESTADUAL DE ANÁLISE DE DADOS (SEADE). Memória das Estatísticas Demográficas. Disponível em: . Acesso em julho de 2016. FURTADO, C. Formação Econômica do Brasil. 32. ed. São Paulo: Companhia Editora Nacional, 2005. IBGE. Anuário Estatístico do Brasil. Rio de Janeiro: IBGE, 1938-1962. ______. Estatísticas do Século XX. Rio de Janeiro: IBGE, 2007. ______. Trabalho e Rendimento Educação e Deslocamento. Rio de Janeiro: IBGE, 2012. INSTITUTO NACIONAL DE ESTATISTICA. Anuário Estatístico do Brasil. Rio de Janeiro: Tip do Departamento de Estatística de Publicidade, 1936-1937. KANG, T. H. Instituições, Voz Política e Atraso Educacional no Brasil 1930-1964. 2010. 182 p. Dissertação (Mestrado em Economia) – IPE-USP, São Paulo. 2010. LAM, D.; LEVISON, D. Declining Inequality in Schooling in Brazil and its Effects on Inequality in Earnings. Journal of Development Economics, v. 37, p. 199-225, 1992. LAM, D.; LEIBBRANDT, M.; FINN, A. Schooling Inequality, Returns to Schooling, and Earnings Inequality: Evidence from Brazil and South Africa. 10th IZA/World Bank Conference on Employment, Bonn, Germany, 2015. and Development LANGONI, C. A Distribuição de Renda e Desenvolvimento Econômico no Brasil. Rio de Janeiro: Editora Expressão e Cultura, 1973. 35 LEE, Jong-Wha; LEE, Hanol. Human capital in the long run. Journal of Development Economics, v. 122, p. 147-169, 2016. LEEUWEN, B. V.; LEEUWEN-LI, J. V.; FOLDVARI, P. Average Years of Education (Average, total Population 15 years and older), 1850-2010. Disponível em: . Acesso em julho de 2016. LEFF, N. H. Desenvolvimento Econômico e Desigualdade Regional: origens do caso brasileiro. Revista Brasileira de Economia, vol. 26, n. 1, 1972. LOREL, B. Assessing Brazilian Educational Inequalities. Revista Brasileira de Economia, v. 62, n. 1, p. 32-65, 2008. LUSTIG, N.; LOPEZ-CALVA, L. F.; ORTIZ-JUAREZ, E. Declining Inequality in Latin America in the 2000s: The Cases of Argentina, Brazil, and Mexico. World Development, v. 44, p. 129-141, 2003. MARCÍLIO, M. L. História da Escola em São Paulo e no Brasil. São Paulo: Imprensa Oficial do Estado de São Paulo: Instituto Fernand Braudel, 2005. 485 p. MINISTÉRIO DA AGRICULTURA, INDUSTRIA E COMMERCIO. DIRECTORIA GERAL DE ESTATISTICA. Annuario Estatistico do Brazil – 1º Anno (1908-1912). Rio de Janeiro: Typographia, vol. 1, 1916. MUSACHIO, A.; MARTINEZ, A.; VIARENGO, M. Colonial Institutions, Commodity Boom, and the Diffusion of Elementary Education in Brazil, 1889-1930. National Bureau of Economic Research (NBER Working Paper n. 20029), jan. 2015. Disponível em: . Acesso em maio de 2016. OCDE. Fomentando o Crescimento Inclusivo da Produtividade na América Latina. Paris: (Série Melhores Políticas), 2014, p. 19. REIS, J. G. A.; BARROS, R. P. de. Wage Inequality and the Distribution of Education: a study of the evolution of the regional differences in inequality metropolitan Brazil. Journal of Development Economics, n. 36, p. 117-143, 1991. ROCHA, R.; FERRAZ, C.; SOARES, R. R. Human Capital Persistence and Development. The Institute for the Study of Labor (Discussion Paper n. 9101), jun. 2015. Disponível em: < http://ftp.iza.org/dp9101.pdf>. Acesso em maio de 2016. 36 SECRETARIA D’ESTADO DOS NEGOCIOS DO IMPERIO. 3ª DIRECTORIA. SECÇÃO DE ESTATÍSTICA. Trabalhos da Secção de Estatística Anexxa a 3ª Directoria da Secretaria d’Estado dos Negocios do Imperio, Anno de 1886. Rio de Janeiro: Imprensa Nacional, 1887. SIMONSEN, R. História Econômica do Brasil. 4. Ed. Brasília: Edições do Senado Federal, 2005. THOMAS V, WANG Y, FAN X. Measuring education inequality: Gini coefficients of education. World Bank Publications. 2001. TSOUNTA, E.; OSUEKE, A. I. What is Behind Latin America’s Declining Income Inequality?. IMF Working Paper, WP/14/124, 2014. U. S. Census Bureau. A Half-Century of Learning: Historical Census Statistics on Educational Attainment in the United States, 1940 to 2000. Disponível em: . Acesso em: abr. 2016. VAN LEEUWEN, B.; VAN LEEUWEN-LI, J. Educational Inequality Gini Coefficient, http://hdl.handle.net/10622/KORKQW, IISH Dataverse, V1, 2015. WILLIAMSON, J. Latin America Inequality: Colonial Origins, Commodity Booms, or a Missed 20th Century Leveling? National Bureau of Economic Research (NBER Working Paper n. 20915), jan. 2015. Disponível em: . Acesso em maio de 2016. 37 Apêndice I Ao longo do artigo utilizamos as estimativas populacionais do IBGE por faixa de idade em diversos momentos para nossas próprias estimativas de composição educacional e índice de Gini, portanto, convém apresentar a evolução dessas estimativas. Como é possível notar na figura abaixo, em todas as faixas observadas a população evolui rapidamente, em especial após a década de 1950. Utilizamos a população de 5 anos ou mais para calcular nossas estimativas de composição educacional, e a população de 10 ou mais apenas para compatibilizar com os dados dos Censos demográficos de 1940 a 1960. Figura I – Evolução demográfica por faixa etária Fonte: Anuários Estatísticos do Brasil (vários anos) e Censos Demográficos (1940 a 2000). Elaboração própria Apêndice II De forma a possibilitar uma análise um pouco mais detalhada da evolução do sistema educacional brasileiro ao longo da primeira metade do século XX, apresentamos também o número de indivíduos na faixa etária ideal (aproximada) para cada grau de ensino divido pelo número de escolas deste mesmo grau, bem como pelo número de docentes. Como podemos perceber nas figuras abaixo, a tendência que se observa corrobora os dados apresentados na sessão de resultados, isto é, as regiões Sul e Sudeste aparecem na grande maioria das vezes como aquelas regiões onde o número de indivíduos 38 por escolas e por docentes é menor. Isso possivelmente indica que, o grau de investimentos em educação nestas duas regiões era mais alto do que no restante do país. Ademais é importante pontuar que no Ensino Primário os dados para o ano de 1960 tem uma pequena diferença em relação aos demais anos. Figura II Anexo – População por faixa etária ideal e número de escolas a) Ensino Primário b) Ensino Secundário c) Ensino Profissional d) Ensino Superior Fonte: Censos Demográficos; Anuários Estatísticos. Elaboração própria. Figura III Anexo – População por faixa etária ideal e número de docentes 39 a) Ensino Primário b) Ensino Secundário c) Ensino Profissional d) Ensino Superior Fonte: Censos Demográficos; Anuários Estatísticos. Elaboração própria. 40 Apêndice III – Detalhamento sobre Dados de Ensino Superior Exceto para três escolas de nível superior, não conseguimos encontrar dados de matrículas nesse nível de ensino para o século XIX. Na ausência dessas informações, nós procedemos de duas formas diferentes (que, no entanto, levaram a resultados semelhantes). Em primeiro lugar, os AEBs fornecem dados de matrículas no ensino superior em 1907 (AEB de 1953) por estado e, além disso, o número de escolas de nível superior no final do século XIX é conhecido (Anísio Teixeira, 1989). Com essas duas informações, tentamos aproximar o número de matriculados existentes em 1890, supondo que em 1907 as escolas possuíam número semelhante de alunos entre si. Dessa forma, nós ajustamos o número de alunos de 1907 às escolas existentes em 1890, supondo adicionalmente que não houve crescimento relevante do número de vagas por instituição. Apesar de se tratar de uma aproximação, a comparação com os dados para as três escolas disponíveis mostra que os números calculados não estão muito longe da realidade. A partir desses números, nós então calculamos o número de matrículas como proporções da população entre 20 e 24 anos. Uma crítica que poderia ser feita ao método anterior seria de que nós não temos estimativas de migração dos graduados entre os estados, de modo que só conseguiríamos realizar estimativas nos estados com alguma escola de nível superior. Não é possível conhecer a priori a direção do viés devido a esse método em todos os estados, uma vez que é possível que estados sem escolas de nível superior tenham graduados que migraram para lá, e estados com escolas de nível superior também pode atrair graduados de outros estados. Na tentativa de lidar com esse problema, tentamos obter uma estimativa do estoque de pessoas com nível superior a partir das informações de profissão do Censo de 1872. Para isso, consideramos que todas as pessoas que exerciam algumas profissões liberais eram formadas no nível superior. A partir dessas informações, obtivemos a proporção de pessoas com ensino superior na população. No caso da estimativa de formados no ensino superior a partir do Censo de 1872, nós aplicamos a proporção obtida à população com 25 anos ou mais em 1900 e, em seguida, aplicamos as demais proporções ao restante da população sem o ensino superior. 41