A História da Educação e as Origens da 
Desigualdade Regional no Brasil 
 
Bruno Komatsu, Naercio Menezes Filho, Pedro 
Oliveira, Leonardo Viotti 
 
  
Policy Paper | Nº 27 
Setembro, 2017 
 
 
A História da Educação e as Origens da 
Desigualdade Regional no Brasil 
 
Bruno Komatsu 
Naercio Menezes Filho 
Pedro Oliveira 
Leonardo Viotti 
 
 
Bruno Kawaoka Komatsu 
Insper Instituto de Ensino e Pesquisa  
Centro de Políticas Públicas (CPP)  
Rua Quatá, nº300  
04546-042 - São Paulo, SP - Brasil  
brunokk@insper.edu.br  
 
Naercio A. Menezes Filho  
Insper Instituto de Ensino e Pesquisa  
Centro de Políticas Públicas (CPP)  
Rua Quatá, nº300  
04546-042 - São Paulo, SP - Brasil  
naercioamf@insper.edu.br  
 
Pedro Augusto Costa Oliveira 
Insper Instituto de Ensino e Pesquisa  
Centro de Políticas Públicas (CPP)  
Rua Quatá, nº300  
04546-042 - São Paulo, SP - Brasil  
pedroaco@insper.edu.br  
 
Leonardo Viotti 
The World Bank Group 
Development Impact Evaluation (DIME) 
900 19th St NW, MC Building. 
20006 - Washington, DC – United States of America 
lviotti@worldbank.org 
 
 
Copyright Insper. Todos os direitos reservados. 
É proibida a reprodução parcial ou integral do conteúdo  
deste documento por qualquer meio de distribuição, digital ou impresso,  
sem a expressa autorização do Insper ou de seu autor.  
A reprodução para fins didáticos é permitida observando-se  
a citação completa do documento.  
2 
 
 
 
A História da Educação e as Origens da Desigualdade Regional no Brasil 
 
Bruno Komatsu 
Naercio Menezes Filho 
Pedro Oliveira 
Leonardo Viotti 
Centro de Políticas Públicas do Insper 
 
Resumo 
Esse artigo busca descrever a trajetória da desigualdade educacional, para entender as 
origens da desigualdade regional no Brasil. Combinamos diversas fontes de dados 
históricos do final do século XIX e início do século XX, para construir medidas precisas 
de estoque de pessoas por escolaridade e o índice de Gini educacional, de 1900 a 2000 
para o Brasil e suas regiões. Nossos resultados mostram que a elevada desigualdade 
educacional do início do século passado não diminuiu até 1920, declinando lentamente 
entre 1920 e 1950 e mais rapidamente a partir de então. Além disso, nossos resultados 
mostram que os níveis de desigualdade educacional de cada região brasileira, que eram 
semelhantes entre si em 1900, tiveram trajetórias diferenciadas, declinando mais 
rapidamente nas regiões Sul e Sudeste. 
Palavras-Chave: Educação, Desigualdade, Índice de Gini. 
 
Abstract 
This paper aims to describe the trajectory of educational inequality in order to understand 
the origins of regional inequality in Brazil. We combine several sources of historical data 
from the late nineteenth and early twentieth centuries to calculate precise measures of 
stocks of people by schooling and the educational Gini index from 1900 to 2000 for Brazil 
and its regions. Our results show that the high level of educational inequality of the 
beginning of the last century did not reduce until 1920, declining slowly between 1920 
and 1950 and more rapidly thereafter. In addition, our results show that the levels of 
educational inequality in each Brazilian region, which were similar to each other in 1900, 
had different trajectories, declining more rapidly in the South and Southeast regions. 
Key Words: Education, Inequality, Gini Index. 
JEL: I24 – Education and Inequality, I25 – Education and Economic Development 
  
3 
 
 
 
1. Introdução 
Apesar das importantes transformações econômicas e do mercado de trabalho no 
Brasil ocorridas no período recente e que levaram à acentuada redução da desigualdade 
de renda na última década (Lustig, Lopez-Calva e Ortiz-Juarez, 2013), o país figura ainda 
hoje entre os países com maior nível de desigualdade no mundo (Tsounta e Osueke, 2014; 
CIA, 2013). Os elevados níveis históricos de desigualdade social do Brasil são 
compartilhados entre países latino americanos e possuem raízes profundas nos processos 
de colonização. 
Um importante mecanismo de perpetuação da desigualdade de renda entre países 
se constitui nas diferenças de investimento e distribuição de capital humano (De Ferrenti 
et al., 2004). Nos países da América Latina, a educação formal se desenvolveu 
tardiamente e priorizando o acesso das elites, o que gerou uma escassez de mão de obra 
qualificada e desigualdades regionais (Camps e Engerman, 2014). Após entrar na agenda 
de agentes da independência no século XIX, a expansão da educação à população foi 
esquecida com a consolidação de regimes conservadores no período pós-independência e 
permaneceu como privilégio dos ricos até o último quarto daquele século (Frankema, 
2009). Adicionalmente, as ondas de migrantes europeus ao Brasil entre o final do século 
XIX e início do século XX representaram choques positivos nos estoques da capital 
humano e reforçaram as desigualdades regionais de renda (Rocha, Ferraz e Soares, 2015). 
Esse artigo pretende contribuir para a literatura com novas medidas e uma análise 
detalhada da evolução da desigualdade educacional do Brasil no período que vai do início 
do século XX até a década de 1960. Nossa principal contribuição é a construção de 
medidas mais precisas de estoques da população por educação para a primeira metade do 
século XX, utilizando dados históricos dos Anuários Estatísticos do Brasil (AEBs) e dos 
Censos Demográficos. Com isso, estimamos o índice de Gini para a distribuição da 
educação no Brasil e suas regiões. A trajetória dessa medida de desigualdade educacional 
nos dá um panorama mais claro de como esta respondeu às reformas empreendidas pelo 
governo, na tentativa de expandir o sistema de ensino. Além disso, o índice de Gini 
educacional nos permite avaliar como a desigualdade na educação se comportou em 
algumas regiões do país e em que medida esta é responsável pela desigualdade regional 
existente ainda hoje. 
A problemática da desigualdade social vem ganhando destaque nas mais diversas 
áreas de pesquisa nos últimos anos, tendo em vista que estudos recentes apontam um 
4 
 
 
 
aumento da desigualdade em todo o mundo (Dabla-Norris, 2015). Há na literatura um 
conhecido debate sobre as possíveis causas para a alarmante desigualdade na América 
Latina. De um lado, a hipótese central é de que a atual desigualdade nos países latino-
americanos tem raízes históricas e uma forte associação com a qualidade das instituições 
fundadas no período colonial e aquelas existentes hoje em dia (Acemoglu et al., 2001; De 
Ferrenti et al., 2004). Do outro lado, a alta desigualdade da América Latina como um 
fenômeno relativamente recente, tendo surgido em meio a transformações nos séculos 
XIX e XX, como o aumento dos preços internacionais das commodities e o isolacionismo 
dos países latino americanos após a Primeira Guerra Mundial (Williamson, 2015). A 
evolução dos preços diferenciada por tipo de commodity (cana de açúcar e café) também 
determina diferenças de desenvolvimento das regiões produtoras no Brasil 
(respectivamente as regiões Nordeste e Sudeste) (Leff, 1972). 
Além dessas hipóteses, a educação parece desempenhar um papel muito relevante 
na perpetuação da desigualdade de renda. Os efeitos da desigualdade de capital humano 
sobre a desigualdade de renda foram bastante estudados na literatura (veja, por exemplo, 
Lam e Levison (1991), Lorel (2008), Barros (2011)). A transmissão intergeracional de 
escolaridade constitui o canal principal pelo qual a distribuição desigual de capital 
humano afeta a desigualdade de renda (Lorel, 2008). A desigualdade educacional pode 
afetar a desigualdade de renda por meio da dispersão da escolaridade e dos efeitos da 
escolaridade sobre os rendimentos.1 Além disso, a educação pode afetar a desigualdade 
de renda através de externalidades positivas do capital humano, relacionadas à tecnologia 
(Barros, 2011). Além do ganho de eficiência e aumento da produtividade dos indivíduos 
com maior nível de instrução, a tecnologia é desenvolvida respeitando as restrições dos 
outros fatores de produção. Portanto, regiões com maior disponibilidade de capital 
humano terão tecnologias que usam mais intensivamente este fator, e em consequência 
serão mais produtivas. Além disso, a importância da educação para a desigualdade é 
maior nas regiões menos desenvolvidas do Brasil, a saber a região Nordeste, uma vez que 
o diferencial salarial por grau de escolaridade nessas regiões é maior (Paes de Barros e 
Reis, 1991). 
                                                          
1 Embora intuitivamente a desigualdade de escolaridade seja positivamente correlacionada com a 
desigualdade de renda, Lam, Leibbrandt e Finn (2015) argumentam que não há fundamento formal para 
que essa relação tenha esse sinal. 
5 
 
 
 
Nesse sentido, a má distribuição de fatores de produção, especialmente do capital 
humano, acaba por impedir a convergência do nível de renda per capita entre as regiões, 
esperada por um modelo neoclássico (Barro e Sala-i-Martin, 1992). Para o Brasil, cerca 
de 33% do aumento da desigualdade de renda ocorrido entre as décadas de 1960 e 1970 
pode ser explicado pela variável educação (Langoni, 1973). Adicionalmente, a 
distribuição desigual de capital humano tende a persistir, uma vez que a acumulação de 
capital humano dos pais é positivamente relacionada à dos filhos. A ausência de políticas 
públicas que busquem redistribuir educação de forma mais igualitária entre as regiões, a 
desigualdade regional tende a se manter por tempo indeterminado (Barros, 2011). 
Alguns estudos anteriores estimaram medidas de desigualdade educacional no 
longo prazo. Thomas, Wang e Fan (2001) calculam um índice de Gini educacional para 
diversos países a partir de 1960 e concluem que a tendência geral na segunda metade do 
século XX é de redução da desigualdade educacional, que é negativamente associada à 
média de anos de estudo e à riqueza do país. A associação do nível de escolaridade com 
a dispersão (medida pelo desvio padrão) segue o padrão de uma curva de Kuznets. 
Resultados semelhantes são encontrados por Lorel (2008) para o Brasil, entre 1950 e 
2000, quando compara os estados brasileiros. Lee e Lee (2016) constroem uma medida 
de estoque educacional para o período entre 1870 e 2010 para 11 países, a partir de 
estimativas de taxas de matrícula no período entre 1820 e 1945 e das estimativas 
educacionais de Barro e Lee (2001) para o pós II Guerra. 
Nossa principal contribuição é de que estimar a evolução da desigualdade 
educacional no Brasil para a primeira metade do século XX, para quando não há 
microdados de pesquisas censitárias disponíveis. Nós adicionamos à literatura resultados 
obtidos a partir de fontes históricas não exploradas em outros estudos, como os relatórios 
estatísticos da antiga Diretoria Geral de Estatísticas (DGE), relatórios estatísticos do final 
do século XIX e taxas de mortalidade calculadas separadamente por nível de escolaridade. 
Nosso trabalho também dialoga com estudos que tentam explicar as causas da 
distribuição desigual de capital humano entre as regiões brasileiras, examinando a questão 
das diferenças de acesso à educação. A estrutura produtiva e de poder político da região 
parecem explicar em parte a concentração da educação. O acesso à educação era restrito 
às elites locais até o final do século XIX. A expansão do acesso com as reformas 
educacionais no final do século XIX e início do século XX, além disso, beneficiou 
6 
 
 
 
especialmente brancos (incluindo imigrantes europeus) e relegou nativos americanos, 
negros e mestiços ao segundo plano (Camps e Engerman, 2014). 
Há evidências de que a interação entre a qualidade das instituições locais e o 
aumento dos preços internacionais das commodities afeta os níveis regionais de 
acumulação de capital humano. Musachio et al. (2014) encontram uma relação positiva 
entre o preço dos produtos regionais exportados, as receitas tributárias destes produtos, a 
qualidade das instituições locais e o gasto per capita em educação. As regiões brasileiras 
se especializaram na produção de bens diferentes e aumento dos preços das commodities 
ocorreu de forma diferenciada por produto, beneficiando especialmente o preço do café. 
Em um contexto de descentralização da arrecadação fiscal e de responsabilidade de 
investimento educacional no nível dos estados, as receitas de arrecadação com exportação 
favoreceram estados produtores de commodities com alta demanda. Com isso, regiões 
exportadoras de café – como é o caso da região Sudeste – dispunham de um volume maior 
de recursos, o que possibilitava um maior investimento em educação. Já onde se 
exportava açúcar, algodão e tabaco, as receitas eram limitadas, o que inviabilizava 
grandes investimentos em educação. Soma-se a estes pontos o papel das instituições, isto 
é, não bastava a região ter sido beneficiada pelo boom das commodities para que obtivesse 
resultados educacionais melhores, pois as instituições é que determinavam em que 
medida as receitas de exportação decorrentes do boom seriam direcionadas a 
investimentos no sistema educacional.  
As diferenças educacionais por região também são explicadas por choques de 
capital humano devido aos influxos de migrantes internacionais, cujos níveis de capital 
humano eram relativamente maiores do que os da população local (Rocha, Ferraz e 
Soares, 2015). Esses migrantes se direcionaram principalmente à região sudeste e 
passaram também a demandar maior investimento em educação, o que fez com que a 
desigualdade regional de educação se perpetuasse. Em síntese, embora não haja na 
literatura uma total concordância quanto às origens e às explicações para a alta 
desigualdade existente no Brasil, a relevância da educação para compreender e explicar a 
desigualdade de renda é inegável. Nesse sentido, nossa principal contribuição é construir 
índices de Gini educacionais desde o início do século XX para o Brasil e suas regiões, 
para documentar a evolução da composição educacional brasileira e seu impacto nas 
desigualdades regionais. 
7 
 
 
 
O artigo está dividido em sete partes, além desta breve introdução. Na segunda 
seção realizamos um breve histórico da educação brasileira. Na terceira parte, faremos 
uma descrição dos dados utilizados, bem como de suas fontes suas especificidades. Em 
seguida, explicaremos detalhadamente a metodologia utilizada no trabalho. Por fim, 
apresentamos os resultados obtidos e algumas conclusões sobre o assunto. 
 
2. Breve Histórico da Educação no Brasil 
Durante boa parte do século XIX, o Brasil – assim como outros países latino-
americanos – esteve entre os países com os piores indicadores educacionais do mundo, 
em termos de nível e desigualdade escolar (Lustig, Lopez-Calva e Ortiz-Juarez, 2013). 
Isto, porque enquanto colônia ibérica o continente viu pouco progresso educacional. 
Figura 1 - Média de anos de estudo para países selecionados 
 
Fonte: Clio-Infra (Leeuwen et al., 2013). Elaboração própria. Dados para população de 15 anos ou mais.   
A Figura 1 compara a evolução da média de anos de estudo para quatro países: 
Brasil, Argentina, Estados Unidos e Espanha. Percebe-se que a média de anos de estudo 
no Brasil era muito baixa no final do século XIX (0,7 anos de estudo em 1900) e assim 
permaneceu durante as três primeiras décadas do século XX. A partir de 1940 este 
indicador passou a apresentar crescimento mais acelerado no Brasil, tornando a curva 
mais inclinada. Somente na década de 1990 é que a média de anos de estudo do Brasil 
chega ao nível observado nos Estados Unidos no início do século XX, o que explicita o 
grande atraso educacional do país. As trajetórias do indicador na Argentina foram bem 
8 
 
 
 
semelhantes à do Brasil, porém num patamar mais elevado, com crescimento 
comparativamente mais equilibrado ao longo de todo o período, exceto por uma década 
de estagnação entre 1980 e 1990, década em que o Brasil mais avançou nesse indicador.  
A Figura 2 traz uma comparação direta entre o Brasil e o país de fronteira, os 
Estados Unidos, em relação aos estoques populacionais com ensino médio e superior. 
Apesar do período relativamente mais curto, vemos que o grau de escolaridade dos 
brasileiros está muito aquém daquele dos norte-americanos: somente em 2010 é que a 
proporção de indivíduos com ensino médio no Brasil se igualou a que já era observada 
nos Estados Unidos na década de 1940 (IBGE, 2012), e a proporção de indivíduos no 
Brasil com o ensino superior, atingiu os níveis observados nos Estados Unidos em 1970. 
 
Figura 2 – Evolução da Escolaridade – EUA e Brasil 
a) Ensino Médio b) Ensino Superior 
  
Fonte: Censos Demográficos/IBGE para o Brasil e Census Bureau para o EUA. Elaboração própria. Dados 
para população de 25 anos ou mais. Obs: Para o Brasil, dados de 1940 e 1950 são aproximados. 
Há diversos fatores que explicam o atraso relativo do Brasil. De acordo com 
Colistete (2016), em contraste com outras colônias, como os Estados Unidos e Canadá, o 
padrão educacional observado nas colônias latino americanas seguia o das metrópoles, 
sendo extremamente restrito, focado no ensino secundário e superior e voltados para as 
elites. Além disso, no Brasil havia um descaso político com o ensino primário, que se 
refletia no baixo nível de gastos por aluno (dez vezes inferior ao dos Estados Unidos). 
9 
 
 
 
Ainda nesta linha, Lee e Lee (2016) analisam a evolução da taxa de matrículas nos 
três níveis de ensino (primário, secundário e terciário), e constatam que o período de 
crescimento mais acelerado das matrículas se deu após a Segunda Guerra Mundial. No 
período anterior, apenas os países mais desenvolvidos, que implementaram políticas de 
escolarização básica obrigatória entre os séculos XVIII e XIX, viram uma expansão real 
do número de indivíduos matriculados, em especial nos ensinos primário e secundário. 
No que tange aos países menos desenvolvidos, o crescimento da taxa de matrículas 
ganhou relevância somente após a década de 1950, o que também pode ser visto na Figura 
1 onde o crescimento da média de anos de estudo do Brasil fica mais evidente após a 
década de 1940.  
Além do atraso relativo do Brasil, também se verificam disparidades regionais em 
educação internas ao país, contribuindo para geração de desigualdade social. A Figura 3 
ilustra esse ponto usando a taxa de alfabetização da população. Apesar do grande aumento 
da proporção de alfabetizados em todo o país, entre o final do séc. XIX e o começo do 
século XXI, se verifica um relativo atraso de algumas regiões. No Censo de 1872, as 
regiões com maior proporção de alfabetizados eram Norte e Sul, enquanto não havia 
grande distinção entre Sudeste, Nordeste e Centro-Oeste. Antes do final do século XIX, 
a região Sudeste já apresenta acelerado crescimento em comparação com as demais. A 
região Centro-Oeste, no entanto, só chega ao nível de alfabetização das regiões que em 
1872 eram mais avançadas depois de 1900, enquanto a região Nordeste só chega a esse 
nível depois de 1920. Essa região permanece com a menor taxa de alfabetização no 
período e mesmo no ano final, 2010, a ela chega a um nível que foi atingido pelas regiões 
mais alfabetizadas já em 1980.  
  
10 
 
 
 
Figura 3 - Alfabetização nas Regiões Brasileiras 
 
Fonte: Censos Demográficos/IBGE. Elaboração própria. Dados para a população de 5 anos ou mais. Obs: 
o Censo de 1900 omitiu alguns distritos da pesquisa, e por esse motivo não o incluímos nesse gráfico. 
Esse panorama geral da educação no Brasil reflete políticas educacionais ao longo 
de todo o século XX, que afetam as matrículas e conclusões nos graus escolares. Essas 
taxas dão um panorama do comportamento do sistema educacional brasileiro e expõe o 
baixíssimo nível de matrículas em todos os graus escolares e o ainda menor nível de 
conclusões. Também chama atenção quão pequena foi a evolução do acesso à educação 
no período, em especial no ensino superior, que em 1960 possuía menos de 2% da 
população matriculada. 
A Figura 4 mostra a proporção de matriculados em cada grau escolar e a população 
na faixa etária considerada ideal para o nível. Todas as regiões brasileiras apresentam um 
crescimento das taxas de matrícula em todos os graus escolares, ocorrendo primeiro e de 
forma mais acentuada no ensino primário. 
  
11 
 
 
 
Figura 4 – Taxas de Matrícula 
a) Ensino Primário b) Ensino Secundário 
  
c) Ensino profissional d) Ensino Superior 
  
Fonte: Os dados de matrículas são provenientes dos Anuários Estatísticos do Brasil, de diferentes anos 
(DGE, 1912-1936; IBGE, 1932-1968). Para se chegar à taxa de matrícula, dividimos o número de 
indivíduos matriculados pelo total da população na faixa etária aproximada de frequência ideal de cada 
nível escolar (Primário: 5 a 14 anos; Secundário: 10 a 19 anos; Profissional: 10 a 19 anos; Superior: 20 a 
24 anos). 
O ensino secundário e o profissional possuem níveis iniciais comparativamente 
muito mais baixos e, em todas as regiões, o primeiro só começou a apresentar crescimento 
a partir de 1932. No caso do ensino superior, apesar de aumento significativo nas 
primeiras décadas do século XX nas regiões Norte, Sul e Sudeste, só há uma tendência 
de crescimento sistemático da taxa nas demais regiões a partir de 1942. 
12 
 
 
 
Comparando as regiões, é perceptível que as regiões Sul e Sudeste apresentam as 
maiores taxas em quase todos os níveis de ensino. Particularmente, o crescimento da taxa 
para essas duas regiões no nível superior é expressivo a partir da década de 1940. Em 
contrapartida, a região nordeste apresenta as menores taxas em toda a série para o ensino 
primário e, com exceção de alguns pontos, também nos níveis secundário e profissional, 
mas com níveis de matrícula ainda muito baixos. As regiões Norte e Centro-Oeste têm 
taxas medianas em comparação com as demais regiões para os níveis primário e 
secundário, mas em particular, a região centro-oeste tem as piores taxas de matrícula no 
ensino superior durante o período. 
Na Figura 5 apresentamos as taxas de conclusão, calculadas como a proporção de 
concluintes em relação à população na faixa de idade correspondente ao grau escolar. A 
taxa de conclusão reflete de forma mais precisa o incremento de um grau escolar em uma 
faixa de idade, porém, exceto pelo ensino superior, cuja série se inicia em 1912, os demais 
graus escolares possuem dados disponíveis somente a partir de 1932. 
Enquanto as regiões Sul e Sudeste apresentam crescimento entre 1932 e 1942, a 
taxa nas demais regiões permanece praticamente constante. A região Norte é aquela cuja 
taxa mais destoa do comportamento da curva de taxa de matrículas, o que é explicado em 
parte pela imprecisão das informações, em particular para locais mais distantes do centro 
político e intelectual do país e com maiores dificuldades de acesso. Na região Centro-
Oeste, a queda no percentual de concluintes entre as décadas de 1950 e 1960 pode ter sido 
causada por fatores demográficos, uma vez que na metade final da década de 1950 a 
cidade de Brasília foi construída, causando um grande aumento do número de habitantes 
da região. De maneira semelhante à taxa de matrículas, a taxa de conclusões para os 
ensinos secundário, profissional e superior são muito pequenas em todas as regiões 
brasileiras. O ensino superior também apresenta crescimento das taxas de conclusão das 
regiões Sul e Sudeste com relação às demais após 19402.  
Comparando a taxa de conclusão à taxa de matrícula é possível ter uma noção da 
magnitude da taxa de evasão escolar no período, principalmente no ensino primário. Isto 
se deve ao fato de que a principal barreira para a continuidade dos estudos se encontrava 
na transição entre o ensino primário e o ensino secundário, de forma que boa parte dos 
                                                          
2 Apresentamos no Apêndice gráficos com o número indivíduos na faixa etária correspondente a cada grau 
de ensino dividido pelo número de escolas deste mesmo grau. 
13 
 
 
 
indivíduos que abandonavam os estudos o faziam ainda no ensino primário (Marcílio, 
2005).  
Figura 5 – Taxas de Conclusão 
a) Ensino Primário b) Ensino Secundário 
  
c) Ensino profissional d) Ensino Superior 
  
Fonte: Os dados de conclusão de curso são provenientes dos Anuários Estatísticos do Brasil de diferentes 
anos (DGE, 1912-1936; IBGE, 1932-1968). Para se chegar a taxa de conclusão, dividimos o número de 
concluintes pelo total da população na faixa etária aproximada de frequência ideal de cada nível escolar 
(Primário: 5 a 14; Secundário: 10 a 19; Profissional: 10 a 19; Superior:20 a 24). 
Os resultados acima descritos podem, em parte, ser explicados pela forma de 
organização e evolução do sistema educacional brasileiro. Inicialmente, antes do século 
XX, o sistema educacional brasileiro evoluiu muito lentamente, principalmente durante 
o período em que o país foi colônia portuguesa. Mesmo em comparação aos demais países 
14 
 
 
 
da América Latina, o Brasil iniciou tardiamente uma expansão do acesso ao ensino básico, 
como fica evidenciado pela baixa média de anos de estudo na Figura 1. Apenas nas 
décadas finais do Império é que se iniciou um lento processo de difusão de escolas 
públicas e aumento do número de alunos matriculados. Surgiu assim a fase chamada de 
“Ilustração brasileira”, em que as preocupações se voltaram às reformas educacionais e 
que tinham como objetivo colocar o país “ao nível do século” (Marcílio, 2005, p. 115). 
Com a Proclamação da República no final do século XIX, inaugurando o período 
conhecido como Primeira República ou República Velha, ocorreram diversas mudanças 
no campo educacional. Em primeiro lugar, a Constituição Republicana de 1891 
estabeleceu que apenas indivíduos alfabetizados tinham direito ao voto, portanto somente 
uma parcela reduzida da população seria considerada apta a votar. Dessa forma, fornecer 
maior acesso à educação passou a ser também uma questão política, uma vez que não 
somente satisfaria as demandas da população, como tornaria possível angariar um maior 
número de eleitores.  
Além disso, a nova Constituição, assim como a anterior (primeira Constituição 
brasileira, de 1824), descentralizava a administração do sistema educacional, tornando-a 
responsabilidade dos estados e municípios. O fato de o governo brasileiro ter delegado a 
administração do ensino aos estados durante boa parte da história educacional é incluído 
como uma das causas para o atraso educacional do país (Colistete, 2016) e para as 
desigualdades regionais, pois os estados não possuíam o mesmo volume de recursos e 
apenas o governo central conseguiria arrecadar os recursos necessários para democratizar 
a educação. Dessa forma, os estados mais desenvolvidos e urbanizados tiveram um 
progresso educacional sensivelmente mais rápido (como é o caso de São Paulo e outros 
estados das regiões Sul e Sudeste, como é possível notar nas Figuras 6 e 7).  
Adicionalmente, o sistema educacional brasileiro pouco evoluiu e as políticas 
educacionais adotadas pelos governantes do período foram, em grande parte, controversas 
e pouco efetivas. Trata-se de um período com diversas reformas educacionais, por vezes 
conflitantes entre si, que levou a uma desorganização ainda maior da educação brasileira. 
O resultado foi um crescimento pífio do número de matriculados e concluintes em quase 
todos os graus de ensino, como é possível constatar nas Figuras 4 e 5. De acordo com 
Kang (2010) isso pode ser explicado pela distribuição altamente desigual de poder 
político no período. Ele argumenta que uma expansão da educação pública significativa 
15 
 
 
 
dependeria de uma maior participação política das classes que mais seriam beneficiadas 
por esta expansão, isto é, os mais pobres. Aumentando a participação política da 
população, através de suspensão das restrições ao voto, os indivíduos teriam maior poder 
para demandar educação pública, de forma que a alfabetização da população, bem como 
a taxa de matrículas se elevaria. Contudo não foi isto o que ocorreu no caso brasileiro, as 
restrições ao voto permaneceram nas décadas iniciais do século XX e a educação evoluiu 
muito pouco, como mencionado acima. Também, é importante ressaltar a diferença na 
causalidade das explicações de Kang (2010) e Marcílio (2005) acerca da influência do 
sistema de representação política da República Velha sobre os resultados educacionais do 
período.       
Apesar dos resultados ruins, houve um pequeno crescimento nas taxas de matrícula 
do ensino primário, resultado das ações dos governos estaduais, como pode ser visto no 
painel a) da Figura 4. Contudo, vale destacar, essa pequena expansão se deu de forma 
muito concentrada, principalmente em regiões mais ricas e urbanizadas ao passo que áreas 
rurais e mais pobres ficaram em segundo plano. Essa alocação desigual de recursos aliada 
à supracitada descentralização administrativa do sistema de ensino e das receitas 
tributárias, promoveram processos de acesso à educação bastante distintos entre as 
regiões brasileiras. 
Após a crise 1929 e seus reflexos para a economia brasileira, o Estado adotou uma 
postura mais intervencionista, especialmente no que diz respeito à educação. Somando-
se a isto à Revolução de 1930, uma nova reforma do ensino foi proposta, com a intenção 
de criar um sistema nacional de ensino. Em 1931 foi criado o Ministério da Educação e 
Saúde, e logo se seguiu a criação da primeira universidade pública, em 1934, localizada 
em São Paulo. A partir daí o número de universidades cresceu lenta e continuamente. No 
que se refere ao ensino secundário a reforma estabeleceu diretrizes mais claras que nas 
décadas anteriores. O ensino profissional também se expandiu no período, estimulado 
pelo processo de substituição de importações, que se intensificaria futuramente. 
Os ensinos de nível secundário e entraram em foco nesse período, o que é 
evidenciado no painel b) da Figura 4 onde a taxa de matrícula no ensino secundário se 
mantém praticamente a mesma entre 1907 e 1932, e a partir de então passa a crescer. 
Mesmo durante a década de 1930 a pequena expansão do ensino secundário era voltada 
principalmente às elites, ao passo que para as classes sociais menos favorecidas surgia 
16 
 
 
 
como opção o ensino médio profissionalizante, representado principalmente pelo ensino 
industrial, o que promovia um processo de segmentação social da educação (Marcílio, 
2005). 
Na década de 1940, com a troca do ministro da Educação, voltam as reformas 
parciais, chamadas de Leis Orgânicas. Essas reformas tangenciavam principalmente o 
ensino primário e secundário e, em alguns casos, cursos do ensino profissional, como é o 
caso das Leis Orgânicas de 1942 e 1946. Estas passaram a reconhecer os cursos Industrial, 
Comercial, Normal e Agrícola como sendo de nível secundário. Seus efeitos podem ser 
notados na Figura 6, onde se registra um grande aumento no número de indivíduos com 
ensino primário e médio entre 1940 e 1950. Ainda, influenciado por propostas internas e 
externas, no período entre 1945 e 1964 o sistema educacional brasileiro passou por 
algumas transformações. Foram criadas campanhas com o intuito de promover a 
alfabetização de adultos, e a expansão do ensino primário e superior. 
3. Dados 
A fim de estimar as estatísticas apresentadas neste artigo, foram combinadas 
diversas fontes históricas. Para estatísticas como taxa de alfabetização ou grau de 
escolaridade da população, utilizamos os Censos Demográficos, divulgados 
aproximadamente a cada dez anos pelo Instituto Brasileiro de Geografia e Estatística 
(IBGE). O primeiro recenseamento nacional ocorreu em 1872, abrangendo todas as 
regiões do território, exceto o atual estado do Acre. 
Também utilizamos os Anuários Estatísticos do Brasil (AEB) também publicados 
pelo IBGE, na época chamado Diretoria Geral de Estatística (DGE). O primeiro AEB foi 
divulgado em 1916, contendo dados para os anos entre 1907-1912. Apenas a partir de 
1936 a publicação passou a ser anual. Os Anuários reúnem uma grande quantidade de 
informações sobre educação, saúde, gasto público, trabalho, política, entre outros temas, 
entretanto, estes dados não são sempre comparáveis. Utilizamos as informações 
disponíveis acerca de matrículas, conclusões de curso e números de instituições de ensino.  
Com o intuito de obter um percentual de indivíduos matriculados no nível escolar 
correspondente a cada faixa etária, cruzamos os dados dos AEBs com as estimativas 
populacionais dos Censos Demográficos. Porém, devido às faixas etárias dos censos não 
serem exatamente compatíveis às de cada nível escolar, foi necessário realizar uma 
aproximação. Assim, para o ensino primário foi considerada a população de cada estado, 
17 
 
 
 
entre 5 e 14 anos. Para o ensino secundário e técnico, o total de pessoas por estado entre 
10 e 19 anos, e para o ensino superior indivíduos entre 20 e 24 anos.  
Para 1930 utilizamos estimativas populacionais feitas pelo DGE, uma vez que nesta 
década não foi realizado Censo Demográfico. Entretanto, estas estimativas eram apenas 
para o total da população de cada estado. Para chegar à população por faixa etária, foi 
feita uma média entre o percentual da população em cada faixa etária por estado dos 
Censos de 1920 e 1940. Em seguida, este resultado foi multiplicado pela população total 
do estado correspondente em 1930. 
Dados de matrículas no ensino primário, secundário e técnico no final do século 
XIX foram obtidas dos Relatórios Anexos ao Ministério dos Negócios do Império, da 
Diretoria Geral de Estatística (Directoria Geral de Estatística, 1875; Secretaria d’Estado 
dos Negocios no Imperio, 1887). 
Utilizamos dados de mortalidade da publicação Estatísticas do Século XX do IBGE 
para o Brasil, sem distinção de regiões. A única exceção é o estado de São Paulo, em que 
há informações mais precisas disponíveis no projeto Memória das Estatísticas 
Demográficas (SEADE, 2010). 
Com esses dados foi possível calcular um Gini educacional para o Brasil como um 
todo e para algumas de suas regiões. A estimação do Gini foi feita com base em 
estimativas da escolaridade da população brasileira ao longo do século XX. O estoque 
inicial, para o ano de 1900, foi calculado com base nos dados de matrículas e conclusões 
dos AEBs e de outros trabalhos e relatórios do DGE, especificados acima. Contamos 
também com dados de estoque populacional por escolaridade nos Censos Demográficos 
de 1940 a 1960.   
4. Metodologia 
A metodologia deste artigo consiste em calcular o índice de Gini agregado com 
estimativas de estoques populacionais por nível de escolaridade ao longo do tempo. A 
principal dificuldade enfrentada é de que não há dados estatísticos ou censitários sobre o 
estoque da população por escolaridade no Brasil ou estado até o Censo Demográfico de 
1940. Até então, a informação sobre a escolaridade disponível era somente de quantos 
sabia ou não ler na população. Por esse motivo, para construir os estoques por 
escolaridade, partimos de estimativas do estoque de pessoas com cada nível de 
escolaridade em 1900 e, usando informações sobre os concluintes de cada nível, 
18 
 
 
 
construímos a série para a primeira metade do século XX. Também, utilizamos a mesma 
metodologia de cálculo do Gini para os dados disponíveis nos censos demográficos de 
1940 a 2000 com o intuito de dar continuidade à série. Fazemos adicionalmente 
estimações separadas para as Unidades da Federação, o que nos permite agregar em 
regiões. 
 
4.1 Metodologia das Estimativas da Distribuição da População por Escolaridade 
em 1900 
Para a estimação do estoque inicial da população por escolaridade em 1900 nós nos 
inspiramos na metodologia de inventário perpétuo descrito por Foldvári e Leeuwen 
(1914) para chegar a valores aproximados da participação relativa dos grupos de 
escolaridade na população de 5 anos ou mais em 1900. Nós trabalhamos com cinco 
categorias de escolaridade: sem escolaridade, ensino primário incompleto, ensino 
primário completo, ensino secundário completo (incluindo o ensino profissional), e 
ensino superior completo.3 
Em linhas gerais, a metodologia consiste em obter a distribuição da população de 
uma determinada faixa etária por grau de ensino em algum período do século XIX, e 
aplicar esses percentuais para a mesma coorte em 1900. Por exemplo, se em 1880 a 
proporção das pessoas com entre 5 e 10 anos de idade matriculadas no primário fosse de 
10%, então supomos que o mesmo percentual das pessoas com entre 25 e 30 anos de 
idade em 1900 possivelmente possuem o ensino primário. Nas estimativas populacionais 
do século XIX, nós consideramos também a população escrava nos cálculos (sem 
nenhuma escolaridade). 
Há duas hipóteses implícitas para a realização dessa estimativa. Em primeiro lugar, 
supomos que todos os matriculados em um grau escolar de uma coorte irão se formar 
(taxa de evasão nula). Essa hipótese será relaxada mais adiante, porém os resultados não 
se alteraram de forma relevante. A segunda hipótese é de que a taxa de mortalidade e 
migração daqueles é homogênea entre pessoas com diferentes graus escolares. Apesar de 
forte, não é possível estimar taxas de mortalidade e migração diferenciadas por grau 
escolar com os dados disponíveis. Somente estudos utilizando dados muito recentes são 
                                                          
3 O ensino primário equivale ao que atualmente é chamado de primeiro ciclo do ensino fundamental. O 
secundário constitui um grau de ensino que compreende o segundo ciclo do ensino fundamental e o ensino 
médio. Para essa análise, consideramos o ensino profissional como parte do ensino médio. 
19 
 
 
 
capazes de realizar esse tipo de estimação de forma precisa, porém nós fizermos um teste 
de robustez com estimativas de mortalidade. 
Para obter as proporções de matriculados por faixas etárias, nós calculamos as 
proporções de crianças e jovens matriculados no primário e no secundário em relação ao 
total de indivíduos nas faixas de idade consideradas adequadas para cada grau. Essa 
estimação foi possível para o início dos anos 1870 (com dados do Recenseamento de 1872 
e dos Relatórios e Trabalhos Estatísticos de 1875) e dos anos 1880 (com dados dos Censos 
de 1872 e 1890, e dos Trabalhos da Seção de Estatística de 1886). Para a década de 1880, 
também foi possível estimar a proporção de adultos matriculados no ensino superior.4 
Com as estimativas de taxas de matrículas em mãos, nós aplicamos essas 
proporções de pessoas com primário completo, secundário completo e ensino superior 
completo para a população de 1900 por estado da seguinte forma. As proporções de 
pessoas com primário completo em 1880 foram aplicadas para as faixas com 10 a 29 anos 
em 1900, enquanto para as coortes mais velhas no mesmo ano, aplicamos as proporções 
de 1870. As proporções de pessoas com secundário completo de 1880 foram aplicadas às 
pessoas entre 15 e 29 anos em 1900, e para os mais velhos, aplicamos as proporções de 
1870. Por fim, as proporções de pessoas com ensino superior foram aplicadas à população 
com 25 anos ou mais em 1900. Como aqueles que fizeram um grau escolar mais elevado 
passaram obrigatoriamente pelos graus mais elementares, nós evitamos que eles fossem 
contados duplamente nos graus escolares anteriores.  
Entre aqueles que não foram designados a algum grau escolar, nós dividimos entre 
aqueles que sabiam ou não ler. O número de analfabetos foi obtido a partir do Censo 
Demográfico de 1900, e esse grupo foi considerado sem escolaridade. Os demais, que 
sabiam ler, porém não se encaixaram em nenhum dos graus escolares completos, foram 
considerados como tendo primário incompleto. 
Como mencionamos anteriormente, é possível relaxar a hipótese de que todos os 
matriculados se formam. Se tivermos a proporção dos concluintes em relação aos 
matriculados, podemos obter uma estimativa mais real do número de formados em um 
grau escolar. Dessa forma, tentamos lidar com o problema aplicando a taxa de conclusão 
aos matriculados, e multiplicando o valor resultante (número de concluintes em um ano) 
pelo tamanho da faixa etária que frequentaria aquele grau escolar.  
                                                          
4 Detalhamos os procedimentos para obtenção dos percentuais de adultos com ensino superior no Apêndice. 
20 
 
 
 
Os primeiros dados de concluintes para todos os níveis de ensino estão disponíveis 
somente a partir da década de 1930. No entanto, como a taxa de conclusão por 
matriculado é relativamente estável entre 1932 e 1949, nós utilizamos essa taxa para 
estimar a proporção de concluintes por faixa etária em 1870 e 1880. Em seguida, 
calculamos novamente as proporções de formados em 1900, como descrito anteriormente. 
Apesar de cada alteração implementada para lidar com um problema diferente gerar 
modificações na distribuição de pessoas por escolaridade, essas distribuições não se 
alteram significativamente. 
 
4.2 Composição Educacional e População ao Longo do Século XX 
Para estimar os estoques populacionais por escolaridade, nós tratamos de forma 
diferenciada os grupos com níveis de ensino completos (primário completo, secundário 
completo e superior completo) das pessoas sem escolaridade ou com primário 
incompleto. Para estimar o número de pessoas com cada nível de ensino completo, 
partimos da estimativa do estoque inicial de 1900 e, iterativamente para cada ano 
subsequente, descontamos os óbitos e somamos o número de concluintes, subtraindo o 
número de concluintes do nível seguinte. Por exemplo, o estoque total de pessoas com 
ensino primário em um determinado ano é calculado como a soma entre o estoque do ano 
anterior e o número de concluintes do ensino primário daquele ano menos os concluintes 
do ensino secundário do mesmo ano. 
Para um grau escolar 𝑗 no ano 𝑡, o estoque populacional será dado por: 
 Pop𝑗𝑡 = Pop𝑗,𝑡−1 × (1 − Mortality Rate𝑗𝑡) + (Concl𝑗𝑡 − Concl𝑗+1,𝑡) (1) 
onde Pop𝑗𝑡 é a população com escolaridade 𝑗 no ano 𝑡, Mortality Rate𝑗𝑡 é a taxa de 
mortalidade e Concl𝑗𝑡 é o número de concluintes no grau 𝑗 no ano 𝑡. 
A disponibilidade de dados de concluintes varia bastante ao longo dos anos, mas 
estão disponíveis para quase todas as Unidades da Federação entre os anos de 1907 a 
1912, 1932 a 1949 e 1951 a 1962. As séries de concluintes para cada nível educacional 
foram interpoladas para os anos em que os AEBs não foram publicados, ou em que estes 
não apresentam essa informação. Assumiu-se que a quantidade de matrículas e as taxas 
de conclusão pouco mudam entre os anos de 1899 e 1908, para os estados em que existe 
informações sobre o número de concluintes em 1908. Para os estados em que não há 
21 
 
 
 
informações do número de concluintes em 1908, fizemos uma interpolação, supondo que 
o número de concluintes de cada nível de ensino era zero em 1899. Dessa forma, é 
possível construir uma série de concluintes de cada nível educacional ininterrupta entre 
1900 e 1960. Dessa forma, é possível prever a composição educacional para todos os anos 
entre 1900 e 1960. Para que as estimativas fossem comparáveis com os censos de 1940 e 
1950, os concluintes dos níveis secundário e profissional foram agrupados para estimar o 
estoque de pessoas com ensino médio.  
Para as pessoas sem escolaridade e o primário incompleto, procedemos da seguinte 
forma. O estoque da população sem escolaridade é dado imediatamente pelo número de 
pessoas que não sabem ler. Essa informação e o dado da população total estão disponíveis 
em todos os Censos Demográficos, desde 1872, para o Brasil como um todo e para as 
Unidades Federativas. Para preencher a população total e as subpopulações nos anos 
intercensitários, foi utilizada uma interpolação linear simples. Dessa forma, só faltaria 
estimar o estoque da população com ensino primário incompleto. Calculamos esse 
estoque como a diferença entre a população total e os demais estoques já estimados. 
Adicionalmente, os óbitos foram calculados a partir das informações sobre a taxa 
de mortalidade. A taxa de mortalidade média do Brasil foi obtida dos Censos 
Demográficos (IBGE, 2007) e assumiu-se que a taxa é a mesma entre todas as Unidades 
da Federação, com exceção de São Paulo, cuja taxa de mortalidade para o período 
analisado é divulgada pela Fundação SEADE (SEADE, 2010).  
É razoável pensar que a taxa de mortalidade varia de acordo com o nível de 
instrução (que é positivamente correlacionado com a renda). Para tentar obter uma taxa 
de mortalidade diferenciada por instrução, utilizamos os dados de alfabetização dos 
indivíduos por faixa etária, disponíveis nos Censos Demográficos de 1940 e 1950, para 
calcular a mortalidade relativa. Consideramos no cálculo indivíduos com 40 anos ou mais, 
uma vez que até esta faixa etária ainda havia uma parcela considerável da população se 
alfabetizando. Para o cálculo, agregamos separadamente indivíduos que sabiam ou não 
ler, com entre 40 e 69 anos no Censo de 1940 e comparamos com os grupos 
correspondentes de indivíduos com entre 50 e 79 anos no Censo de 1950. A taxa é 
calculada dividindo o número de pessoas por faixa etária no período final pelo número de 
pessoas na faixa etária anterior no período inicial. Com isso, obtivemos os resultados 
apresentados na Tabela 2.  
 
22 
 
 
 
Tabela 2 – Taxas de mortalidade decenais 
Comparação
40 a 49/50 a 59 50 a 59/60 a 69 60 a 69/70 a 79 Agregado*
Alfabetizados -21,41% -30,01% -49,72% -28,25%
Analfabetos -24,07% -28,32% -49,10% -29,78%
Total -22,96% -29,00% -49,33% -29,16%  
Fonte: Censos Demográficos/IBGE. Elaboração Própria. Ainda, um ajuste foi feito no período inicial da 
comparação, incluindo nos alfabetizados e subtraindo dos analfabetos, os indivíduos que na data da 
pesquisa estavam frequentando a escola, porém ainda eram analfabetos. 
O diferencial a partir da taxa média de -29,16% é de 0.97 para os alfabetizados e de 1.02 
para os analfabetos. 
 
4.3 Gini Educacional 
Para cada categoria educacional das cinco utilizadas, atribuiu-se a quantidade de 
anos de educação formal equivalente à duração de todos os níveis concluídos pelos 
indivíduos presentes no grupo. Assim, para o ensino primário considerou-se, 4 anos de 
estudo, para o ensino médio, 11 anos de estudo e para o ensino superior 15 anos de estudo. 
Dessa forma, como os anos de educação são constantes para cada grupo, não é possível 
mensurar a dispersão de escolaridade intra-grupo. Para os indivíduos analfabetos optamos 
por atribuir uma quantidade de anos de estudo igual a zero (0 anos). Também, para 
aqueles com o nível primário incompleto, devido à falta de informações no período, 
atribuiu-se um valor ad hoc de 1 ano de estudo formal. 
Por ser uma medida comumente utilizada para medir desigualdade e de fácil 
interpretação, optou-se pelo índice de Gini para medir a desigualdade na distribuição de 
educação. A metodologia usada é uma adaptação da forma usual de cálculo da medida 
(Cowell, 2011). Como as informações existentes sobre o nível de escolaridade para o 
período analisado e nossas estimações de estoque de pessoas por nível de ensino estão 
agregadas, isto é, não temos informações em nível individual, adaptamos a fórmula do 
índice de Gini para a estrutura de nossos dados. A forma de cálculo é muito similar à 
utilizada por Thomas, Wang e Fan (2001). 
O Gini educacional (𝐺) para um determinado ano e região é calculado como a média 
da diferença entre todos os possíveis pares de indivíduos, dividida pela média de anos de 
23 
 
 
 
escolaridade (?̅?). Como há apenas cinco tipos distintos de indivíduos a formula pode ser 
simplificada da seguinte maneira: 
∑5𝑖=1 ∑
5
𝑗=1 𝑄𝑖𝑄𝑗𝑑𝑖𝑗
𝐺 =   
2𝑁2?̅?
Onde 𝑁 é a população com 5 anos ou mais; ?̅? é a média de anos de estudo; 𝑄𝑖 é a 
quantidade de pessoas do grupo 𝑖; de maneira análoga 𝑄𝑗 é a quantidade de pessoas do 
grupo j; e 𝑑𝑖𝑗 é a diferença de anos de estudo entre os grupos 𝑖 e 𝑗. 
5. Resultados 
Em primeiro lugar, a Figura 6 mostra nossa primeira contribuição empírica 
principal, os estoques populacionais por escolaridade estimados para o Brasil a partir dos 
níveis iniciais calculados para o ano de 1900. As linhas representam os níveis estimados 
de pessoas em cada grau escolar (primário, secundário e ensino superior), enquanto os 
pontos mostram os totais obtidos a partir dos Censos Demográficos de 1950 a 1960. 
Figura 6 – Composição Educacional do Brasil 
 
Fonte: Elaboração própria. As linhas representam as estimativas para todo o período e os pontos 
representam os dados observados nos Censos Demográficos (IBGE, 1940-1960). 
Para o ensino primário, maioria da população educada no período, nossa estimativa 
é semelhante aos observado no Censo Demográfico de 1950. Em 1960, subestimamos o 
número de pessoas com esse nível de ensino. Uma possível explicação, entretanto, deve-
24 
 
 
 
se ao fato de que no Censo Demográfico deste ano os indivíduos declararam sua 
escolaridade independentemente da modalidade de ensino que haviam cursado, ao passo 
que os dados utilizados para estimar a população com ensino primário neste período, 
provenientes dos AEBs, não incluíam aqueles que haviam cursado o ensino supletivo, 
restringindo-se apenas aos indivíduos que frequentavam o ensino primário fundamental 
comum. Soma-se a isto o fato de que ao longo da década de 1950 a quantidade de pessoas 
cursando o ensino supletivo elevou-se significativamente, devido às modificações 
introduzidas pela mudança na legislação pós Estado Novo (Kang, 2010). 
Para os outros dois níveis de ensino, nossas estimativas estão mais próximas aos 
níveis observado em 1950 e 1960, o que aumenta nossa confiança sobre elas para a 
primeira metade do século XX. 
Como mostra a Figura 6, a quantidade de pessoas com o primário completo é muito 
superior àquele dos demais níveis educacionais, e apresenta crescimento explosivo a 
partir de 1940. Essa trajetória é consistente com o intuito dos governantes do período, que 
desejavam expandir a educação elementar a partir do início do século. Vale mencionar 
que parte desse crescimento registrado após a década de 1940 pode se relacionar às 
mudanças na legislação ocorridas nesta década, mais especificamente a implementação 
das Leis Orgânicas de 1942 e 1946, que contribuíram para expandir o número de 
matriculados no ensino médio e primário, respectivamente. Somam-se a estas, mudanças 
legislativas, a redemocratização do país após 1945 e o aumento da demanda populacional 
por direitos civis. Por sua vez, na década de 1950 não houve mudanças significativas no 
sistema educacional brasileiro. A despeito do elevado crescimento econômico e do 
ambicioso Plano de Metas do presidente Juscelino Kubistchek, apenas 3,4% dos recursos 
deste seriam destinados à educação. Ainda, o plano priorizou o ensino superior devido ao 
fato deste prover os trabalhadores qualificados que o crescimento econômico e a 
industrialização demandavam. 
Nosso segundo resultado principal é a estimação do índice de Gini educacional 
durante a primeira metade do século XX, para o Brasil e quatro das cinco regiões 
brasileiras, que mostramos na Figura 7. A região Norte foi excluída da análise devido à 
baixa qualidade das informações para o começo do século XX, porém, no cálculo do 
índice para o Brasil, estão incorporadas todas as cinco regiões. Adicionalmente, é 
utilizada a mesma metodologia de agregação em cinco grupos de escolaridade para os 
dados dos Censos de 1950 a 2000, para fins de comparação.  
25 
 
 
 
Figura 7 – Gini Educacional Estimado vs Real 
 
Fonte: Elaboração própria. As linhas para o período entre 1900 e 1960 representam as estimativas do Gini 
educacional feitas a partir da composição educacional anteriormente estimada. Os pontos entre 1950 e 2000 
representam o Gini educacional calculado a partir dos dados dos Censos Demográficos (IBGE, 1950-2000).  
Em primeiro lugar, nossas estimativas chegam a 1950 e 1960 muito próximas aos 
níveis obtidos a partir dos estoques populacionais por educação observados nos dados dos 
Censos Demográficos, o que nos traz confiança sobre os movimentos do indicador na 
primeira metade do século XX. 
Como era esperado, o nível de desigualdade educacional em 1900 é bastante 
elevado e, ao invés de cair com o aumento de indivíduos escolarizados, a desigualdade 
educacional brasileira se mantém praticamente estável em um nível elevado durante boa 
parte da primeira metade do século XX. Esse fato chama bastante a atenção e significa 
que a série de reformas ocorridas durante a República Velha parece não ter contribuído 
para reduzir as desigualdades educacionais na população brasileira. Além disso, nem 
todos os estados acompanharam o período de transição política da República Velha ao 
mesmo passo (Martínez-Fritscher et al., 2010). Enquanto alguns aceitaram mais 
rapidamente o sistema republicano, como é o caso dos estados produtores de café, outros 
mantiveram maior afinidade com a monarquia. Consequentemente, as políticas praticadas 
nessas regiões eram diferentes, com os estados mais receptivos ao novo regime gastando 
26 
 
 
 
mais em educação. Ainda, esses investimentos em educação seriam incentivados por 
fatores como: imigração, industrialização e alterações no sistema político eleitoral. 
É possível que a ênfase no primário tenha tido alguma contribuição para a redução 
do índice a partir de 1920, e as transformações ocorridas durante o período do Estado 
Novo e podem ter gerado efeitos sobre a desigualdade somente na década seguinte. É 
mais provável, no entanto, que as mudanças no acesso ao secundário e ao ensino superior 
a partir da redemocratização após a II Guerra Mundial tenham tido maior impacto. Entre 
1930 e 1964 não houve, nenhuma mudança muito significativa no ritmo de expansão do 
ensino primário (Figura 4, painel (a)), devido à destinação de recursos destinados 
predominantemente ao ensino superior (Kang, 2010). No entanto, como a população 
crescia a taxas elevadas, mesmo com uma proporção fixa da população jovem indo para 
a escola, é possível que o estoque de pessoas com alguma escolaridade tenha aumentado. 
Isso é evidenciado pelo acentuado crescimento da proporção de alfabetizados (Figura 3). 
A partir dos anos 1960, há a promulgação das Leis de Diretrizes e Bases da 
Educação (em 1961 e 1971) que também eliminaram um dos principais pontos de 
estrangulamento do sistema educacional brasileiro, a transição entre ensino primário e 
ginasial (Marcílio, 2005). Com isso, o número de indivíduos com maior escolaridade 
cresce mais rapidamente, fazendo com que o índice de Gini caia de forma mais 
pronunciada. Além disso, examinando as mudanças educacionais do período militar, 
Romanelli (1983 apud Anazawa, 2011) coloca que o principal objetivo do governo era 
aumentar a escolarização da população, independente da qualidade desta educação, e 
assim preparar melhor os indivíduos para o mercado de trabalho. O aumento da demanda 
por educação, como produto da industrialização, aliado ao baixo investimento público, 
levou a uma crise educacional entre 1964 e 1968. A condição econômica do país impediu 
que a oferta de ensino se expandisse. Assim, o acesso à educação ainda era desigualmente 
distribuído, o que implicava numa alta desigualdade de renda, como observado por 
Langoni (1973). 
No painel inferior da Figura 7, mostramos os índices separadamente por região. Em 
1900, as quatro séries estão relativamente próximas entre si (entre 0,73 para a região Sul 
e 0,80 para as demais). A desigualdade interna às regiões tem variação perceptível ao 
longo do tempo. Nas primeiras décadas do século, apenas a região Sul apresenta declínio 
no índice de Gini, enquanto as outras três regiões analisadas e o Brasil apresentam um 
aumento de desigualdade. Notadamente, a região Nordeste mantem-se com a maior 
27 
 
 
 
desigualdade durante todo o período analisado. A região Sul permanece até a o fim da 
década de 1950 com a menor desigualdade, mas a região Sudeste, que tem queda 
expressiva desde a década de 1920, aproxima-se consideravelmente desde meados do 
século. A queda de desigualdade para as regiões Centro-Oeste e Nordeste, entretanto, 
passa a ser expressiva apenas no início da década de 1950. A região Centro-Oeste, que 
até a metade do século estava consideravelmente próxima da região Nordeste, em 2000, 
encontra-se muito mais próxima das regiões Sul e Sudeste em termos de desigualdade 
educacional. Enquanto as regiões Sudeste e Centro-Oeste, obtiveram melhoras na 
distribuição educacional que as aproximaram da região Sul, a região Nordeste manteve-
se afastada das demais regiões permanecendo com a maior desigualdade educacional. 
É possível diferenciar a dinâmica do Sul e Sudeste das demais regiões, e também 
notar que a desigualdade educacional nestes locais sempre foi menor. Diversas 
explicações são apresentadas para este resultado. Rocha, Ferraz e Soares (2015) apontam 
como causa o grande influxo de imigrantes que estas regiões receberam entre o final do 
século XIX e as décadas iniciais do século XX, uma vez que estes imigrantes eram, em 
média, mais escolarizados que os brasileiros, levando assim a um aumento no nível de 
instrução dos locais onde se estabeleciam. Musachio, Martinez e Viarengo (Op. cit.), por 
outro lado, citam a descentralização administrativa do ensino, que além de criar múltiplos 
sistemas de ensino, deixava nas mãos dos estados e municípios os investimentos em 
educação, e dado que o nível de arrecadação dos estados era distinto, também o eram os 
investimentos realizados.  
As diferenças regionais em termos de distribuição de educação refletem 
características de um processo de expansão do acesso à educação que ocorreu de maneira 
distinta entra as regiões brasileiras, mas também é consequência de um processo histórico 
mais amplo e influencia outras características sociais e econômicas dessas regiões. As 
regiões com menor desigualdade educacional no ano 2000, Sul e Sudeste, também são 
aquelas que apresentam os maiores PIBs per capita no mesmo ano, R$7 692 e R$ 8 774 
respectivamente.5 Já a região Centro-oeste que em 2000 apresentava um PIB per capita 
não muito distante de R$ 6 559, por outro lado, tinha a pior desigualdade de renda6. 
                                                          
5 Contas Regionais do Brasil 1997 - 2000: Produto Interno Bruto per capita do Brasil, 
por Grandes Regiões e Unidades da Federação. IBGE. Consultado em 08 de novembro de 2016. 
6 Censo Demográfico - 2000 - Resultados da Amostra. Tabela 2.7.12. Disponível em: 
http://www.ibge.gov.br/home/estatistica/populacao/censo2000/primeiros_resultados_amostra/tabela_regi
oes.shtm. Consultado em 21/11/2016. 
28 
 
 
 
Os gráficos a seguir servem como uma base para verificação e comparação dos 
resultados das nossas estimativas do índice de Gini educacional. Através dessas 
comparações, notamos que nossas estimativas estão bastante próximas daquelas obtidas 
a partir de microdados, bem como a tendência de redução da desigualdade educacional, 
especialmente a partir da década de 1950, se confirma quando observamos cada coorte 
individualmente. A Figura 8 apresenta a comparação entre o cálculo do índice de Gini 
usando a metodologia de agregação por níveis educacionais (i.e. sem variação intra-
grupo) e o cálculo utilizando dados em nível individual. Ambas as séries fazem uso dos 
dados do Censo Demográfico, porém apenas a partir de 1960 é possível utilizar micro 
dados. A estimação com dados agregados situa-se acima daquela de nível individual em 
todos os anos. Como para definir os 5 grupos de nível de ensino foi considerado apenas 
o último nível concluído por cada indivíduo, ao desconsiderar a variação intra-grupos, a 
agregação provavelmente subestima os anos de estudo da parcela educada da população 
e superestima o índice. No entanto, é possível observar que as tendências de longo prazo 
das duas séries são muito semelhantes, o que nos dá maior confiança sobre as séries 
estimadas para a primeira metade do século XX. 
  
29 
 
 
 
Figura 8 – Gini Educacional Microdados vs Agregados 
 
Fonte: Censos Demográficos/IBGE. Elaboração própria. 
É possível perceber, entretanto, que a diferença é menor nos anos de 1960 e 1970. 
Dado que a proporção de pessoas com educação formal aumenta ao longo do tempo, a 
diferença entre as duas séries tende a aumentar com o passar do tempo. Assim, a 
superestimação do índice tende a ser menos expressiva do começo à metade do século, 
período de interesse dessa análise. 
A Figura 9 mostra uma forma alternativa de se estimar a evolução do índice de Gini 
educacional, separando os dados por coorte de nascimento de 1900 a 1990, observados 
nos microdados dos Censos a partir de 1960. Podemos observar que os valores do índice 
se reduzem continuamente a cada nova coorte, o que contrasta com a estabilidade inicial 
do índice de Gini educacional para todo o estoque populacional até 1940 (como visto na 
Figura 7). Essas diferenças podem ser explicadas por dois fatores. Em primeiro lugar, 
com a expansão do sistema de ensino ao longo do tempo, a tendência de redução da 
desigualdade educacional significa que a cada geração, mais indivíduos foram 
incorporados ao sistema educacional, de modo a torna-los mais homogêneos entre si em 
termos de escolaridade. Apesar dessas mudanças nas coortes de nascimento, as 
transformações ocorridas para o estoque populacional são mais lentas, uma vez que, a 
cada instante, há várias coortes coexistindo, e cada coorte corresponde a apenas uma 
pequena parcela da população total, com diferentes níveis de desigualdade educacional. 
O segundo fator seria uma seleção possivelmente diferenciada por escolaridade ao 
longo do tempo (devido às diferenças das taxas de mortalidade), de forma que somente 
30 
 
 
 
os mais escolarizados sobrevivem até as idades mais avançadas e são abrangidos pelos 
Censos a partir de 1960. No entanto, e possível notar que as linhas não se distanciam 
muito umas das outras, o que significa que essa seleção é pequena em comparação com a 
variação entre as coortes. 
Dessa forma, nossa metodologia nos permite chegar a estimativas mais adequadas, 
uma vez que com ela conseguimos estimar o índice de Gini para todas as coortes em um 
dado instante, e não incorremos no viés de seleção devido à diferenciação das taxas de 
mortalidade por nível de escolaridade. 
Figura 9 – Gini Educacional por Coortes de Nascimento 
 
Fonte: Dados dos Censos Demográficos (IBGE, 1960-2000). Cada uma das linhas representa um Censo 
Demográfico, e os pontos representam o Gini Educacional calculado para aquela coorte naquele Censo 
Demográfico.  
Por fim, realizamos uma comparação dos nossos resultados com aquele de Van 
Leeuwen e Van Leeuwen-Li (2015) para o Brasil, mostrada na Figura 10. A partir de um 
ponto inicial muito semelhante em 1900, fica claro que, em contraste com nossa 
estimativa, o Gini educacional calculado pelos autores decresce sistematicamente desde 
o início do século XX. A partir de 1950, quando já é possível realizar diretamente 
estimativas de estoques educacionais, as tendências das duas séries se igualam. Conforme 
já argumentamos, no início do século, o estoque que fazia maior diferença para a 
desigualdade educacional era de analfabetos.  
  
31 
 
 
 
Figura 10 – Comparação de Gini Educacional por Coortes de Nascimento 
 
Fonte: Van Leeuwen e Van Leeuwen-Li (2015); Censos Demográficos; AEB. Elaboração própria. A linha 
para o período entre 1900 e 1960 representam as estimativas do Gini educacional feitas a partir da 
composição educacional anteriormente estimada. Os pontos entre 1950 e 2000 representam o Gini 
educacional calculado a partir dos dados dos Censos Demográficos (IBGE, 1950-2000). 
 
6. Conclusões 
Este artigo tem o intuito de contribuir para o debate acerca dos determinantes da 
elevada desigualdade social observada no país. Apesar da recente tendência de queda da 
desigualdade de renda, o Brasil ainda é um dos países mais desiguais do mundo, e parte 
dessa situação parece ser resultado do processo diferenciado de expansão educacional nas 
regiões brasileiras. Para verificar essa hipótese, construímos séries de um índice de Gini 
educacional desde o início do século XX para o Brasil e as regiões analisados. 
Nossos resultados indicam que a desigualdade educacional era bastante elevada em 
1900. De acordo com as nossas estimativas, naquele ano a grande maioria da população 
brasileira com mais de 5 anos era composta por analfabetos (68,7%) ou por pessoas sem 
o primário completo (25%), o que gera um índice de Gini de 0,78. O sistema educacional, 
em geral, pouco acessível à população também contribuiu para a manutenção da 
desigualdade, de modo que a geração nascida entre 1900 e 1910 manteve uma 
desigualdade relativamente elevada (com índice de Gini de 0,69 em 1960). 
Entre 1900 e 1920 a desigualdade educacional brasileira aumentou: consequência 
de um sistema educacional em expansão, mas ainda bastante restrito. Ao longo das 
décadas, no entanto, as novas gerações tornaram-se cada vez menos desiguais, o que é 
medido pelo declínio sistemático do Gini educacional. Para os nascidos na década de 
32 
 
 
 
1980 o índice é próximo de 0,3, tendo como referência o censo de 2000. Esse movimento 
foi concretizado pelo aumento de matrículas inicialmente no ensino primário, e 
posteriormente no secundário e superior, uma vez que no começo do século a grande 
maioria da população tinha escolaridade muito próxima de zero. Dessa forma, a redução 
da desigualdade educacional coincide com um aumento do nível médio de escolaridade. 
A introdução sucessiva das novas gerações mais educadas no estoque foi reduzindo a 
disparidade geral de educação, resultando em um movimento de redução da desigualdade 
no total da população entre 1920 e 2000. 
No início do século XX, a desigualdade educacional era semelhante nas regiões 
brasileiras, com um índice de Gini entre 0,73 e 0,81. Ao longo do século, ordenação 
dessas regiões em termos de desigualdade educacional não mudou, mas a diferença entre 
as regiões aumentou sensivelmente, em 2000, as regiões com maior e menor desigualdade 
educacional, a região Nordeste 0,59 e a região Sudeste, tinham índices de 0,59 e 0,43 
respectivamente 
O acesso ao sistema de ensino e a distribuição de educação não somente são reflexos 
de um processo histórico de desenvolvimento, mas têm influência expressiva sobre esse 
mesmo processo. A região nordeste apresenta no fim do século a pior distribuição de 
educação é também aquela com pior distribuição de renda de PIB per capta7. Em 
contrapartida, a região sul, que durante a maior parte da série analisada permaneceu com 
a menor desigualdade de educação, no final do século figura com as primeiras colocações 
em distribuição de renda e PIB per capta8. Distinguir esses efeitos é uma tarefa que vai 
além do escopo deste trabalho, mas fica nítido que há relação entre esses indicadores. 
Essa evolução apresentada da desigualdade escolar ajuda a esclarecer, em parte, a 
desigualdade social entre as regiões. O aumento da escolaridade, associado à redução da 
desigualdade, parece ter um papel relevante para explicar as diferenças de renda 
observadas ao longo do século XX e que ainda persistem atualmente. 
 
                                                          
7 Instituto de Pesquisa Econômica Aplicada (IPEA). http://www.ipeadata.gov.br/ Consultado em 21 de 
setembro de 2016. 
8 Instituto de Pesquisa Econômica Aplicada (IPEA). http://www.ipeadata.gov.br/ Consultado em 21 de 
setembro de 2016. 
33 
 
 
 
7. Referências Bibliográficas 
ACEMOGLU, D.; JOHNSON, S.; ROBINSON, J. A. The Colonial Origins of 
Comparative Development: An Empirical Investigation. American Economic 
Association, v. 91, n. 5, p. 1369-1401, dez. 2001. 
BARROS, A. R. Desigualdades Regionais no Brasil: Natureza, causas, origens e 
soluções. Rio de Janeiro: Elsevier, 2011, 336 p. 
CAMPS, E.; ENGERMAN, S. L. The Impact of Race and Inequality on Human Capital 
Formation in Latin America During the Nineteenth and Twentieth Centuries. Economics 
Working Papers 1436, Departament of Economics and Business, Universitat Pompeu 
Fabra, 2014. 
CENTRAL INTELLIGENCE AGENCY (CIA). The World Factbook 2013-14. 
Washington, DC: Central Intelligence Agency, 2013. 
COWELL, F. A. Measuring Inequality. Oxford University Press, 2009, 236 p.  
DABLA-NORRIS, E.; KOCHHAR, K.; RICKA, F.; SUPHAPHIPHAT, N.; TSOUNTA, 
E. Causes and Consequences of Income Inequality: A Global Perspective. International 
Monetary Fund (Discussion Note), jun. 2015.  
DE FERRENTI, D.; PERRY, G. E.; FERREIRA, F. H. G.; WALTON, M. Inequality in 
Latin America: Breaking with History?. World Bank Latin American and Caribbean 
Studies; Washington, DC: World Bank, 2004.  
DIRECTORIA GERAL DE ESTATISTICA. Relatorio Annexo ao do Miniterio dos 
Negocios do Imperio, de 1875. Rio de Janeiro: Typographia de Pinto, Brandão e Comp., 
1875. 
DIRETORIA GERAL DE ESTATÍSTICA. Anuário Estatístico do Brasil. Rio de 
Janeiro: IBGE, 1912-1936.  
ENGERMAN, S. L.; SOKOLOFF, K. L. Factor Endowments, Institutions, and 
Differential Paths of Growth Among New World Economies: A View from Economic 
Historians of the United States. National Bureau of Economic Research, n. 66, dez. 
1994. 
34 
 
 
 
FERRARI, M. A migração nordestina para São Paulo no segundo governo Vargas 
(1951-1954) - seca e desigualdades regionais. 2005. 160p. Dissertação de Mestrado – 
Universidade Federal de São Carlos. São Carlos, 2005. 
FOLDVARI, P.; LEEUWEN, B. Educational and Income Inequality in Europe, ca. 1870-
2000. Cliometrica, v. 8, p. 271-300, 2014.  
FRANKEMA, E. The Expansion of Mass Education in Twentieth Century Latin 
America: a Global Comparative Perspective. Journal of Iberian and Latin American 
Economic History, v. 27, n. 3, p. 359-395, 2009. 
FUNDAÇÃO SISTEMA ESTADUAL DE ANÁLISE DE DADOS (SEADE). Memória 
das Estatísticas Demográficas. Disponível em: 
<http://produtos.seade.gov.br/produtos/500anos/index.php?tip=prir>. Acesso em julho 
de 2016. 
FURTADO, C. Formação Econômica do Brasil. 32. ed. São Paulo: Companhia Editora 
Nacional, 2005. 
IBGE. Anuário Estatístico do Brasil. Rio de Janeiro: IBGE, 1938-1962.  
______. Estatísticas do Século XX. Rio de Janeiro: IBGE, 2007. 
______. Trabalho e Rendimento Educação e Deslocamento. Rio de Janeiro: IBGE, 
2012.  
INSTITUTO NACIONAL DE ESTATISTICA. Anuário Estatístico do Brasil. Rio de 
Janeiro: Tip do Departamento de Estatística de Publicidade, 1936-1937. 
KANG, T. H. Instituições, Voz Política e Atraso Educacional no Brasil 1930-1964. 
2010. 182 p. Dissertação (Mestrado em Economia) – IPE-USP, São Paulo. 2010. 
LAM, D.; LEVISON, D. Declining Inequality in Schooling in Brazil and its Effects on 
Inequality in Earnings. Journal of Development Economics, v. 37, p. 199-225, 1992. 
LAM, D.; LEIBBRANDT, M.; FINN, A. Schooling Inequality, Returns to Schooling, 
and Earnings Inequality: Evidence from Brazil and South Africa. 10th IZA/World 
Bank Conference on Employment, Bonn, Germany, 2015. 
and Development 
LANGONI, C. A Distribuição de Renda e Desenvolvimento Econômico no Brasil. 
Rio de Janeiro: Editora Expressão e Cultura, 1973. 
35 
 
 
 
LEE, Jong-Wha; LEE, Hanol. Human capital in the long run. Journal of Development 
Economics, v. 122, p. 147-169, 2016. 
LEEUWEN, B. V.; LEEUWEN-LI, J. V.; FOLDVARI, P. Average Years of Education 
(Average, total Population 15 years and older), 1850-2010. Disponível em: 
<https://www.clio-infra.eu/>. Acesso em julho de 2016. 
LEFF, N. H. Desenvolvimento Econômico e Desigualdade Regional: origens do caso 
brasileiro. Revista Brasileira de Economia, vol. 26, n. 1, 1972. 
LOREL, B. Assessing Brazilian Educational Inequalities. Revista Brasileira de 
Economia, v. 62, n. 1, p. 32-65, 2008. 
LUSTIG, N.; LOPEZ-CALVA, L. F.; ORTIZ-JUAREZ, E. Declining Inequality in Latin 
America in the 2000s: The Cases of Argentina, Brazil, and Mexico. World Development, 
v. 44, p. 129-141, 2003. 
MARCÍLIO, M. L. História da Escola em São Paulo e no Brasil. São Paulo: Imprensa 
Oficial do Estado de São Paulo: Instituto Fernand Braudel, 2005. 485 p. 
MINISTÉRIO DA AGRICULTURA, INDUSTRIA E COMMERCIO. DIRECTORIA 
GERAL DE ESTATISTICA. Annuario Estatistico do Brazil – 1º Anno (1908-1912). 
Rio de Janeiro: Typographia, vol. 1, 1916. 
MUSACHIO, A.; MARTINEZ, A.; VIARENGO, M. Colonial Institutions, Commodity 
Boom, and the Diffusion of Elementary Education in Brazil, 1889-1930. National 
Bureau of Economic Research (NBER Working Paper n. 20029), jan. 2015. Disponível 
em: <http://www.nber.org/papers/w20029>. Acesso em maio de 2016. 
OCDE. Fomentando o Crescimento Inclusivo da Produtividade na América Latina. Paris: 
(Série Melhores Políticas), 2014, p. 19. 
REIS, J. G. A.; BARROS, R. P. de. Wage Inequality and the Distribution of Education: 
a study of the evolution of the regional differences in inequality metropolitan Brazil. 
Journal of Development Economics, n. 36, p. 117-143, 1991. 
ROCHA, R.; FERRAZ, C.; SOARES, R. R. Human Capital Persistence and 
Development. The Institute for the Study of Labor (Discussion Paper n. 9101), jun. 
2015. Disponível em: < http://ftp.iza.org/dp9101.pdf>. Acesso em maio de 2016. 
36 
 
 
 
SECRETARIA D’ESTADO DOS NEGOCIOS DO IMPERIO. 3ª DIRECTORIA. 
SECÇÃO DE ESTATÍSTICA. Trabalhos da Secção de Estatística Anexxa a 3ª 
Directoria da Secretaria d’Estado dos Negocios do Imperio, Anno de 1886. Rio de 
Janeiro: Imprensa Nacional, 1887. 
SIMONSEN, R. História Econômica do Brasil. 4. Ed. Brasília: Edições do Senado 
Federal, 2005.  
THOMAS V, WANG Y, FAN X. Measuring education inequality: Gini coefficients of 
education. World Bank Publications. 2001. 
TSOUNTA, E.; OSUEKE, A. I. What is Behind Latin America’s Declining Income 
Inequality?. IMF Working Paper, WP/14/124, 2014. 
U. S. Census Bureau. A Half-Century of Learning: Historical Census Statistics on 
Educational Attainment in the United States, 1940 to 2000. Disponível em: 
<https://www.census.gov/hhes/socdemo/education/data/census/half-
century/files/US.pdf>. Acesso em: abr. 2016. 
VAN LEEUWEN, B.; VAN LEEUWEN-LI, J. Educational Inequality Gini 
Coefficient, http://hdl.handle.net/10622/KORKQW, IISH Dataverse, V1, 2015. 
WILLIAMSON, J. Latin America Inequality: Colonial Origins, Commodity Booms, or a 
Missed 20th Century Leveling? National Bureau of Economic Research (NBER 
Working Paper n. 20915), jan. 2015. Disponível em: 
<http://www.nber.org/papers/w20915>. Acesso em maio de 2016. 
  
37 
 
 
 
Apêndice I 
 Ao longo do artigo utilizamos as estimativas populacionais do IBGE por faixa de 
idade em diversos momentos para nossas próprias estimativas de composição educacional 
e índice de Gini, portanto, convém apresentar a evolução dessas estimativas. Como é 
possível notar na figura abaixo, em todas as faixas observadas a população evolui 
rapidamente, em especial após a década de 1950. Utilizamos a população de 5 anos ou 
mais para calcular nossas estimativas de composição educacional, e a população de 10 ou 
mais apenas para compatibilizar com os dados dos Censos demográficos de 1940 a 1960.   
 
Figura I – Evolução demográfica por faixa etária 
 
Fonte: Anuários Estatísticos do Brasil (vários anos) e Censos Demográficos (1940 a 2000). Elaboração 
própria   
  
Apêndice II 
 De forma a possibilitar uma análise um pouco mais detalhada da evolução do 
sistema educacional brasileiro ao longo da primeira metade do século XX, apresentamos 
também o número de indivíduos na faixa etária ideal (aproximada) para cada grau de 
ensino divido pelo número de escolas deste mesmo grau, bem como pelo número de 
docentes. Como podemos perceber nas figuras abaixo, a tendência que se observa 
corrobora os dados apresentados na sessão de resultados, isto é, as regiões Sul e Sudeste 
aparecem na grande maioria das vezes como aquelas regiões onde o número de indivíduos 
38 
 
 
 
por escolas e por docentes é menor. Isso possivelmente indica que, o grau de 
investimentos em educação nestas duas regiões era mais alto do que no restante do país. 
Ademais é importante pontuar que no Ensino Primário os dados para o ano de 1960 tem 
uma pequena diferença em relação aos demais anos.   
Figura II Anexo – População por faixa etária ideal e número de escolas   
a) Ensino Primário b) Ensino Secundário 
  
c) Ensino Profissional d) Ensino Superior 
  
Fonte: Censos Demográficos; Anuários Estatísticos. Elaboração própria. 
 
 
Figura III Anexo – População por faixa etária ideal e número de docentes 
39 
 
 
 
a) Ensino Primário b) Ensino Secundário 
  
c) Ensino Profissional d) Ensino Superior 
  
Fonte: Censos Demográficos; Anuários Estatísticos. Elaboração própria. 
  
40 
 
 
 
Apêndice III – Detalhamento sobre Dados de Ensino Superior 
Exceto para três escolas de nível superior, não conseguimos encontrar dados de 
matrículas nesse nível de ensino para o século XIX. Na ausência dessas informações, nós 
procedemos de duas formas diferentes (que, no entanto, levaram a resultados 
semelhantes). Em primeiro lugar, os AEBs fornecem dados de matrículas no ensino 
superior em 1907 (AEB de 1953) por estado e, além disso, o número de escolas de nível 
superior no final do século XIX é conhecido (Anísio Teixeira, 1989). Com essas duas 
informações, tentamos aproximar o número de matriculados existentes em 1890, supondo 
que em 1907 as escolas possuíam número semelhante de alunos entre si. Dessa forma, 
nós ajustamos o número de alunos de 1907 às escolas existentes em 1890, supondo 
adicionalmente que não houve crescimento relevante do número de vagas por instituição. 
Apesar de se tratar de uma aproximação, a comparação com os dados para as três escolas 
disponíveis mostra que os números calculados não estão muito longe da realidade. A 
partir desses números, nós então calculamos o número de matrículas como proporções da 
população entre 20 e 24 anos. 
Uma crítica que poderia ser feita ao método anterior seria de que nós não temos 
estimativas de migração dos graduados entre os estados, de modo que só conseguiríamos 
realizar estimativas nos estados com alguma escola de nível superior. Não é possível 
conhecer a priori a direção do viés devido a esse método em todos os estados, uma vez 
que é possível que estados sem escolas de nível superior tenham graduados que migraram 
para lá, e estados com escolas de nível superior também pode atrair graduados de outros 
estados. Na tentativa de lidar com esse problema, tentamos obter uma estimativa do 
estoque de pessoas com nível superior a partir das informações de profissão do Censo de 
1872. Para isso, consideramos que todas as pessoas que exerciam algumas profissões 
liberais eram formadas no nível superior. A partir dessas informações, obtivemos a 
proporção de pessoas com ensino superior na população. 
No caso da estimativa de formados no ensino superior a partir do Censo de 1872, 
nós aplicamos a proporção obtida à população com 25 anos ou mais em 1900 e, em 
seguida, aplicamos as demais proporções ao restante da população sem o ensino superior. 
41