top of page

Linguagem comparada #9: O protoindo-europeu

Este texto é uma tradução autorizada e adaptada da resposta de Oscar Tay à pergunta "How do we know that a Proto-Indo-European language really existed? What is the evidence?". Os "NT" são notas do tradutor.

Autor: Oscar Tay.

Tradutor: Nícolas Teixeira Cabral.

Como sabemos que a língua protoindo-europeia realmente existiu? Qual é a evidência?

Sir William Jones era um advogado e poliglota britânico, e falava mais de 30 idiomas em diferentes níveis quando morreu, em 1794, incluindo línguas clássicas como latim e grego antigo.

Na época, acreditava-se que os idiomas eram parecidos entre si simplesmente por conta de empréstimos linguísticos, e.g. o vocabulário inglês altamente derivado do latim, ou porque eles tinham uma raiz comum, e.g. as línguas latinas e o latim. Essa ideia parecia boa: linguagens mais próximas eram parecidas porque pegavam muitas palavras umas das outras, e linguagens mais distantes eram diferentes porque não havia tanto dessa troca.

Sir William também acreditava nisso; fazia sentido, né? Ele continuou acreditando nessa teoria até ser mandado para a Índia em 1783, então sob domínio britânico.

O sânscrito na Índia tinha um propósito similar ao do latim na Europa medieval: poucos o haviam como primeira língua, mas ele ainda era utilizado para fins religiosos e legais. Também assim como o latim, era a forma padrão de uma linguagem antiga que dera origem a uma grande família linguística amplamente difundida; as línguas latinas, no caso do latim, e as línguas indo-arianas, no caso do sânscrito.

Árvore da família das línguas latinas. Idiomas em vermelho não são mais falados.

Árvore da família das línguas indo-arianas.

Se você quisesse ler as leis na Índia, você precisaria de algum conhecimento em sânscrito. Jones topou o desafio; é só mais uma língua, afinal, e ele sabia dezenas. Ele criou uma Sociedade Asiática em Calcutá e iniciou os estudos.

Ele começou a notar que algumas coisas em sânscrito pareciam curiosamente familiares. A palavra para "mãe" em latim é "mater", e em sânscrito é "mātr". Coincidências acontecem o tempo todo entre línguas: "namae" em japonês é "nome" e "dog" em barbaram (língua de uma tribo aborígene da Austrália) é "cachorro" (como em inglês, "dog"), mas nenhum deles está relacionado aos outros.

Porém, "pai" em sânscrito é "pitr", bem parecido com o "pater" do latim; "homem" em latim é "vir" e, em sânscrito, "vira", também bem similares.

A ideia dos "empréstimos" não poderia explicar isso; a Europa não havia tido contato próximo o bastante ou longo o bastante para explicar todas as similaridades entre o sânscrito e as línguas europeias clássicas. Havia algo muito, muito estranho acontecendo ali.

Francês e espanhol são "parentes", pois ambas vêm do latim. Híndi e marata são "parentes", pois ambas vêm do sânscrito. Talvez, não mais que talvez, poderia haver alguma similaridade entre o latim e o sânscrito, além dos papéis semelhantes que cumpriam em seus continentes.

Em 1783, no mesmo ano em que chegou, Jones deu uma palestra na Sociedade Asiática sobre história híndi. A parte mais famosa é a seguinte:

O idioma sânscrito, qualquer que seja sua antiguidade, é de uma estrutura maravilhosa; mais perfeito que o grego, mais copioso que o latim, e mais primorosamente refinado que ambos; ainda assim, ele guarda com os dois uma relação mais forte do que poderia ser por acidente, tanto nos radicais dos verbos quanto na forma da gramática; tão forte, de fato, que nenhum filólogo poderia examinar os três sem pensar que os três teriam surgido de uma fonte comum que quiçá não mais existe.

E assim nasceu a linguística.

Jones não foi a primeira pessoa a ter essa ideia; mercadores haviam notado as similaridades séculos antes. Porém, foram as ideias de Sir William que conseguiram acender a faísca.

Um frenesi filológico se iniciou. Rápido! Quais línguas são parte dessa família? Quais não são? Como diferenciá-las? Precisamos de respostas! Elas não vieram, porém, nas décadas seguintes. Até que apareceu Grimm, que criou a lei de Grimm.

Quando eu conto essa história pessoalmente, alguém sempre pergunta nessa hora: "ele tinha um irmão?". Geralmente, eles estão brincando: "haha, o mesmo nome dos irmãos Grimm, que engraçado" etc.

O mais engraçado é que sim, Jacob Grimm, o maior contribuidor para o método comparativo em linguística, realmente tinha um irmão, chamado Wilhelm. Juntos, eles viajaram pela Alemanha colecionando contos de fadas.

Kinder- und Hausmärchen, os contos dos irmãos Grimm, no alemão original.

Contudo, os irmãos Grimm fizeram muito mais que publicar os Contos de Grimm. Eles também coiniciaram o Deutsches Wörterbuch, que é constantemente atualizado desde então e é o maior dicionário alemão atualmente. Jacob também escreveu uma coleção de mitologia germânica.

Sua criação mais famosa foi majoritariamente obra de Wilhelm. Enquanto seu irmão mais novo saiu coletando estórias – não inventando, mas coletando estórias que os pais contavam a seus filhos para entretê-los ou, mais frequentemente, assustá-los o bastante para não entrarem nas florestas à noite; os irmãos Grimm até editaram alguns contos para fazê-los menos violentos – Jacob estava fazendo algo muito mais nerd e menos importante para a cultura popular: folheando montes e montes de dicionários.

Ele não queria aumentar seu vocabulário islandês, mas procurando por padrões entre os idiomas, particularmente entre o alemão e os idiomas que ele achou que seriam relacionados a ele.

Aqui está um pouco do que ele encontraria:

Alemão: Vater (pronúncia: "fater");

Inglês: father;

Holandês: vader (pronúncia: "fader");

Sueco: fader;

Latim: pater;

Grego antigo: pater;

Sânscrito: pitr;

Persa: pedar.

Todas as palavras começavam com "p", com exceção de algumas línguas do norte europeu, que começavam com "f". Isso não era coincidência. Veja as palavras para "pé":

Alemão: Fuß;

Inglês: foot;

Holandês: voet;

Dinamarquês: fod;

Sueco: fot;

Grego antigo: poús, podós;

Latim: pēs, pedis;

Sânscrito: pāda;

Letão: pēda.

De novo, o mesmo padrão: esses idiomas têm "f" onde outros têm "p". Outros padrões existiam, e.g. "h" onde outros tinham "k" ("hound" e "cão" [NT: ou "heart" e "kardia"]) ou "th" onde outros tinham "t" ("thou" e "tu"). Essas mudanças fonéticas são atualmente conhecidas como lei de Grimm, ainda que não sejam universais e ainda que Verner tenha lhes complementado depois.

Em alfabeto fonético internacional, a lei de Grimm é algo assim:

bʰ > b > p > ɸ

dʰ > d > t > θ

gʰ > g > k > x

gʷʰ > gʷ > kʷ > xʷ

Ou, em uma forma menos técnica (e menos acurada):

bh > b > p > f

dh > d > t > th

gh > g > k > kh

gwh > gw > kw > khw

Grimm estabeleceu padrões de mudança fonética compartilhados por certos idiomas, o que significava que eles haveriam de ter vindo de uma língua mãe única, que teria vindo de uma língua ainda mais antiga.

Assim, ele foi o pioneiro do método comparativo. Agora havia um jeito de saber não apenas quais idiomas pertenciam àquela família, mas até quão próximos eram uns dos outros, baseado em quais mudanças fonéticas eles tinham em comum.

Deduziu-se que o alemão, inglês, holandês, as línguas escandinavas e o islandês, entre outras, pertenceriam à família das línguas germânicas.

Árvore da família das línguas germânicas.

Como os idiomas dessa família eram falados principalmente na Índia e na Europa, o nome "indo-europeu" foi escolhido, e a língua mãe foi chamada "protoindo-europeu".

É fácil entender, mesmo para quem nunca estudou história linguística. Um exemplo de como funciona: pegue as palavras germânicas para "cão": "dog" em inglês, mas também "hound", "Hund" em alemão, "hond" em holandês, "hund" em sueco. É uma aposta segura dizer que a palavra protogermânica para "cão" era algo parecido com "hund".

Mas não podemos parar por aí: precisamos das terminações que marcam os casos. [NT: caso gramatical é mudança morfológica de um substantivo (ou adjetivo) de acordo com sua função na oração. Já falamos disso aqui e aqui. Por exemplo, "cozinheiro" em latim pode ser "coquus", se for o sujeito da oração, ou "coquum", se for objeto direto etc.].

Uma fonte muito importante para a reconstrução do protogermânico é uma língua antiga, já extinta: o gótico. Há duas razões principais para sua importância: a primeira é que ela não passou por muitas das mudanças que vemos em outras línguas germânicas; a segunda, mais importante, é que temos fragmentos de uma bíblia cristã em gótico, centenas de anos mais antiga que qualquer outra coisa escrita em língua germânica.

Uma página da bíblia gótica.

Em gótico, substantivos nominativos singulares masculinos muito frequentemente terminam em -s. As línguas germânicas modernas abandonaram o sistema de sufixos de casos gramaticais, com a exceção do islandês, cujo nominativo singular masculino termina em -r. Esses sufixos de casos são relacionados: os idiomas germânicos passaram por uma mudança fonética chamada rotacismo, em que um /s/ ou /z/ vira um /r/. Só que o gótico abandonou o barco antes disso, e ainda tem o final -s.

Muitos outros substantivos nominativos singulares masculinos antigos terminavam em -(vogal)s, e.g. -us no latim e -os no grego. Você poderia imaginar, portanto, que o protogermânico teria algo parecido. E você estaria certo: muitas palavras terminavam em -iz, -az ou -uz.

O protogermânico para "cão" era provavelmente *hundaz. O asterisco serve para você saber que é uma palavra reconstruída.

E quanto ao radical protoindo-europeu (PIE)? Bem, nós temos "canis" em latim, "κύων" ("kyon") em grego, "ci" em galês, com plural "cwn", "qen" em albaniano, entre outros. *Hundaz se encaixa bem aqui também, se lembrarmos da parte do "k > h" da lei de Grimm.

Seguindo passos similares, ainda que mais complexos, chegamos à palavra PIE reconstruída, que é algo como *kwon. Nós não sabemos como era com certeza, e há reconstruções alternativas do PIE, mas a evidência sugere que seja algo parecido com isso.

Podemos usar certas pistas linguísticas, e.g. que o PIE tinha palavras para "mel" (*médʰu) e “faia” (*bʰehgos), para imaginar onde elas foram faladas. No caso, a leste da Ucrânia, 8000 anos atrás.

Então, sabemos que o PIE existiu porque algumas palavras eram similares em algumas línguas e nós podemos compará-las para descobrir como a língua original era.

Por que não reconstruir ainda além disso, e tentar agrupar ainda mais famílias? Pessoas tentaram, e até hoje falharam.

Se você fosse comparar as palavras para "eu" em línguas indo-europeias modernas, você teria "I", "ich", "ik", "io", "je", "ya", "eu", "main" e "man", só para citar algumas. Tente reconstruir o PIE com base nisso, e não será muito acurado.

Mas se você voltar ao passado, verá que a palavra em latim era "ego", a palavra em grego antigo era praticamente idêntica, em nórdico antigo era "eg", em inglês antigo era "ic", em protogermânico provavelmente *ek, em sânscrito, "aham", em hitita, "ūg" etc. Usando o método comparativo, o radical PIE provavelmente era algo como *eg ou *ego ou *eghom.

Quanto mais antigos os registros linguísticos que você tem, mas fácil é reconstruir linguagens e agrupá-las em famílias. Se tivéssemos documentos de 3000 a.C. em vários idiomas indo-europeus, poderíamos reconstruir até muito mais tempo atrás. Porém, não temos, então não podemos ligar os pontos além do que já ligamos.

PIE certamente vem de outra língua, mais antiga, que vem de outra, e assim em diante. Ela pode ser relacionada à família urálica (finlandês, estoniano, húngaro) ou até às línguas turcomanas (turco, azeri). Contudo, não podemos saber com as evidências que temos no momento.

Os três idiomas dos quais temos registros de 3000 a.C. são o sumério, o acadiano e o egípcio. O sumério provavelmente tinha parentes, mas nenhum deles foi escrito, e todos os membros de sua família desapareceram, inclusive ele próprio.

Se os descendentes modernos do acadiano e do egípcio fossem conhecidos apenas por documentos recentes, provavelmente nem os consideraríamos parentes. Porém, como seus ancestrais foram escritos cinco mil anos atrás, podemos dizer que vieram de um idioma chamado protoafroasiático, que era falado entre 12 e 18 mil anos atrás.

Se tivéssemos registros do finlandês de 4000 a.C. e do grego de 4000 a.C., poderíamos compará-los melhor e achar conexões. Infelizmente, como não escreviam naquela época e línguas não deixam fósseis, não há com saber.


bottom of page