A princípio há na internet várias listas destas. Cada uma baseada em uma pesquisa ou outra. Algumas são publicadas por cientistas lingüistas sérios, outras nem tanto (
são feitas meio que de qualquer jeito só para chamar a atenção).
Mas afinal, como sabemos que uma palavra é mais usada que outra? Como podemos ter certeza da exatidão de tal informação? Bom, dentro da Ciência Lingüística tem um ramo que se chama
Lingüística de Corpus. É este aí o pessoal responsável por tais pesquisas. E o que é este tal de
Corpus?
De modo bem simples,
corpus é um banco de dados no qual ficam armazenados tudo o que é escrito e falado em uma língua. Os cientistas que estudam uma língua (os Lingüistas) pegam tudo o que é publicado em uma língua (
inglês, por exemplo) e colocam em um computador. Textos de jornais, livros, revistas, panfletos, informativos, bula de remédio... enfim, tudo o que é possível e salvam em um computador. Todas estas informações é o que chamamos de
corpus escrito (
afinal, só temos aí textos escritos).
Além disto, os Lingüistas podem ainda gravar (
com a autorização das pessoas) conversas no trabalho, no supermercado, em casa, ao telefone, nas ruas, banco de praças, ônibus, etc. Gravam também programas de TV, entrevistas, noticiários, etc. Depois transcrevem tudo para o computador e tem-se assim o
corpus falado (
os dados da língua falada).
Com estes dois conjuntos de dados -
corpus escrito e
corpus falado -, nós - pesquisadores lingüistas - podemos verificar tudo com a ajuda de um programa desenvolvido para isto. Assim podemos descobrir coisas interessantes. Por exemplo, você sabia que a palavra mais usada na língua inglesa é o artigo "the"? Isto no
corpus escrito! Porém, se avaliarmos só o
corpus falado vamos descobrir que a palavra mais usada é o pronome "I"! Se juntarmos os dois corpus o "the" ganha em disparado de tudo quanto é palavra.
Outra curiosidade: você sabia que a voz passiva no inglês é usada com muito mais freqüência em textos científicos e jornalísticos? Ou seja, se você quer aprender inglês, só para viajar e fazer amigos, não precisa ficar decorando as regras da voz passiva em inglês. Mas se você quiser ser um bom jornalista ou escrever bom textos científicos então a conversa vai ser outra.
Com o corpus descobrimos também quais palavras são mais usadas com outras palavras (
collocations). Descobrimos que o present perfect é mais usado que o past simple. E descobrimos também que o present simple é de longe o tempo verbal mais usado na língua inglesa.
Enfim, com esta ciência maravilhosa professores de inglês podem ter uma idéia do que ensinar para seus alunos. Autores de livros podem escrever informações mais precisas sobre uma estrutura gramatical ou outra, podem também dizer aos leitores e estudantes como as palavras são usadas em conjunto com outras palavras.
Infelizmente, este banco de dados não está disponível na íntegra para todas as pessoas. Apenas, estudiosos na área, escritores, pesquisadores, lingüistas e outros cientistas conseguem ter acesso irrestrito a tais informações. Mas caso alguém aí esteja interessado em desembolsar algo em torno de R$5.000,00 pode até conseguir acesso a tal banco de dados.
E é assim pessoal, baseado nestas informações, que digo a vocês como uma palavra ou outra é usada em inglês e como informo também o ranking de uma palavra outra. Saibam que o dia que isto estiver de graça na internet para todo mundo, você ficarão sabendo! Terei o prazer de informá-los, com certeza!
See you! Take care!
===============
Leitura Recomendada: Lingüistica de Corpus de Tony Berber Sardinha (
Editora Manole), este até o momento é o único livro que trata do assunto no Brasil. Claro que ele é recomendado aos estudiosos e interessados na área. Se você for aprendiz de inglês não precisa se preocupar com isto não!