Descomplica. Descobre. Diverte-te.

GLOSSÁRIO CRL

Conceitos, sistemas, instituições e ideias para navegar a História sem afundar no palavreado.

Aqui a História explica-se de A a Z.


🏰 Medieval ⚔️ Guerra 🧠 Política 🌍 Império 💻 IA 📚 Conceitos

As palavras também têm bastidores.


Definição

Um corpus é uma coleção organizada de textos, transcrições ou outros registos reais de língua, criada para estudar padrões de uso linguístico. Pode servir para analisar vocabulário, gramática, frequência de palavras, variação regional, mudança histórica ou funcionamento discursivo.

Contexto histórico

A linguística de corpus ganhou força com a digitalização dos textos e com o aumento da capacidade computacional. McEnery e Hardie descrevem a linguística de corpus como uma área centrada em métodos e procedimentos para estudar a língua a partir de dados reais.

Como funciona

Recolhem-se textos ou registos orais, organizam-se os dados, removem-se duplicados, anotam-se categorias e analisam-se padrões. Hoje, os corpora são também fundamentais para treinar sistemas de tradução automática, corretores, assistentes digitais e modelos de linguagem.

Porque importa

Um corpus nunca é apenas uma “pilha de textos”. É uma escolha sobre que língua merece entrar no arquivo. Se certos grupos, países, classes sociais ou formas de falar aparecem pouco, a análise fica torta logo à partida.

Na prática

Se um sistema aprende sobretudo com português escrito, urbano e formal, pode tratar a oralidade, os regionalismos ou certas variantes nacionais como desvios. A língua continua viva fora da máquina, mas dentro dela fica meio amputada.

Explora também

português de máquina; língua pluricêntrica; IA; variação linguística; viés linguístico.


Definição

Default é uma configuração predefinida que um sistema usa automaticamente quando o utilizador não faz uma escolha explícita. Em contexto digital, pode aplicar-se a idioma, privacidade, apresentação visual, motor de pesquisa, recomendações, formatos de escrita ou variantes linguísticas.

Contexto histórico

O termo vem da informática e da gestão de sistemas, mas ganhou importância cultural e política com a expansão das plataformas digitais. Hoje, os defaults não organizam apenas máquinas: organizam comportamentos, escolhas e expectativas.

Como funciona

Um sistema apresenta uma opção inicial. O utilizador pode alterá-la, mas muitas vezes não o faz por pressa, desconhecimento, hábito ou confiança na plataforma.

É precisamente aí que o default ganha força: não obriga, mas empurra.

Porque importa

O default raramente é neutro. Aquilo que vem escolhido de origem ganha vantagem sobre todas as outras possibilidades.

No caso da língua portuguesa, um default pode definir que variante aparece primeiro, que vocabulário é sugerido, que norma é corrigida e que forma de português parece mais “natural” ao sistema.

Na prática

Se uma ferramenta responde automaticamente em português do Brasil a um utilizador de Portugal, Angola ou Moçambique, pode não estar a fazer uma escolha inocente. Pode estar apenas a seguir o caminho que alguém, algures, definiu como padrão.

E quando o padrão se repete muitas vezes, começa a parecer lei natural. Não é. É configuração.

Explora também

Português de máquina; corpus; língua pluricêntrica; viés linguístico; plataforma digital; arquitetura de escolha.


Definição

Uma língua pluricêntrica é uma língua com vários centros de uso, norma e prestígio. Cada centro pode desenvolver formas próprias de pronúncia, vocabulário, construção frásica, escrita, ensino e legitimação cultural.

O conceito foi usado por Michael Clyne para descrever línguas com vários centros em interação, cada um produzindo uma variedade nacional com algumas normas próprias.

Contexto histórico

O português é uma língua pluricêntrica porque se espalhou por vários espaços políticos, culturais e sociais, sobretudo através da expansão portuguesa, da colonização, da formação de Estados independentes e das diásporas.

Baxter já analisava o português como língua nacional e internacional, identificando-o como língua oficial em vários países e discutindo a autonomia e o estatuto das suas variedades.

Como funciona

A pluricentricidade não significa que “vale tudo”. Significa que a língua não pertence a um só centro.

Portugal, Brasil, Angola, Moçambique, Cabo Verde, Guiné-Bissau, São Tomé e Príncipe, Timor-Leste e as comunidades da diáspora participam, de formas diferentes, na vida da língua. Algumas variedades têm mais codificação, poder editorial, presença digital e reconhecimento institucional do que outras. E é aí que a conversa deixa de ser apenas linguística e passa a ser também política.

Porque importa

Importa porque a língua é também poder simbólico.

Quando uma variante é tratada como padrão absoluto, as outras começam a parecer erro, atraso ou exotismo. O modelo pluricêntrico ajuda a contrariar essa lógica: não apaga a norma, mas impede que uma norma se disfarce de língua inteira.

Na prática

“Autocarro”, “ônibus”, “machimbombo” ou outras formas não são apenas palavras diferentes para a mesma coisa.

São pistas de histórias diferentes dentro da mesma língua. A língua portuguesa não é uma estrada de sentido único entre Lisboa e o resto do mundo. É uma rede de caminhos, alguns asfaltados, outros ainda tratados como picadas.

Explora também

Português de máquina; português algorítmico; corpus; default; lusofonia; norma linguística; variação linguística; português europeu; português brasileiro; português angolano; português moçambicano.