Sistemas de Tradução Automática

Aluno: Leif Nascimento

Os sistemas de tradução automática e seu funcionamento

Os aplicativos de auxílio à tradução podem ser encaixados em duas categorias: os sistemas de tradução por computador, ou tradução automática (MT - Machine Translation systems), são aqueles capazes de realizar o processo tradutório completo (o que não exclui pré e/ou pós edição humana). Podem ser mais simples e modestos ou complexos e ambiciosos, às vezes ainda visando se aproximar da concepção ideal de tradução automática. Como sabemos, podem ser mais ou menos eficientes. Por sua vez, os sistemas automáticos de auxílio à tradução (MAT - Machine-Aided Translation systems) subdividem-se em sistemas de tradução automática assistida por humanos (HAMT - Human-Aided Machine Translation) ou de tradução humana assistida por computador (MAHT - Machine-Aided Human Translation), segundo quem realiza as tarefas centrais e quem presta auxílio de forma mais secundária.

Os sistemas de tradução assistida por computador podem encaixar-se em uma gama de variáveis: os sistemas que realizam MAHT podem simplesmente oferecer o acesso a dicionários e enciclopédias em tempo real e recursos de processamento de textos; ou podem realizar a verificação ortográfica e gramatical; ou mesmo realizar parte da análise textual - grande parte dos tradutores já utiliza diversos desses recursos, que representam um grande ganho em tempo e qualidade de trabalho. No caso dos sistemas de HAMT, a intervenção humana também pode variar, sendo maior na pré revisão, na pós revisão ou consistindo numa revisão no decorrer do processo da tradução. Esta estratégia é hoje a que provavelmente alcança melhores resultados, pois permite a resolução de problemas complexos, como a ambigüidade referencial, além de facilitar a implementação de melhorias no sistema utilizado. Este tipo de sistema menos automatizado pode desempenhar-se de forma altamente satisfatória, combinando as capacidades e vantagens computacionais e humanas - logicamente, é difícil chegar-se a uma solução ideal, existindo uma ampla variedade desses sistemas, cada um buscando chegar à combinação mais eficiente. Finalmente, há os bancos de dados terminológicos, os sistemas menos ambiciosos, que oferecem como principais vantagens a facilidade e velocidade das consultas e sua possibilidade de atualização [Slocum, J. 1985; Nirenburg, S. 1987].

O grau de aceitação dos programas é hoje medido pela quantidade de pré e pós revisão requerida. Dependendo do sistema, este pode exigir pré edição ou não; os sistemas de tradução assistida por computador pedem a intervenção humana durante a tradução; em todos os casos a revisão posterior é necessária, em maior ou menor grau, em geral dependendo das fases anteriores. Um programa cujo índice de correções (revisão posterior, por exemplo) é menor que 20% (uma correção a cada 5 palavras) é considerado aceitável. Além disso, muitas vezes o sistema vai sendo melhorado com o uso, ao mesmo tempo em que o tradutor que faz as correções adquire prática, aprende a reconhecer os erros típicos da tradução automática e pode chegar a dobrar sua produção em alguns meses [Slocum, J. 1985].

Existem determinadas técnicas que caracterizam os diferentes sistemas de tradução automática. Em geral faz-se referência a três pares delas: tradução direta vs. tradução indireta, interlíngua vs. transferência e análise local vs. análise global [Slocum, J. 1985; Tucker, A. 1987]. Vejamos cada uma delas:

A tradução direta caracteriza os sistemas desenvolvidos especificamente para traduzir de uma determinada língua para outra; todas as operações são direcionadas para esse par específico de línguas (como a busca de soluções para ambigüidades) e baseiam-se sobretudo na análise morfológica e na consulta a dicionários, sem empregar teorias lingüísticas subjacentes. Já a tradução indireta ocorre nos sistemas em que a análise da língua fonte e a geração da língua alvo constituem processos independentes; assim, os problemas detectados na decodificação de uma língua devem ser resolvidos no âmbito dessa mesma língua, não importando em que língua o texto traduzido será gerado.

A interlíngua constitui uma abordagem fundamentada nos princípios de uma lingüística universal, cuja metodologia é emprestada da inteligência artificial, que caracteriza os sistemas em que a representação do significado da língua de entrada é feita de forma independente de qualquer língua; a mesma representação é utilizada para gerar o texto de saída. Em contraste, a transferência é a abordagem através da qual o sistema gera uma representação estrutural das unidades gramaticais da língua de origem e, a seguir, uma representação correspondente para a língua alvo, a partir da qual será gerado o texto de saída (observação: essa estrutura varia segundo o sistema, podendo ser meramente sintática e lexical ou buscar uma representação semântica mais abrangente.