GRAMÁTICA DO PORTUGUÉS VOLUME I Comissäo Organizadora Eduardo Buzaglo Paiva Raposo Maria Fernanda Bacelar do Nascimento Maria Antónia Coelho da Mota Luisa Segura Amália Mendes Colaboracäo de Graf a Vicente e Rita Veloso FUNDACľÄO CALOUSTE GULBENKIAN r LÉXICO 8 Organizacäo do léxico Rui P. Chaves 9 Processos de lexicalizacäo Maria Fernanda Bacelar do Nascimento 10 Processos de gramaticalizacäo Amália Mendes 8 ORGANIZA£AO DO LEXICO 185 8.1 Aspetos do significado lexical 187 8.2 Vagueza 189 8.3 Homonfmia e polissemia 190 8.3.1 Homonimia 192 8.3.2 Polissemia 192 8.4 Sinonimia 196 8.5 Antonimia 198 8.6 Hiponfmia-hiperonimia 200 8.7 Meronimia-holonfmia 205 8.8 Relacoes proposicionais 208 8.8.1 Relac5es e predicadores simetricos 209 8.8.2 Rela?oes e predicadores reflexos 210 8.8.3 Relafoes e predicadores transitivos 211 188 8.1 ORGANIZACÄO DO LÉXICO Nem sempře isto acontece com duas palavras diferentes. A intensäo diferente de duas palavras ou expressöes distintas näo implica necessariamente que a sua extensäo também o seja. Assim, p.e., as expressöes nominais animal com rins e animal com coracäo tém sentidos diferentes mas denotam extensionalmente a mesma classe de entidades, já que todos os animais que possuem coracäo também possuem rins e vice-versa; neste caso, os dois conjuntos säo idénticos. Urna possibilidade mais frequente é que a extensäo de duas expressöes intensionalmente diferentes seja distinta mas com membros comuns; um exemplo é o par de palavras estudante e jovem: muitos estudantes säo jovens (e vice-versa), mas nem todos os estudantes säo jovens e nem todos os jovens säo estudantes. Distinguindo-se da denotacäo (quer intensional quer extensional), a referencia é a propriedade que tém algumas expressöes linguísticas, chamadas expressöes referenciais, de designarem ou representarem urna entidade particular ou um grupo particular de entidades do universo do discurso. As expressöes referenciais tém tipicamente como núcleo um nome comum (também chamado substantivo), urn nome proprio ou urn pronome, i.e., säo sintagmas nominais (cf. Cap. 20). Os seguintes sintagmas nominais (sublinhados) constituem expressöes referenciais, pois säo usados para designar determinadas entidades num determinado contexto enunciativo: a minha vizinha foi äs compras, a Maria cozinhou um ótimo jantar e da zangou-se comomarido. Ä entidade, individual ou coletiva, designada por uma expressäo referencial chama-se o referente da expressäo. O referente corresponde, assim, essencialmente, äquilo de que se está a falar quando usamos urn determinado sintagma nominal num enunciado concreto (cf. Cap. 20). Por isso, a referencia depende näo só do sentido das palavras que formám o sintagma nominal (em particular, do substantivo e outros elementos que o modifiquem, como os adjetivos), mas também da situacäo em que o enunciado é produzido. Por exemplo, na frase o goto adormeceu, o sintagma nominal o gato refere normalmente um animal diferente de cada vez que a frase é produzida num enunciado concreto, consoante o contexto situational, o lugar e o tempo em que esse enunciado é produzido. Isto acontece ainda que as palavras o e gato tenham a mesma contribuicäo semäntica em todps esses enun-ciados (sobre a interpretacäo do artigo defmido, cf. Caps. 20 e 22). A dependéncia da referencia relativamente ao contexto situacional ou discursivo em que um enunciado é produzido também é visível em frases como todos os cäes perseguiram o gato. Nesta frase, o sujeito näo é normalmente interpretado como designando todos os cäes do mundo (perseguindo um determinado gato), mas sim como referindo a totalidade dos cäes mencionados anteriormente ou que se encontram na situacäo concreta em que o enunciado é produzido (e que podem ser apenas trés ou quatro). Em resumo, a referencia depende do contexto situacional e discursivo em que a frase é dita, da intencäo comunicativa de quem enuncia a frase e do conhecimento da situacäo partilhado pelos interlocutores; em contrapartida, a denotacäo, incluindo o sentido, näo depende do contexto. A distincäo entre denotacäo e referencia é particularmente evidente em casos em que as palavras, num determinado contexto situacional ou discursivo, näo possuem um referente. Por exemplo, no enunciado nenhum gato foi ferido na rodagem do filme, até porque näo havia gátos no estúdio, os sintagmas em que se insere a palavra gato (i.e., nenhum gato e gatos), embora tenham urna denotacäo, VAC U EZA 8.2 189 náo referem nenhum animal em particular, já que se declara que nao havia gatos na situacao em questáo. Quando um SN nao refere qualquer entidade, diz-se que é náo referencial (cf. Caps. 20 e 22). Estabelecidas estas diferencas, é importante assinalar que os aspetos do signi-ficado lexical abordados nos pontos seguintes děste capítulo tern a ver nao com a referenda, mas sim com a denotacao das palavras, em particular a denotacao intensional ou sentido. 8.2 Vagueza O sentido da maioria das palavras inclui propriedades conceptuais de natureza muito diferente. Tomemos como exemplo um dos sentidos comuns da palavra/ane/a. Esta palavra denota uma abertura na parte exterior de uma ediůcacao ou de um veículo que permite a passagem do ar e da luz para o interior dessa edificacao ou veículo, bem como o seu revestimento com vidro ou outro material transparente. Estas propriedades, ainda que necessárias (ou, pelo menos, tipicas) na carac-terizacao daquilo que constitui uma janela, sao, no entanto, muito gerais, permi-tindo alguma variacao na sua caracterizacao precisa. Em particular, deixa-se em aberto toda uma série de possibilidades quanta á forma ou ao tamanho da abertura da superficie, a natureza da edificacao ou do veículo, o material de que é feito o revestimento, a sua espessura, a possibilidade de se abrir ou nao de modo a deixar passar o ar (por exemplo, as janelas de um aviao e de muitos edificios modernos nao se podem abtir), etc. Ou seja, janela, e na realidade a maioria das palavras, tern um sentido vago (a propriedade semántica correspondente chama-se vagueza). Os sentidos vagos permitem, assim, que exista variacao e flexibilidade na espe-cificacao interna das propriedades que compoem o sentido das palavras, podendo essa especificacáo ser diferente de falante para falante; e quanta mais vago for o sentido de uma palavra, mais abrangente será a sua extensao. Uma janela, por exemplo, pode ser redonda, quadrada, retangular, pode ser pequena ou grande, o seu revestimento pode ser feito de um material mais ou menos translucido, de maior ou menor espessura, pode aplicar-se sobre ediůcacoes ou veiculos de natureza variada, desde que tenham um volume interno e uma superficie externa adequada, incluindo submarinos, avioes, carros, casas, cabanas, tendas, etc. Para alem das propriedades necessárias, o sentido das palavras inclui outras propriedades que estao frequentemente (e tipicamente) presentes nos objetos por elas designados, mas que nao constituem caracteristicas necessárias da defmicao. Por exemplo, as janelas tipicas sao feitas de vidro (mas nao necessariamente), podem abrir-se através de um fecho (mas náo necessariamente) e tern um caixilho (mas nao necessariamente). Para dar outro exemplo, consideremos a palavra carro, de cujo sentido sao attributes típicos ter uma carrocaria, um volante, um motor, quatro rodas revestidas de pneus, um chassis, bancos, janelas com um revestimento de vidro, etc. No caso extremo, se removermos todas as pecas de um carro á excecao do volante, entao certamente já náo temos um carro, mas unicamente um volante. No entanto, a determinacao dos elementos necessários para que se possa dizer que (ainda) temos um carro varia provavelmente de falante para falante. Ou seja, se removermos as 8.3 ORGANIZAfÁO DO LÉXICO pecas de um carro uma a uma, os falantes poderáo divergir sobre se o resultado de cada remocáo é ainda um carro ou nao. Isto signiůca que a definicáo precisa do sentido da palavra carro nao é clara nem para os falantes nem para os linguistas que estudam o funcionamento da linguagem. Nesse sentido, a maioria das palavras tle uma lingua tem uma definicáo mental ligeiramente diferente para cada falante, relacionada com o seu conhecimento do mundo e a sua experiéncia pessoal. No entanto, a comunicacao decorre, em geral, sem problemas, pois muito raramente os falantes se encontram numa situacao em que a maioria dos atributos que asso-ciam á definicáo de uma palavra nao seja satisfeita pelo seu referente. Um exemplo extremo de vagueza é a palavra algo (cf. Cap. 23). Esta palavra é usada por muitos falantes para designar entidades abstratas ou concretas, e, embora seja tipicamente intuída como o pronome indefinido aplicável a entidades nao humanas (e nao animadas), é muitas vezeš admissível o seu uso mesmo quando o referente inclui ou é constituído por seres animados, incluindo mesmo seres humanos: cf. a aceitabilidade de algo matou os meus ratinhos da india, possivelmente o frio, o stress, a gripe, a idade, o gato. o vizinho ou o bebedouro elétrico, ou de algo fez o alarme soar, e sópode ter sido um ladrdo. Nesse sentido, algo contrasta com alguém (outra palavra vaga), corretamente intuído como sendo um pronome indefinido unicamente aplicável a entidades humanas, mas nao a animais ou a entidades nao animadas, como se pode ver pela estranheza de ěalguém fez o alarme soar, e sópode ter sido ou o gato ou o vento. 3 Homonímia e polissemia Na sua maioria, as palavras de qualquer lingua sao ambíguas, isto é, a uma mesma forma lexical correspondem sentidos diversos, e tantos mais quanto maior for a frequéncia dessas palavras no uso; pelo contrário, sao em muito menor numero as palavras monossémicas, ou seja, aquelas em que há uma relacao biunívoca entre a forma e o sentido. Sao exemplos desteúltimo caso certos nomes científicos, como camussela, nome de um pássaro, urzela, nome de um líquen ou batíscafo, nome de um pequeno submarino para observacao científica dos oceanos. Sao também palavras monossémicas algumas formas derivadas que se relacionam apenas com um dos sentidos da palavra base, como colunável, que significa, apenas, 'digno de apa-recer nas colunas da imprensa', e que deriva de um dos vários sentidos da palavra coluna, o de 'seccao regular da imprensa escrita'. No ámbito da ambiguidade lexical, distinguem-se dois casos: o da homonímia e o da polissemia. Em ambos, a uma mesma forma fonética e gráfica correspondem sentidos diferentes, pondo-se como problema decidir em que casos se consi-dera estarmos perante palavras distintas ou perante uma só palavra. No primeiro caso, trata-se de homonímia; no segundo, de polissemia. Para dar um exemplo clássico, será que verde, torno nome de cor, e verde, como designacao do estado de maturacao de um fruto, sao duas palavras homónimas, ou uma só palavra polissémica? Alguns falantes nao detetam qualquer relacao entre a cor e o estado de maturacao, considerando-as, por isso, palavras diferentes. Outros, no entanto, relacionam os dois sentidos, dado que a fruta que tem cor verde é, frequentemente, fruta que ainda nao amadureceu, pelo que consideram tratar-se HOMONÍMIA E POLISSEMIA 8.3 de uma única palavra. Compreende-se, assim, que nem sempře seja fácil distinguir entre homonímia e polissemia4. Tendo em conta unicamente o conhecimento lexical do falante medio numa determinada época, e seguindo, portanto, uma perspetiva puramente sincrónica, diz-se que duas ou mais palavras säo homónimas quando tém a mesma forma fonética e gráfica e sentidos completamente distintos, isto é, em que näo se distin-guem, presentemente, tracos semänticos comuns5, como, p.e., sena 'instrumento para cortar' e setra 'elevacäo de terreno'. Em contrapartida, considera-se que uma palavra é polissémica quando a uma mesma forma lexical correspondem sentidos diferentes para os quais é possível estabelecer uma relacäo através de um ou mais tracos semänticos comuns, como, p.e., váo no sentido de 'vazio, oco', e väo no sentido de 'sem valor, desnecessário'. No caso das palavras polissémicas, podem conceber-se pontes semánticas entre os vários sentidos, atribuídas a processos diversos, sendo particularmente sistemáticos na lingua os processos de extensäo ou restricäo dos sentidos, nomeadamente por metafora e metonímia (vulgarmente chamados "sentidos figurados"). Neste capí-tulo, segue-se esta perspetiva sincrónica e näo uma perspetiva histórica. Algumas formas lexicais como, por exemplo, a palavra banco podem ser tanto homónimas como polissémicas. Esta forma constitui uma palavra polissémica quando se compara a interpretacäo de 'instituicäo' (cf. o banco vai falir) com a de 'edifício' onde funciona a instituicäo (cf. o banco vai ruir). Em contrapartida, a forma inštancia um caso de homonímia (ou seja, representa duas palavras dis-tintas) quando se compara a interpretacäo de 'instituicäo' com a interpretacäo de 'assento' (cf. ele sentou-se no banco do jardim)6. Um dos critérios usados em lexicograňa para distinguir entre homonímia e polissemia é observar a história da palavra. Ou seja, seguindo uma perspetiva diacrónica, consideram-se palavras homónimas aquelas que, tendo a mesma forma, tém origens etimológicas diferentes, convergindo numa mesma forma devido ä sua evolucäo fonética. Assim, por exemplo, nos dicionários que adotam este critério, formas lexicais idénticas tém entradas diferentes, equivalendo a palavras distintas, ou seja, homónimas, sempre que as formas associadas aos diversos sentidos tém étimos também diferentes, como, p.e., manga 'parte de urna peca de vestuário', cujo étimo é mätúca, do latim, e manga 'fruto da mangueira', cujo étimo é manga, do malaiala, ou canto 'ängulo, esquina, aresta', do latim canthus, e canto 'ato de cantar, som musical', do latim cantus. Em contrapartida, a urna forma lexical cujos sentidos näo correspondem a étimos diferentes é dada uma única entrada; neste caso, temos urna única palavra polissémica. 4 Por este motivo, a distinc äo é considerada como praticamente insolúvel por vários semanticistas (cf. Lyons 1986:43ss). 5 Frequentemente, palavras com sentidos muito distintos tém formas morfológicas derivadas também distintas (banco 'assento' > bancada, banqueta vs. banco 'instituicäo bancária' > bancário, banqueiro), o que corrobora a adocäo de uma metodológia sincrónica para se distinguir entre polissemia e homonímia. 6 O item banco pode também ser usado em expressôes como banco de areiaou ainda banco de sangue, banco de dados, em que significa um lugar onde se guarda uma quantidade elevada da matéria ou das entidades em causa. É plausível que estes dois últimos usos instanciem um sentido relacionado com o de instituicäo fmanceira, na medida em que todos remetem para um lugar onde se guarda um volume elevado de alguma coisa. 192 8.3.1 ORGANIZACÄO DO LÉXICO Este critério histórico näo é relevante para a maioria dos falantes porque estes näo tém, de um modo geral, conhecimento da etimologia das palavras, nem do seu percurso histórico. Assim, existem palavras formami en te idénticas, com o mesmo étimo e, consequentemente, com sentidos historicamente relacionados, mas que näo säo intuídas como relacionadas pelos falantes de uma determinada geracäo (ou sej a, para esses falantes, essas palavras säo homónimas e näo polissémicas), como, p.e., a palavra curso, do latim cursus, que pode significar, por um lado, 'ato de correr, movimento' e, daí, 'caminho percorrido por um rio', e, por outro lado, 'programa de estudos, licäo, disciplina', sentidos que o falante näo relaciona. 8.3.1 Homonímia Como vimos, na perspetiva sincrónica seguida neste capítulo, palavras que tém a mesma forma gráfica e fonética mas sentidos diferentes säo consideradas palavras homónimas. Por exemplo, o nome canto é ambíguo entre duas palavras diferentes, cada uma com sentidos distintos: uma ocorre em expressöes como o canto da sola e a outra em expressöes como o canto do rouxinol. Outros casos de homonímia säo, por exemplo, banco 'assento' e banco 'instiruicäo bancária', cavalo 'animal equídeo' e cavalo 'heroina (droga)'7. Em todos estes exemplos, a mesma forma tem, atualmente, sentidos suficien-temente diferentes para ser tratada no ämbito da homonímia, independentemente de consideracöes sobre as suas origens etimológicas, que säo diferentes em canto e em banco, ao contrario do que acontece em cavalo. Muitas das palavras homónimas pertencem a classes diferentes: foca (verbo, em a máquina foca bem) vs. foca (nome, em eu vi a foca); säo (adjetivo, em ele está säo) vs. säo (verbo, em elas säo altas); mato (nome, em estamos no mato) vs. mato (verbo, em eu mato as moscas), entre muitas outras. Este tipo de homonímia, que diz respeito a palavras homónimas näo pertencentes ä mesma classe, é designado por homonímia parcial. Outro tipo de homonímia, a homonímia absoluta, diz respeito a palavras que pertencem ä mesma classe, como, por exemplo, vela 'objeto de cera' vs, vela 'tecido para propulsäo eólica'; banco 'instiruicäo financeira' vs. banco 'assento'; manga 'fruto' vs. manga 'parte de uma peca de vestuário'; pena 'castigo judiciário' vs. pena 'orgäo cutäneo que reveste o corpo das aves'; letra 'sinal gráůco' vs. letra 'título de crédito'. Todas estas palavras pertencem ä classe dos nomes e possuem sentidos independentes. 8.3.2 Polissemia Como foi dito, designa-se como polissemia a associacäo de uma forma lexical única a sentidos diferentes que mantěm entre si alguma relacäo. Dois processos analógicos muito produtivos e com um papel importante neste domínio da significacäo säo a metafora e a metonímia. No primeiro caso, há transferéncia de sentido resultante de uma associacäo por semelhanca. Assim, por exemplo, a palavra joia tem o sentido básico de ornamente valioso em usava uma joia na lapěla e, por semelhanca, 7 O nome de "cavalo" para heroina vem do efeito que produz, semelhante ao de um coice de cavalo. Há, portanto, uma relacäo de analógia, mas nem todos os falantes těm conhecimento disto. H0M0NÍM1A E POLI5SEMIA 8.3.2 o de pessoa com qualidades valiosas em a tua irmá é uma joia. No segundo časo, há expansao ou restricáo de sentido por contiguidade. Essa contiguidade pode ser (i) entre o continente e o conteúdo (copo significa recipiente em enche o copo com dgua ou o líquido que o recipiente contém - tipicamente uma bebida alcoólica - em vamosbeber um copo); (ii) entre o todo e a parte (teto significa uma parte da casa em pintei o teto de branco ou toda a casa em náo tem um teto onde se abrigar); (iii) entre a matéria-prima e o produto (prata tem o sentido de metal precioso em a prata vale menos do que o ouro e de objeto feito de prata em roubaram-lhe todas as pratas). Outro exemplo de polissemia é a palavra livro, que pode significar o conteúdo intelectual de uma obra escrita (em frases como o livro é extremamente polémico) ou o suporte físico no qual o texto está escrito (em frases como o rato roeu o livro). Embora os dois sentidos (conteúdo vs. suporte) sejam diferentes, apresentam relacoes metonímicas que o falante reconhece. Podemos distinguir dois tipos de polissemia, a polissemia regular e a polissemia irregular. Na polissemia regular, todas as palavras pertencentes a uma deter-minada classe semántica exibem o mesmo padrao polissémico. Um exemplo é o das palavras que remetem para uma obra escrita (carta, diário, diáonário, jornal, livro de código, livrete, manual, panfleto, relatório, revista, etc.), que exibem exatamente a mesma dualidade de sentidos da palavra livro. Se for dito a um falante do portugués que existe uma palavra nova, por exemplo lídito (palavra inventada por nós), que remete para um tipo de obra escrita mas cujo significado exato náo é bem conhe-cido, os falantes concluirao que podem usar essa palavra tanto com o sentido de conteúdo como com o sentido de suporte material. No caso da polissemia irregular, náo existe qualquer padrao polissémico parti-lhado pelas palavras da mesma classe semántica. Por este motivo, as palavras e os seus sentidos těm de ser aprendidos um a um, náo podendo ser inferidos a partir da classe semántica. Por exemplo, a palavra coracáo tem um sentido biológico, quando designa um órgáo muscular, e um sentido emocional, quando designa metafori-camente a sede de algumas emocóes. Contudo, esta dualidade de sentidos nao é observada em outras palavras da mesma classe semántica, tais como bexiga, pancreas, pulmao, rim, etc.8 Na polissemia regular, pode acontecer que os vários sentidos da palavra este-jam simultaneamente disponíveis na mesma frase. Por exemplo, é possível usar os dois sentidos da palavra livro em o livro que está em cima da mesa contém erros sobre a história de Portugal. Aqui, o objeto físico livro está a ser localizado no espaco, ao mesmo tempo que se qualifica o seu conteúdo intelectual. Este tipo de polissemia regular é chamado polissemia compatível. Contudo, nem todas as palavras polissémicas podem ser usadas desta forma; há um segundo tipo de polissemia regular a que chamamos polissemia incompatí-vel. Como exemplo, consideremos a palavra coiner, que pode ser usada no sentido de utensílio recipiente ou também, por metonímia, como medida de quantidade que o recipiente pode confer (cf. Cap. 21). Os dois sentidos sáo ilustrados, respeti-vamente, em a colher está torta e emponha uma colher de manteiga no refogado. Esses 8 Também a palavra estdmago possui uma dualidade de sentido ('órgáo' e 'ánimo') semelhante á da palavra coragao, mas o sentido de 'ánimo' apenas se veriflca na expressao idiomática náo ter estdmago para. 8.3.2 0RGANIZACÁO DO LÉXICO sentidos sao observáveis em palavras da mesma classe: baldě, copo, pá, panela, pipa, pipeta, saco ou tacho. Contudo, a polissemia incompativel nao permite que estejam ativos na mesma frase, em simultáneo: cf. a estranheza de #a colher de manteiga que está torta deve ser posta no refogado, uma frase que nao pode ser interpretada como uma instrucao para colocar uma certa porcao de manteiga num refogado usando uma colher torta. Abaixo sao listados exemplos de palavras pertencentes a estas duas classes. -:- Polissemia compativel (1) a. O relatório era falso. [conteudo] b. O relatório foi rasgado. [suporte] c. O relatório que foi rasgado era falso. [conteúdo + suporte] (outros exemplos: livro, manual, carta, etc.) (2) a. O hospital despediu o seguranca. [instituicao] b. O hospital foi assaltado. [edificio] c. O hospital que foi assaltado despediu o seguranca. [instituicao + edificio] (outros exemplos: banco, escola, empresa, etc.) (3) a. A cidade foi inundada. [local, regiao] b. A cidade está revoltada contra a Cámara. [populacáo] c. A cidade que foi inundada está revoltada contra a Cámara. [local, regiao + po-pulacao] (outros exemplos: cidade, vila, aldeia, pais, etc.) ♦I* Polissemia incompativel (4) a. Ele partiu um copo. [recipiente] b. Ele pós um copo de vinagre no estufado. [medida de quantidade] c. #Ele pós um copo de vinagre estalado no molho. [recipiente + medida de quantidade] (outros exemplos: colher, caneca, jarro, balde, etc.) (5) a. O panda está a dormir. [espécime (cf. Cap. 21)] b. O panda está atualmente ameacado. [espécie] c. #0 panda que está atualmente ameacado está a dormir. [espécime + espécie] (outros exemplos: tigre, canário, sardinha, etc.) (6) a. Ele usa um fio de prata. [substáncia] b. A prata tem o numero atómico 47. [elemento] c. #Ele usaum no de prata que tem o numero atómico 47. [substáncia+elemento] (outros exemplos: ouro, ferro, platina, etc.) A polissemia nao está restringida a formas nominais. Há também verbos, adje-tivos e preposicóes que exibem um comportamento polissémico. HOMONÍMIA E POLISSEMIA 8.3.2 195 Assim, os verbos fechar e abrir tanto podem remeter para acoes físicas (fechar a gaveta, abrir o portáo) como para atividades abstratas (fechar o balango, fechar a sessao, abrir a sessao, abrir a aula com uma anedota, etc). Também se podem considerar polissémicos alguns verbos com realizacóes sintáticas distintas associadas a leituras semántičas parcialmente diferentes, ainda que relacionadas. É este o caso dos verbos que entram na "alternáncia causativa-incoativa", como afundar (cf. Caps. 13 e 28). Este verbo ocorre numa frase transitiva com dois sintagmas nominais argumentais, desempenhando as funcoes de sujeito e de complemento direto (cf. (7a)), e numa frase intransitiva com apenas um sintagma nominal argumental, desempenhando a funcao de sujeito (cf. (7b)): (7) a. O submarino afundou o barco. (afundar = fazer com que vá ao fundo) b. O barco afundou-se. (afundar-se = ir ao fundo) Nas duas frases, o sentido de afundar é essencialmente o mesmo. Nomeada-mente, o mesmo sintagma nominal é complemento direto da versao transitiva (7a) e sujeito da versao intransitiva (7b), sendo-lhe atribuído pelo verbo o mesmo papel temático de paciente afetado em ambas as frases (cf. Cap. 11). No entanto, há uma diferenca: em (7b) apenas se exprime a situacao resultante do evento causal repre-sentado em (7a), sem qualquer mencao, explícita ou implícita, desse evento causal e do agente causador (representados em (7a)). Tal como é característico da polisse-mia regular, o tipo de diferenca semántica relacionada com a alternáncia causativa--incoativa é observado em muitos outros verbos, tais como abrir, danificar, fechar, partir, submergir ou sujar (cf. Cap. 28). Existem também adjetivos polissémicos como alto, baixo, belo, bom, grande, mau, pequeno ou verdadeiro. Por exemplo, em (8a), o adjetivo atributivo grande, em posicao pré-nominal, denota a elevada capacidade de jogo do indivíduo, ao passo que, em (8b), o mesmo adjetivo atributivo, em posicao pós-nominal, denota a sua elevada estatura física. Já em (8c), o mesmo adjetivo, agora com funcao pre-dicativa, é ambíguo entre um sentido em que denota dotes físicos e outro em que denota dotes morais: (8) a. O Vasco é um grande jogador. b. O Vasco é um jogador grande. c. O Vasco é grande. Frequentemente, o sentido dos adjetivos depende da entidade que qualificam, o que torna impossível listar todos os sentidos que podem ter. Este fenómeno é ilustrado nas frases em (9), onde o adjetivo bom/boa é sempře usado com uma conotacao positiva, embora ligeiramente diferente em cada caso: (9) a. A carne nao está boa. ('fresca') b. Foi bom passear pela cidade. ('agradável') c. A caldeirada estava boa. ('saborosa') d. Isto é bom para as enxaquecas. ('curativo') e. Este nó é bom de se desfazer. ('fácil') f. Ela é uma pessoa boa. ('bondosa') g. Ela é uma boa médica. ('competente') 196 8.4 ORGANIZACÄO DO LÉXICO O mesmo tipo de comportamento polissemico pode ser observado em relacäo a adjetivoscomo falso, lento,novo,räpido,velho,veloz,verdadeiro:cf., porexemplo,este e um jogo räpido, este carro e räpido e este teste e räpido. No primeiro caso, räpido näo qualifica a velocidade do jogo, mas sim a das jogadas. No segundo caso, o adjetivo qualifica a velocidade de um veiculo, näo a rapidez da conducäo. E, no terceiro caso, o adjetivo qualifica o tempo em que se pode fazer ou 1er o teste. Tambem existe polissemia nas preposicöes. Por exemplo, a preposicäo em significa inclusäo, mas este sentido pode tomar diferentes matizes, alguns deles abstratos, tal como ilustrado em (10) (cf. Cap. 32): (10) a. O livro estä em Lisboa. [inclusäo geogräfica] b. O futuro estä em ti. [inclusäo metaforica] c. O peixe estä em öleo quente. [inclusäo fisica] d. A avestruz estä em pänico. [inclusäo psicologica] e. O sistema estä em fase de festes, [inclusäo abstrata] f. Um dos condutores estä em contramäo. [inclusäo numa situacäo] g. O relatörio estä em disquete. [inclusäo num suporte] h. O meu quadro estä em pedagos. [inclusäo num estado] i. A minha vida estä em pedagos. [inclusäo metaforica num estado] 8.4 Sinonimia Chamam-se sinónimas as palavras distintas, da mesma classe lexical, com sentidos semelhantes (cf. japonés e nipónico, nitrogénio e azoto, narcótico e estupefaciente, amä-vel e gentil, célebre e famoso, horrivel e horroroso, abelha-mestra e abelha rainha, etc.). A sinonimia absoluta é um fenómeno extremamente raro nas linguas humanas. De facto, praticamente näo existem palavras que tenham exatamente o(s) mesmo(s) sentido(s) e as mesmas condicöes de uso, i.e., que possam substituir-se uma ä outra num enunciado sem provocar qualquer diferenca de significado expressivo ou de adequacäo pragmätica do enunciado ao contexto situacional ou discursivo. Por vezes, existem também diferencas "colocacionais" entre sinónimos (i.e., que tém a ver com a sua capacidade combinatória com outras palavras; cf. Firth 1951:190ss e Lyons 1986:50ss): assim, célebre, mas näo notävel, pode ocorrer com o advérbio tristemente: cf. tristemente célebre mas näo ^tristemente notävel (cf. Cap. 9). Por este motivo, é mais correto (e produtivo) restringir a definicäo de sinonimia aos aspetos do significado que tém a ver com o valor de verdade das frases nas quais se integram os termos em questäo9 - a chamada sinonimia proposicional (cf. Cruse 2004). Com base neste critério, säo sinónimas as palavras ou expressöes linguísticas que se possam substituir numa fräse sem alterar o seu valor de verdade (cf. muitos japoneses/nipónicos emigraram para o Brasil, o azoto/nitrogénio faz parte do ar que respiramos, o tráfico de narcóticos/estupefacientes pode dar cabo de um pais, a Maria é extremamente amävel/gentil, esse filme é horrível/horroroso, a {abelha--mestra/abelha rainha} acabou de entrarna colmeia, etc.). 9 Dizendo melhor, que tém a ver com o valor de verdade das proposicóes expiessas por essas frases (cf. Cap. 11). Para slmpliflcar a exposicao, continuamos a usar o termo "frase" neste contexto. SINONÍMIA 8.4 Quando uma palavra é polissémica, determinados sinónimos podem abranger apenas algum ou alguns dos seus sentidos; nesse caso, a sinonímia diz-se parcial. Por exemplo, o nome polissémico alto tem cume como sinónimo em contextos como o alto/cume da montanha, mas nao em contextos como ter um alto na cabeca (cf. a estranheza de #ter um cume na cabeca); neste contexto, alto tem como sinónimo protuberáncia (cf. tem uma protuberáncia na cabeca); a palavra caro tem como sinónimo dispendioso em o aluguer é caro/dispendioso, mas tem como sinónimo querido em formulas de cortesia como meu caro/querido amigo. Há palavras com sentidos semelhantes mas também com algumas diferencas semánticas que podem aparecer realcadas em determinados contextos, podendo, nalguns deles, a sua substituicao alterar subtilmente o valor de verdade da frase; é o caso de palavras como vaidade e arrogáncia, orgulho e soberba; célebre e notável; e guiar e conduzir. Estas palavras sao chamadas quase sinónimos ou parassinónimos10. Por exemplo, guiar está usualmente associado ao ato simples de orientar um volante ou um guiador, ao passo que conduzir remete para uma atividade mais complexa que inclui a manipulacao de outras pecas (pedais, alavancas, manetes, etc.). Assim, dizemos que um piloto conduz um aviao, um submarino, etc., mas náo que o guia. Em muitos casos, as palavras sinónimas sáo variantes dialetais da mesma lingua (cf. serta e frigideira; quarto de banho e casa de banho; borrego, cordeiro e anho, café, bica e cimbalino (no sentido de café de máquina servido em cafés e restaurantes), fino e imperial (no sentido de copo de cerveja tiráda á pressao)11. Entre variedades nacionais do portugués, há também casos de sinonímia, como, por exemplo, autocarro (portugués europeu), ónibus (portugués do Brasil) e machim-bombo (portugués de Angola e de Mozambique). As palavras ónibus e machimbombo, para alem de significarem transporte urbano de passageiros, tal como autocarro, těm outro sentido, correspondente ao da palavra do portugués europeu camioneta (transporte interurbano de passageiros). A sinonímia também tem uma dimensáo temporal, ou porque uma das palavras sinónimas é um arcaísmo (cf. bragal como sinónimo de enxoval, ósculo como sinónimo de beijo), ou porque é um neologismo (rebaixas como sinónimo de saldos, flop como sinónimo de fřacasso). Também entre registos de lingua diferentes ocorrem frequentemente sinónimos: cf. pai (termo neutro) vs. papá (sinónimo familiar); comer (termo neutro) vs. papar (sinónimo familiar) e morfar (sinónimo popular). Outro exemplo é o das várias palavras que denotam intoxicacáo alcoólica, como bebedeira e os seus correspondentes populares: borracheira, piela, pifo, tosga, a par de outros, menos partilhados pela generalidade dos falanteš, como bezana, buba, cadela, cardina, manta, narda, etc. [1] Muitos dos termos da linguagem científica, incluindo nomes latinos e formulas químicas, sao sinónimos de termos da linguagem corrente (cf., entre outros, síndrome de Down e mongolismo, cefaleia e dor de cabeca, OH2 e água, merluccius merluccius e pescada). O termo científico, no entanto, tem um sentido muito restrito, que se 10 Os parassinónimos sao, no entanto, frequentemente apresentados como sinónimos nos dicionários de uso. 11 Com o tempo, a variacáo dialetal pode esbater-se ou mesmo desaparecer, e as palavras sinónimas passam a ser usadas por falantes do mesmo dialeto, quer como termos equivalentes quer com associacoes contextuais ou estilísticas diferentes. 198 8.5 ORCANIZACÄO DO LÉXICO reduz ä nomeacäo científica da espécie ou categoria em questäo, abstraindo de toda a riqueza expressiva do termo corrente e das suas várias associacöes de sentido com as outras palavras da lingua. Por esse motivo, na maioria dos casos, o termo cientifico tem um contexto de uso limitado, restringido a textos cientificos e legais, dicionários e enciclopédias, comunicacäo entre especialistas, etc. Por exemplo, cefaleia é termo usado por medicos, sendo dor de cabega expressäo corrente; mongolismo e sindrome de Down säo ambos termos cientificos, mas o primeiro é de uso mais corrente, sendo hoje em dia menos utilizado do que o segundo entre os especialistas; e ninguém diz que quer para o jantar merluccius merluccius com molho tártaro. 8.5 Antonímia As palavras da mesma classe lexical com formas diferentes e sentidos opostos chamam-se antónimos, designando-se pór antonímia a relacäo semäntica entre elas (cf. alto e baixo, despedir e contratar, macho e femea, noite e dia, entre muitos outros). A natureza semäntica da oposicäo que é estabelecida entre palavras antónimas pode assumir várias formas, das quais destacamos quatro classes principals. -t- Antonímia complementar Os antónimos complementares säo aqueles que instanciam uma relacäo que só possui dois pontos de oposicäo possíveis, isto é, em que os dois antónimos těm um senrido incompatível entre si e se excluem mutuamente. Neste caso, uma enti-dade que pode ser descrita por um deles näo o pode ser pelo outro. Para alem disso, näo exisťem valores intermédios entre os conceitos opostos. É este o caso, p.e., de adjetivos como par/ímpar, existente/inexistente e vivo/morto (no sentido literal, näo metafórico, destes dois Ultimos termos - cf. Nota 12). Ou seja, a negacäo de um implica a aůrmacao do outro: um numero natural é par ou ímpar, uma pessoa está viva ou morta, etc. Devido ao facto de näo existirem estados intermédios entre dois antónimos complementares, estes näo podem combinar-se com advérbios que especificam grau ou intensidade variável, tais como muito, pouco, mais, menos ou bastante: cf. *ele está muito/pouco morto, *a água é mais inexistente em Martě do que na Terra ou *este numero é bastante ímpar (mas cf. Nota 12). ❖ Antonímia de grau Os antónimos de grau säo aqueles que se deůnem numa escala contínua com pontos intermédios entre dois extremos opostos; säo exemplos pares de adjetivos como quente/pio, molhado/seco, fácil/difícil, novo/velho, limpo/sujo, sóbrio/běbedo, curto/longo, alto/baixo, puro/impuro, amar/odiar, rir/chorar, longe/perto. Estes antónimos podem combinar-se com advérbios que especificam grau ou intensidade: cf. o chäo está muito molhado. é mais difícil sobreviver em Martě do que na Terra, ele está bastante bébedo. etc. Neste tipo de antonímia, existem com frequéncia palavras que remetem para estados intermédios, tais como morno (estado entre quente e /no), húmido (estado entre molhado e seco), ou gostar e detestar (par de antónimos situados entre os antónimos mais extremos amar e odiar). Nalgumas escalas existe mais do que um termo aplicável aos seus pontos intermédios. Assim, na escala de temperatura, tem-se gelado, frio, fresco, morno, quente, tórrido. Nem sempře é claro em que ponto ANTONIMIA 8.5 da escala se encontram tais palavras, mas estas escalas contrastam claramente com as dos antonimos complementares, onde nao existem termos intermedios entre os dois antonimos12. -s- Antonimia reversfvel Os antonimos reversiveis denotam extremos opostos de uma escala espacial, como o par dentrolfora, e podem envolver movimento, orientacao ou localizacao, de tal modo que as entidades a que se aplicam podem "circular" de modo continuo pelos varios pontos da escala espacial num sentido ou noutro, como ilustram os pares expan-dir/encolher, abrir/fechar, tirar/por e subir/descer. Assim, p.e., a acao de abrir uma porta pode ser invertida na acao de a fechar, o inverso de estar dentro e estar fora (e as duas situacoes sao reversiveis), depois de enrolar uma corda e possivel desenrola-la, etc. Os antonimos reversiveis sao semelhantes aos antonimos de grau, na medida em que admitem termos de comparacao ou intensidade: cf. um elevador subiu mais do que o outro ou o camido estd mais dentro da garagem do que fora. Muitos verbos criados pelo prerixo des- sao antonimos reversiveis da forma correspondente sem o prefixo, tais como atar/desatar, apertar/desapertar, enrolar/desenrolar e ligar/desligar. ❖ Antonfmia relacional Os antonimos relacionais denotam uma mesma situacao, mas a partir de uma perspetiva oposta. Por exemplo, os verbos dar e receber remetem ambos para uma acao de transferencia, mas ao passo que dar representa a transferencia a partir da perspetiva de quern da, receber representa-a a partir da perspetiva de quem recebe. Ou seja, para uma determinada situacao particular, quer se use dar quer se use receber, estao envolvidos os mesmos intervenientes, com os mesmos papeis tematicos (fonte e destinatario), ainda que a funcao gramatical das expressoes que representam esses papeis tematicos nao sejam as mesmas: assim, a frase o Pedro deu um beijo a Leonor e a frase a Leonor recebeu um beijo do Pedro representam a mesma situacao. De uma forma mais geral, 'x dar algo a / implica 'y receber algo de x', e vice-versa (relativamente a uma determinada situacao). Outros exemplos de antonimos relacionais sao ensinar/aprender, empregado/patrdo, professor/aluno, como se pode ver em pares de frases que exprimem essencialmente a mesma situacao, tais como o Bruno e empregado do Carlos e o Carlos epatrao do Bruno. O verbo alugar e interessante a este respeito, pois pode expressar duas perspe-tivas diferentes sobre uma situacao. De facto, este verbo tan to pode denotar o ato de ceder a outrem o direito ao uso de um bem movel ou imovel, com contrapar-tidas financeiras, como o ato de adquirir o direito a usar esse bem, mediante um pagamento: cf. o Jodo alugou a casa a Maria, que tanto pode significar que o Joao, enquanto senhorio, cedeu a Maria o direito de usar uma determinada casa (provavel-mente a sua) mediante um pagamento, como pode significar que o Joao, enquanto inquilino, adquiriu da Maria o direito de usar uma determinada casa (provavelmente propriedade da Maria). Assim, este verbo e polissemico entre duas interpretacoes que estao associadas entre si por uma relacao de antonimia relacional. 12 Num sentido nao literal, nguiativo ou metaforico, alguns antonimos complementares podem ser usados como antonimos de grau e combinar-se com adverbios de grau. E este o caso, p.e., do par vivo/morto. Assim, e possivel dizer essa pessoa estd [mais morta do que viva/meio morta}. 8.6 ORGANIZACÁO DO LÉXICO Hiponímia-hiperonímia Frequentemente, palavras que pertencem á mesma area semántica encontram--se relacionadas entre si em termos da maior ou menor especificidade do seu sentido. Por exemplo, o item azul é mais especíůco e, logo, mais informativo do qtie o item cor, por denotar um tipo particular de cor; azul claro é mais especíůco e informativo do que azul por denotar um tipo particular de azul, e assim sucessivamente. Estas relacoes sáo chamadas relacoes de hiponímia-hiperonímia. Assim, azul claro é hipónimo de azul e azul é hipónimo de cor. Inversamente, azul é hiperónimo de azul claro e cor é hiperónimo de azul. Para dar outro exemplo de uma area semántica dif erente, mac a ou pera sáo hipónimos de fruta, e este termo é hiperónimo daqueles. A relacáo logica entre um hipónimo e o seu hiperónimo é a de inclusao. Assim, do ponto de vista extensional, a classe (ou conjunto) de entidades denotada por um hiperónimo contém (ou inclui) a classe (ou conjunto) de entidades denotada pelo hipónimo. Assim, p.e., a classe das entidades coloridas contém a classe das entidades azuis, a classe das frutas contém a classe das peras, etc. Inversamente, do ponto de vista intensional, os conceitos que formám o sentido de um hipónimo formám uma classe mais abrangente, rica e informativa do que a classe de conceitos que formám o sentido do hiperónimo. Assim, p.e., o sentido de azul contém náo só a nocáo de cor, como a nocáo adicional que tem a ver com uma determinada localizacáo no espetro das ondas luminosas; o sentido de maca inclui o sentido de fruta mais uma série de propriedades que individualizam as macas relátivamente ás peras, ás uvas, etc. As relacoes de hiponímia e hiperonímia sáo simétricas (mudando os predicados): sempře que x é hipónimo de y, y é hiperónimo de x, e vice-versa; p.e., azul é hipónimo de cor e cor é hiperónimo de azul. Geralmente, um hiperónimo possui mais do que um termo hipónimo. Assim, todas as palavras que designam cores particulares sáo hipónimas do termo cor. amarelo, branco, castanho, cor-de-rosa, laranja, preto, verde, etc. As palavras que partilham o mesmo hiperónimo sáo chamadas co-hipónimas. Assim, p.e., as relacoes de hiponímia/hiperonímia do termo cor instanciam uma hierarquia de palavras ilustrada (de modo incompleto) em (11): (11) hiperónimo cor !_(_^_rJ_^_^_^_[ azul branco castanho preto roxo verde vermelho azul claro azul escuro co-hipónimos A mesma palavra pode entrar numa relacáo de hiponímia com mais do que um termo da mesma area semántica, numa organizacáo hierárquica articulada em níveis HIPONÍMIA-HIPERONÍMIA 8.6 201 distintos; assim, p.e., azul claro é um hipónimo indireto de cor, visto que é hipó-nimo direto de azul, e, por sua vez, azul é hipónimo direto de cor. Em alguns casos, a hierarquia de hiponímia/hiperonímia que se estabelece é relativamente complexa, como, p.e., a de canídeo, que se apresenta a seguir: (12) hiperónimo canídeo cäo chacal coiote lobo raposa caniche pastor alemäo perdigueiro podengo rafeiro säo-bemardo co-hipónimos O termo canídeo, por sua vez, faz parte de uma hierarquia muito mais vasta (canídeo é hipónimo de mamífero, e esta palavra, por sua vez, é hipónimo de animal). Existem vários critérios que permitem a identificacäo de um par de palavras relacionadas desta forma. Assim, é possível dizer que existe uma relacäo de hipo-nímia entre um par de palavras (aqui simbolizadas como "x" e "y") se estas näo forem sinónimas e se a verdade de a é x implicar necessariamente a verdade de a é y. Este critério baseia-se no facto de um hipónimo remeter para um conceito mais específico do que o seu hiperónimo. Assim, p.e., se for verdade que o Rex é um caniche, é também necessariamente verdade que é um cäo, visto que caniche é um hipónimo de cäo. É, assim, possível comprovar em (12) que caniche é um hipónimo de cäo13. Um outro critério para a identificacäo de hipónimos/hiperónimos resulta da impossibilidade de coordenar um hipónimo com um hiperónimo (cf. (13a)), contrariamente ä coordenacäo de dois co-hipónimos (cf. (13b)) ou de dois termos que se situem em ramificacöes distintas de uma hierarquia de hiponímia--hiperonímia (cf. (13c)). (13) a. #Eu tenho em casa um caniche e um cäo. b. Eu tenho em casa um caniche e um pastor alemäo c. Eu tenho em casa um cäo/caniche e um {gato/gato siamés}. A estranheza de (13a) deve-se ao facto de uma estrutura de coordenacäo de sin-tagmas nominais representar normalmente um conjunto de entidades distintas, cada uma correspondendo a um dos termos coordenados. Em (13b,c), a coordenacäo exprime um conjunto com dois animais distintos, mas em (13a) isso näo 13 E fácil para o leitor verificar que as relac Oes de implicacäo inversas, i.e., de hiperónimo para hipónimo, näo se verificam. Se Rex é um mamífero, näo é necessariamente um canídeo, se é um canídeo, näo é necessariamente um cäo, e assim poi diante. 202 8.6 ORGANIZACÁO DO LÉXICO acontece, visto que todos os caniches sáo caes. Naturalmente, se mais informacao for acrescentada ao termo coordenado um cao, entao a frase tornar-se-á aceitável: cf. eu tenho em casa um caniche e um cao rafeiro. Ou seja, nesta frase a coordenacáo é possível porque caniche é co-hipónimo de cao rafeiro. Embora a relacao de hiponímia/hiperonímia seja usualmente bastante intuitiva, nalguns casos náo o é. Por exemplo, há uma diferenca subtil entre as palavras pássaro e ave, que se reflete no contraste entre as duas frases de (14): (14) a. Todos os pássaros sáo aves. b. #Todas as aves sao pássaros. O exemplo (14b) é estranho porque a palavra ave é um termo genérico usado para qualquer ser bípede com o corpo coberto de penas, com asas e bico, ao passo que a palavra pássaro é um termo mais especíůco, que é usado para qualquer ave capaz de voar. Assim sendo, pássaro é hipónimo de ave, o que torna ilegítima a relacáo de inclusáo expressa por (14b). Nem todos os co-hipónimos de um hiperónimo estáo em pé de igualdade. Alguns sao melhores representantes do que outros da categoria representada pelo hiperónimo, sendo, por isso, considerados prototípicos (sobre esta nocáo, cf. a introducao a este capítulo). Por exemplo, quando um falante do portugués pensa na palavra ave, há vários co-hipónimos que se apresentam como representantes mais naturais desta classe (águia, andorinha, canário, pardal, pombo, etc.) e outros que se apresentam como representantes menos óbvios (faisáo, galinha ou pinguim). Da mesma forma, se for pedido a alguém que enumere exemplos de cores, é mais provável que azul, vermelho e amarelo sejam enunciados antes de cores como bege, magenta ou lilás. Embora todos estes termos sejam exemplos de cor, alguns sáo hipónimos mais salientes na organizacao do léxico mental dos falantes do portugués. A divisáo dos co-hipónimos em prototípicos e nao prototípicos pode ter conse-quéncias linguísticas a nível lexical. Para dar um exemplo, o nome coletivo cardume denota um grupo de peixes nadando em proximidade, e pode ser especiůcado pela espécie particular de peixes que formám o cardume (p.e., cardume de sardinhas). No entanto, é relativamente estranho falar de um cardume de tubaroes, pelo facto de os tubaroes nao representarem exatamente o protótipo de um peixe. De facto, de modo geral, na nossa cultura, as classes prototípicas de peixes sao aquelas cujos membros sao animais comestíveis de porte relativamente pequeno (sardinhas, pescadas, linguados, carapaus, etc.). Ora, sáo precisamente os nomes destas classes que, também tipicamente, se aceitam como complementos do coletivo cardume. Repare-se que isso nada tem a ver com o facto de os tubaroes nao nadarem em grupo (os tubaroes-martelo, na realidade, deslocam-se frequentemente em grupo), mas apenas com a aplicabilidade ou nao aplicabilidade linguística do nome da classe ao nome coletivo. Naturalmente, também nesta area, falantes diferentes těm intuicoes diferentes, dependendo da cultura ou subcultura na qual estáo integrados, do seu conhecimento e da sua experiéncia. Existem certas relacoes de inferéncia logica entre assercoes contendo hipónimos e hiperónimos, que variam consoante o tipo de predicado. Por exemplo, verbos como detestar implicam que se for verdade que x detesta y, entáo é necessariamente HIPONIMIA-HIPERONIMIA 8.6 203 verdade que x detesta todos os hipönimos (diretos ou indiretos) de y. Este padräo de inferencias e ilustrado abaixo, em que as frases de (16) säo verdadeiras sempre que a frase (15) for verdadeira, isto e, em que a assercäo ele detesta cäes implica que ele detesta todos os tipos de cäes, como se exemplifica em (16): (15) Ele detesta cäes. (16) a. Ele detesta caniches. b. Ele detesta galgos. c. Ele detesta cachorros. Repare-se que detestar näo permite inferencias do hiponimo para o hiperonimo. Se a frase (17a) e verdadeira, näo e necessärio que a frase (17b) tambem seja verdadeira: (17) a. Ele detesta caniches. b. Ele detesta cäes. Outros verbos, como os verbos de percecäo (ouvir, ver, etc.) ou os verbos que denotam uma acäo em que o complemento direto e urn paciente afetado (afagar, alimentär, comprar, fotografar, vacinar, etc.) permitem a inferencia inversa. Tomando ver como verbo representativo, se for verdade que x viu y, entäo näo e obrigatoria-mente verdade que x viu todos os hipönimos de y. Assim, o facto de a frase (18) ser verdadeira näo implica que as frases de (19) o sejam: (18) Ele viu cäes no jardim. (19) a. Ele viu caniches. b. Ele viu galgos. c. Ele viu cachorros. Pelo contrario, verbos como ver permitem a inferencia do hiponimo para o hiperonimo, ao contrario de detestar. Assim, a verdade da frase (20) implica a verdade das frases de (21): (20) Eu vi um cäo. (21) a. Eu vi um canideo. b. Eu vi um mamifero. c. Eu vi um animal. A diferenca entre os verbos de percecäo e de acäo (como ver, afagar, alimentär, etc.) e os verbos de atitude afetiva (como detestar, odiar, etc.) relativamente äs suas inferencias hiponimicas e hiperonimicas reside na forma como se combinam semanticamente com o seu complemento direto. Em ver cäes, p.e., o verbo aplica-se a um conjunto de entidades na extensäo do substantivo cäo (por outras palavras, ver cäes significa 'avistar seres que säo cäes'). Como um cäo e, por definicäo, um canideo, um mamifero e um animal (ou seja, o nome cäo e caracterizävel pelas pro-priedades semänticas 'canideo', 'mamifero' e 'animal'), e possivel, a partir de 'ver cäes', inferir 'ver canideos', 'ver mamiferos' e 'ver animais'. Contudo, a inferencia näo "desce" na hierarquia dos hipönimos (como caniche, p.e.: se vejo um cäo, näo 204 8.6 ORGANIZACÄO DO LÉXICO vejo necessariamente um caniche), visto que estes contém especificacôes semänti-cas adicionais que näo estäo contidas no hiperónimo. Em contrapartida, em detestar cäes, o verbo aplica-se ä intensäo do substantivo cäo, ou sej a, ao conjunto de propriedades que compôem o sentido desse substantivo. Assim, detestar cäes signinca 'ter urna opiniäo negativa em relacäo äs propriedades que fazem uma entidade ser um cäo'. Por inferéncia, essa atitude afetiva estende-se a todos os seres denotados por palavras que säo hipónimos de cäo (caniches, pasto-res alemäes, cäes rafeiros, etc.), visto que todas elas säo caracterizáveis pela proprie-dade 'cäo'. Contudo, a atitude näo "sobe" na hierarquia dos hiperónimos (como, p.e., canídeo ou mamífero), visto que estes näo se caracterizam pela propriedade 'cäo' (odiar cäes näo implica que se odeiem lobos ou baleias). Verbos como odiar, proibir, respeitar e temer comportam-se da mesma forma que detestar. Este facto näo é surpreendente, pois alguns destes verbos estäo eles próprios relacionados com outros por meio de urna relacäo paralela ä de hiponí-mia/hiperonímia nos nomes, relacäo usualmente referida como troponímia. Esta relacäo existe entre verbos que denotam eventos mais gerais (sobreordenados) e verbos que denotam eventos mais específicos (subordenados). Pode dizer-se, por exemplo, que essa relacäo existe entre andar e coxear, pois coxear pode ser definido como 'andar de um modo específico/particular' (cf. Barreto 2002). Os verbos desgostar, detestar e odiar denotam um mesmo tipo de sentimento, embora com diferentes intensidades. Assim, sempre que a proposicäo 'x odeia y' é verdadeira, entäo a proposicäo 'x detesta y' também o é, mas näo vice-versa: 'x detesta y' näo implica 'x odeia f. Em (22) e (23) ilustram-se duas hierarquias de hipónimos verbais (isto é, de relacôes de troponímia): (22) abrir arrombar entreabrir escancarar (23) ver assistir contemplar mirar observar Como o hiperónimo e os seus hipónimos partilham parte do seu sentido, mui-tos processos lexicais aplicam-se tanto ao hiperónimo como aos seus hipónimos, diretos ou indiretos. Por exemplo, a relacao de polissemia regular, discutida acima (cf. 8.3.2), observa-se de uma forma sistemática em todos os hipónimos de um hiperónimo. Assim, tanto recipiente como os seus hipónimos exibem dois sentidos polissémicos relacionados, o de 'utensílio' (cf. amolguei o recipiente) e o de 'capaci-dade' (cf. entornei o recipiente). Os hipónimos colher, copo, panela ou tacho possuem o mesmo tipo de polissemia observado no hiperónimo, como o leitor pode facil-mente observar. MERONÍMIA-HOLONÍMIA 8.7 205 Também os hipónimos de um verbo tipicamente partilham parte do sentido do seu hiperónimo. Assim, p.e., todos os hipónimos de abrir em (22) selecionam o mesmo tipo de argumentos, combinam-se com o mesmo tipo de adjuntos adverbiais e podem ocorrer no mesmo tipo de estruturas, como exemplificado em (24) e (25): (24) Ele {abriu/arrombou/entreabriu/escancarou} a porta com um tijolo. (25) Ele {abriu/arrombou/entreabriu/escancarou} rapidamente a porta. No entanto, um hipónimo verbal pode impor mais restricöes do que o seu hiperónimo. Por exemplo, abrir permite exprimir a duracäo do estado resultante da acäo através de um adjunto adverbial introduzido por durante (cf. a frase (26a), que signiůca que a janela esteve aberta durante cinco minutos depois de ter sido aberta); em contrapartida, arrombar apenas exprime a acäo em si mesma, näo permitindo exprimir a duracäo do estado resultante (cf. a estranheza de (26b)). Repare-se que arrombar, no entanto, permite exprimir a duracäo da propria acäo, através de um adjunto adverbial introduzido por em (cf. (26c)): (26) a. Ele abriu a janela durante cinco minutos. b. #Ele arrombou a janela durante cinco minutos. c. Ele arrombou a janela em cinco minutos. Caso semelhante ocorre com matar e assassinar. Tal como é ilustrado em (27), o hiperónimo matar näo requer um agente volitivo ou humano, contrariamente ao hipónimo assassinar. Por essa razäo, (27b) é semanticamente anómalo: (27) a. O maremoto matou Abel. b. #0 maremoto assassinou Abel. 8.7 Meronímia-holonírriia Um merónimo é uma palavra que denota uma parte incluída num todo maior. O termo que denota esse todo, por sua vez, chama-se holónimo. Por exemplo, as palavras capa, contracapa e página säo merónimos de livro e, inversamente, livro é holónimo dessas palavras. O verbo ter pode ser usado para exprimir a relacäo de meronímia-holonímia, sendo o sujeito o holónimo e o complemento o merónimo: cf. o livro tem muitaspáginas (página é merónimo de livro), a cidade tem várias avenidas (avenida é merónimo de cidade), a casa tem um telhado (telhado é merónimo de casa), o júri tem cinco membros (membro é merónimo de júrí), um dia tem vinte e quatro Horas (hora é merónimo de did), etc. Um dos aspetos distintivos desta relacäo é o facto de a entidade designada por um merónimo näo estar necessariamente presente como uma parte de todas as entidades designadas pelo holónimo. Por exemplo, índice é um merónimo de livro, embora näo seja necessariamente verdade que todos os livros tém um indice. Um segundo aspeto desta relacäo é o facto de se poderem estabelecer estruturas relacionais complexas, pois uma palavra pode ter mais do que um merónimo e mais do que um holónimo. Por exemplo, livro tem como merónimos capa, contracapa e página, e tem como holónimos coletänea (no sentido de 'colecäo de livros 1 206 8.7 ORCANIZACAO DO LÉXICO de um mesmo autor, ou com o mesmo terna') e biblioteca (conjunto ordenado de livros possuídos por uma entidade). Da mesma forma, cada um destes merónimos e holónimos pode ter os seus próprios merónimos e holónimos. Assim, a palavra página (no sentido do conjunto de texto escrito) tem como merónimo parágrafo, que, por sua vez, tem como merónimo linha, e assim por diante, até caráter. Para alem disso, um merónimo pode ter mais do que um holónimo em campos semánticos diferentes. Por exemplo, a palavra janela é um merónimo de variadas palavras, incluindo meios de transporte (autocarro, camido, carro, metro, etc.) e edificacóes (cabana, casa, prédio, etc.). Em todos estes casos, uma parte integral que consiste numa abertura com uma determinada forma e disposicáo, ou no revestimento dessa abertura, é chamada janela. Existem várias classes de meronímia-holonímia, que passamos a descrever mais detalhadamente. ♦> Meronímia quantitativa Na meronímia quantitativa, a relacao parte-todo liga uma porcao arbitrária a um todo sem partes distintas intrínsecas. Por exemplo, uma melancia náo possui partes integrals distintas, como sao, por exemplo, os gomos de um citrino. Contudo, um corte de parte de uma melancia é referido pelo nome talhada. Este termo requer uma forma específica (por exemplo, um cubo de melancia nao é uma talhada) e requer um determinado tipo de holónimo (ver abaixo): um corte de queijo exatamente com a mesma forma e dimensao nao é referido como talhada, mas sim como fatia. Em geral, classes de alimentos possuem termos especíůcos que referem as porcóes respetivas, como se ilustra em (28) (cf. também o Cap. 21): (28) a. talhada - melancia, meláo, meloa, abóbora b. fatia - bolo, tarte, queijo, pao c. naco - pao, came, presunto d. posta - peixe e. bife - vaca, porco, frango, peru <♦ Meronímia integral Na meronímia integral ou estrutural (cf. Cap. 21), a parte é integral, individua-lizável, com funcoes próprias e claramente distinta do todo onde está inserida. É este o caso, por exemplo, de partes e pecas, e o respetivo mecanismo onde estas se inserem. Alguns exemplos sao dados em (29): (29) a. asa - chávena b. asa - pássaro c. gomo - laranja d. dedo - mao ou pé e. manga - camisa, vestido, blusa f. gargalo - garrafa g- tronco - árvore h. trinco - fechadura i. parede - casa i MERONÍMIA-HOLONÍMIA 8.7 207 *> Meronímia inclusiva Na meronímia inclusiva, a relacáo parte-todo liga uma entidade autonoma, com a sua propria identidade, a uma colecao. Por exemplo, uma floresta é formada por árvores, uma alcateia é formada por lobos, etc. Por outras palavras, a meronímia inclusiva estabelece uma ligacáo entre nomes coletivos (ou grupais) e os nomes que designam as entidades que compoem esses coletivos. Apresentam-se alguns exemplos em (30): (30) a. lobo - alcateia b. árvore - floresta c. eucalipto - eucaliptal d. sobreiro - montado e. porco - vara f. osso - esqueleto g- tecla - teclado h. peixe - cardume Em muitos casos, o sentido do nome que representa o holónimo náo se reduz a uma versao plural do sentido do nome que representa o merónimo. Assim, p.e., uma alcateia nao é simplesmente um conjunto de lobos, visto que inclui também a ideia de uma hierarquia bem definida no grupo; e uma floresta nao é simplesmente qualquer conjunto de árvores (um conjunto de árvores arrancadas do cháo e empilhadas num armazém nao é uma floresta). Á semelhanfa do que se exempliůcou em (28), alguns nomes coletivos náo possuem só um merónimo: p.e., uma manada pode ser formada por vários tipos de animal de grande porte (bovinos, equinos, paquidermes, etc.). ❖ Meronímia material Na meronímia material, a relacáo parte-todo liga uma substáncia ingrediente (tipi-camente expressa por um nome náo contável, ou massivo; cf. Caps. 21 e 25) a uma substáncia mais complexa. Por exemplo, álcool é um merónimo material de vinno porque é um dos seus ingredientes necessários, mas náo uma parte distinta, dis-cernível e funcional, do vinho (contrariamente, p.e., ao volante de um carro). Ou seja, o sentido da palavra vinho de alguma forma implica um componente - entre outros - denotado por álcool. Apresentam-se outros exemplos em (31): (31) a. acúcar-doce b. limáo - limonáda c. ginja - ginjinha d. gema - gemada e. nitroglicerina - dinamite f. carne - bife Note-se que as relacóes de meronímia podem entrelacar-se. Por exemplo, carne é um merónimo material de bife, o qual, por sua vez, é um merónimo quantitative de vaca, porco ou peru. Na maior parte destes exemplos, a substáncia designada pelo merónimo é um fator necessário para se poder utilizar o holónimo correspondente como nome da 208 8.8 ORCANIZACÄO DO LÉXICO substancia complexa. Por exemplo, näo existe ginjinha sem ginja, dinamite sem nitroglicerina, ou limonáda sem limôes. É interessante notár, no entanto, que isso näo acontece em relacäo a todos estes pares. Devido a determinados desenvolvi-mentos tecnológicos, existe hoje em dia café sem cafeína (também designado por déscafeinado) e cerveja sem álcool; assim, em casos particulares, cafeína näo é um merónimo de café, nem álcool um merónimo de cerveja. ♦> Meronímia de subatividade Na meronímia de subatividade, a relacäo parte-todo liga uma acäo a outra acäo na qual a primeira está incluída. Por exemplo, pagar é uma atividade que faz parte de uma atividade mais complexa, referida como comprar; outros casos säo exem-plificados em (32): (32) a. falar - entrevistar b. mastigar - comer c. focar - fotografar É importante notár que pagar e comprar näo estäo relacionados através de hiponímia-hiperonímia. As duas palavras pertencem a áreas semänticas distintas, embora estejam relacionadas pela meronímia de subatividade. Repare-se que a subatividade designada pelo merónimo näo se encontra neces-sariamente presente em todas as atividades ou situacôes designadas pelo holónimo. Por exemplo, näo é necessário focar para fotografar, falar para entrevistar, ou mastigar para comer (cf. a expressäo de censura näo comas sem mastigar!). Em certos casos, o merónimo e o holónimo de subatividade säo palavras homó-fonas: cf., por exemplo, pintar ('aplicar tinta em alguma coisa' e 'criar uma pintura') e escrever ('inserir caracteres numa página' e 'criar um texto')- ♦> Meronímia espacial A meronímia espacial é um tipo de meronímia em que a relacäo parte-todo liga urna área espacial a uma outra, mais abrangente, e em que as fronteiras entre as duas áreas säo algo subjetivas. Ou seja, informalmente, x é merónimo espacial de y se x é urna subárea de y. Por exemplo, baixa é uma subárea de urna cidade densamente urbanizada, ainda que as suas fronteiras possam näo ser completamente definidas. Em (33) säo dados alguns outros exemplos de meronímia espacial. (33) a. oásis - deserto b. palma - mäo c. lombo - dorso d. testa - face e. nuca - cabeca f. cume - - montanha 8.8 Relacóes proposicionais Nem todas as propriedades semänticas lexicais tém a ver com relacóes entre palavras. Algumas destas propriedades manifestam-se em inferéncias que envolvem RELACÖES PROPOSICIONAIS 8.8.1 209 unidades frásicas, e tem a ver, em particular, com a relacao que se estabelece entre um predicador (cf. Cap. 11) e os seus argumentos. Nesta seccao, descrevem-se trés relacoes que tem sido particularmente estudadas na literatura da Logica e da Semán-tica: a simetria, a reflexividade e a transitividade. 8.8.1 Relacóes e predicadores simétricos Com a maioria dos predicadores que selecionam dois argumentos (i.e., os predicadores de dois lugares; cf. Cap. 11), a ordem dos argumentos nao é reversível. Assim, p.e., mantendo constante a referéncia dos nomes, a frase a Joana gosta do Vasco tem um signi&cado diferente do da frase o Vasco gosta da Joana. Em particular, nao se pode inferir a verdade de qualquer uma delas a partir da verdade da outra (ou sej a, a Joana pode perfeitamente gostar do Vasco sem que o Vasco goste da Joana e vice-versa). No entanto, existem predicadores de dois lugares que admitem uma tal reversi-bilidade, i.e., em que uma frase que corresponda ao esquema proposicional axb implica a frase que corresponde ao esquema b x a e vice-versa (a eb representam argumentos, x representa o predicador)14. Assim, em (34a-c), a primeira frase implica a segunda e vice-versa: (34) a. O Vasco casou(-se) com a Joana. = A Joana casou(-se) com o Vasco. b. A Idalina é vizinha da Beatriz. = A Beatriz é vizinha da Idalina. c. O Manuel é irmao da Maria. = A Maria é irmá do Manuel. Dizemos entao que casar(-sé) (com), (ser) vizinho (de) e (sef) irmao/á (de) sao predicadores simétricos. Como se observou acima, a maioria dos predicadores sao nao simétricos, como, p.e., os verbos beijar, gostar (de), ver e o nome amigo (de). Assim, a frase o Vasco viu a Ana nao implica necessariamente a frase a Ana viu o Vasco; e o Pedro pode ser amigo do Paulo sem que o Paulo seja necessariamente amigo do Pedro. Muitas línguas possuem uma construcao gramatical que torna um predicador nao simétrico num predicador simétrico: nomeadamente, a chamada construcao recíproca. Nesta construcao, os argumentos a e b constituem os dois termos de um sujeito coordenado, e no predicado ocorre o adjunto adverbial "de reciprocidade" um + preposicao + o outro (um do outro, uns com os outros, etc.), como se ilustra em (35) (cf. Caps. 13 e 41)15: (35) a. O Vasco e a Joana beijaram-se (um ao outro). b. A Idalina e a Beatriz gostam uma da outra. c. O Manuel e a Maria viram-se (um ao outro). d. O Pedro e o Paulo sao amigos (um do outro). 14 As relacöes de implicacäo descritas nesta subseccäo e nas seguintes estabelecem-se näo entre as frases enquanto entidades gramaticais, mas sim entre as proposicöes expressas por essas frases (cf. Cap. 11). Para näo sobrecarregar a exposicäo, no entanto, usamos o termo "frase" em vez de "proposicäo", pedindo ao leitor que faca o ajuste relevante. 15 Se o predicador e um verbo transitivo, este e necessariamente "conjugado" com o pronome se e o adjunto de reciprocidade e opcional, como em (35a, c); quando o predicador e um nome, o adjunto e igualmente opcional, como em (3Sd). Na coordenacäo, os termos tambem säo reversrveis: comparar (35a) com a Joana e o Vasco beijaram-se (um ao outro), etc. 210 8.8.2 ORGANIZACÄO DO LEXICO Os predicadores simetricos tambem podem ocorrer nesta construcäo, como se ilustra em (36) (comparar com (34)): (36) a. O Vasco e a Joana casaram (um com o outro). v b. A Idalina e a Beatriz säo vizinhas (uma da outra). c. O Manuel e a Maria säo irmäos (um do outro). Existem predicadores, chamados assimetricos, que, por razöes logicas, nunca permitem uma inferencia de simetria, como pai (de), mais alto (do que), entre outros. Comestes, obviamente, nemasfrasescomoesquemaproposicionalaxb säoequi-valentes äs frases com o esquema b x a (cf. (37a)), nem e possivel construir uma fräse reciprocabem formada semanticamente (cf. (37b)): (37) a. O Eduardo e pai do Manuel. (* o Manuel epai do Eduardo) b. #0 Eduardo e o Manuel säo pais um do outro. 8.8.2 Relacöes e predicadores reflexos Quando os dois argumentos de um predicador de dois lugares referem a mesma enti-dade, obtem-se uma fräse reflexa. Em portugues, estas frases contem uma so ocorrencia do argumenta, com a funcäo de sujeito, e no seu predicado ocorre um adjunto adverbial "de reflexividade", preposicäo + si proprio ou preposicäo + si mesmo (e suas varian-tes morfologicas em genero e nümero), como se ilustra em (38) (cf. Caps. 13 e 41)16: (38) a. O doente lavou-se (a si proprio). b. O Pedro näo gosta de si mesmo. c. A Maria e amiga de si propria. A verdade destas frases e, obviamente, contingente, ou seja, näo e necessariamente verdadeiro que um doente se lave a si proprio, nem que o Pedro de que se fala goste de si mesmo, nem que a Maria que eu conheco seja amiga de si propria. No entanto, existe um pequeno nümero de predicadores com os quais, por motivos lögicos, as frases reflexas säo necessariamente verdadeiras, qualquer que seja o contexto. Ou seja, com estes predicadores, chamados predicadores reflexos, o esquema proposicional axa(a designa os argumentos, x o predicador), linguis-ticamente expresso por uma fräse reflexa, e sempre verdadeiro. A maioria, se näo a totalidade, dos predicadores reflexos representa relacöes de identidade ou de igual-dade: cf. o Joäo e igual a si proprio, a Maria e täo alta como ela propria, o Pedro tern a mesma idade que ele proprio. Por serem tautologias, estas frases säo geralmente sen-tidas como estranhas (e pouco informativas) pela maioria dos falantes. A maioria dos predicadores de dois lugares (lavar, gostar (de), amigo (de), etc.) säo näo reflexos; ou seja, como se observou acima, com eles as proposicöes que correspondem ao esquema axa säo apenas contingentemente verdadeiras. Final-mente, existem värios predicadores que, por razöes logicas, säo irreflexos; ou seja, 16 De novo, se o predicador e um verbo transitivo, este e necessariamente "conjugado" com o pronome "reflexo" sceo adjunto de reciprocidade e opcional, como em (38a). Em construcöes comparativas, em vez de uma preposicäo, ocorre uma conjuncäo-complementador (cf. os exemplos dois parägrafos a seguir, no texto). 1 RELACÖES PROPOSICIONAIS 8.8.3 com esses predicadores, as proposicöes representadas pelo esquema a x a nunca podem ser verdadeiras: cf., por exemplo, (ser) pai (de), (ser) mais alto (do que), etc. Tal como a construcäo recíproca torna um predicador näo simétrico num pre-dicador simétrico (cf. 8.8.1 e os exemplos em (35)), também a construcäo reflexa, acima ďescrita, torna um predicador näo reflexo num predicador reflexo (cf. (38)). Em portugués existem verbos inerentemente reflexos, como o verbo suicidar-se (cf. ele suicidou-se e a impossibilidade de *ele suicidou o Luis)17. Certos prefixos, como auto-, também Convertern um predicador näo reflexo num predicador reflexo, exi-gindo sempře o pronome clítico se: cf. ele autorrecriminou-se. Outros verbos säo convertidos em predicadores "reflexos" quando tem determinado tipo de comple-mentos. É o caso de abrir quando o seu complemento é uma expressäo que denota uma parte do corpo, como em abrir a mäo: numa fräse como o Joäo abriu a mäo, a mäo em questäo é necessariamente a da entidade referida pelo sujeito (neste caso, o Joäo). .3 Relacöes e predicadores transitivos Os predicadores transitivos18 säo aqueles que selecionam (pelo menos) dois argu-mentos e permitem a seguinte inferéncia: se as frases que correspondem ao esquema proposicional axbebxc säo ambas verdadeiras, entäo a fräse que corresponde ao esquema proposicional a x c também é verdadeira. Muitos dos predicadores que denotam relacöes espaciais, como conter, (estar) no interior (de), sobrevoar, säo transitivos. Por exemplo, se as frases (a) e (b) dos exemplos abaixo forem verdadeiras, entäo as frases (c) também o seräo19: (39) a. O baläo sobrevoa o helicóptero. b. O helicóptero sobrevoa o barco. c. O baläo sobrevoa o barco. (40) a. As joias estäo no interior da caixa. b. A caixa está no interior do cofre. c. As joias estäo no interior do cofre. A maioria dos predicadores säo näo transitivos, como beijar, colidir, empurrar, gostar (de), odiar, zangar-se (com), etc. Assim, se as frases (a) e (b) dos seguintes exemplos forem verdadeiras, nada implica que as frases (c) também o sej am, embora possam sé-lo, em determinadas situacöes: (41) a. O Carlos gosta da Ana. b. A Ana gosta do Pedro. c. O Carlos gosta do Pedro. 17 Paradoxalmente, e mau grado a presenga do pronome se, as frases com suicidar-se näo säo casos da construcäo reflexa: cf. a impossibilidade de "ele suicidou-se a si proprio. Este verbo combina-se "intrinsecamente" com se, tal como afundar-se, ajoelhar-se, queixar-se, etc. 18 E crucial referir aqui que a nocäo de transitividade discutida nesta subseccäo e de natureza lögico--semäntica, nada tendo a ver com a nocäo de transitividade sintätica caracterizada nos Caps. 11 e 28. 19 Para alem disso, e necessärio que a referencia dos argumentos seja a mesma nas tres frases, e que as situacöes descritas se integrem no mesmo "macroevento". Por exemplo, se o helicöptero mencionado em (39a) for diferente do que e mencionado em (39b), ou se (39a) e (39b) representarem eventos distintos espacial e temporalmente, e evidente que a inferenda transitiva näo se obtem. 212 8.8.3 ORGANIZACÁO DO LÉXICO (42) a. O carro colidiu com o jipe. b. O jipe colidiu com o muro. c. O carro colidiu com o muro. i Um predicador intransitivo, por sua vez, é aquele que nunca suporta qualquer inferěncia transitiva; por outras palavras, uma frase que corresponda ao esquema da inferěncia será sempře contraditória com as frases obedecendo ao esquema das premissas. Um exemplo é o predicador (ser) pai {de): se forem verdadeiras as frases o Pedro é pai do Luis e o Luis épai do Paulo, entao é necessariamente falsa a frase o Pedro épai do Paulo. No domínio espacial, o predicador (estar) (diretamente) ao lado (de) é igualmente intransitivo: assim, se a Maria estiver (diretamente) ao lado da Alexandra e a Alexandra estiver (diretamente) ao lado da Clara, a Maria náo pode estar (diretamente) ao lado da Clara. Contrariamente ás relacoes simétrica e reflexa, náo existe qualquer constru-cáo gramatical que torné um predicador náo transitivo num predicador transitivo. 9 PROCESSOS DE LEXICALIZAfÄO 215 9.1 Nocôes gerais sobre lexicalizacäo 217 9.2 Valores semänticos, classes iexicais ou gramaticais e valores funcionais das unidades multilexicais 221 9.3 Identificacäo das unidades multilexicais e afericäo dos seus graus de lexicalizacäo 223 9.3.1 Propriedades formais das unidades multilexicais 225 9.3.1.1 Piano paradigmático 225 9.3.1.1.1 Substituicäo lexical 226 9.3.1.1.2 Variacäo flexional 230 9.3.1.2 Piano sintagmático 232 9.3.2 Propriedades semänticas das unidades multilexicais 238 9.3.2.1 Uso das unidades multilexicais em linguas especializadas 241 9.3.3 Aspetos quantitativos das unidades multilexicais 244 9 PROCESSOS DE LEXICALIZACAO Existem, na lingua, sequéncias de palavras com comportamentos unitários ou tendencialmente unitários, isto é, semelhantes aos de uma palavra única, resultantes de conexoes formais e semánticas que se foram estabelecendo entre os seus elementos e que o uso consagrou (cf. dizer á boča cheia, de forma geral, a sua saúde, etc.). Essas sequéncias lexicalizadas sao aqui chamadas unidades multilexicais e ao processo da sua formacáo chamamos lexicalizacao1. A lexicalizacao é, pois, neste capítulo, defmida como um processo gradual de fixacao de sequéncias de palavras em grupos formal e semanticamente coesos, com um comportamento semelhante ao de uma unidade do léxico. Na formacao destes grupos, a coesao das palavras entre si pode tornar-se maior ou menor, dependendo, entre outros fatores, do momento mais ou menos recente em que se formaram e do seu grau de fixacao no uso. Entre os grupos que apresentam maior coesao, temos itens como lugar-comum = 'banalidade'; de se Ihe tirar o chapéu = 'excelente'; esticar o pernil = 'morrer'; por um triz = 'quase'; ainda que = 'embora'; de acordo com = 'conforme'; noutros grupos, o grau de coesao é menor, embora também se váo fixando no uso, por sérem muito recorrentes: cf. mania das grandezas, abandono escolar, absolutamente indispensável, passar fome, ficar a ganhar, fora de série, por mero acaso. Todas estas sequéncias seráo aqui global-mente consideradas unidades multilexicais2. 1 O termo "lexicalizacao" tem sido usado com vários sentidos, por vezeš muito abrangentes, como seja o da ciiacäo, em geral, de novos "lexemas" (cf. Lyons 1977), ou o da criacäo de palavras lexicais ou gramaticais, simples ou complexas, resultantes de mudancas morfológicas, sintáticas ou semánticas, ocorridas sobre palavras já existentes. Neste ultimo sentido, recobre processos morfológicos produtivos, como a composicäo e a derivacäo, e menos produtivos, como a conversäo, a reducäo, a abreviacäo ou a amalgáma. Outras vezes, o termo é usado num sentido muito restrito, como, p.e., o da especializacäo semäntica de uma palavra (cf. Downing 1977). Também há autores que chamam lexicalizacao ao processo de "desgramaticalizacäo", que se traduz na passagem de uma palavra gramatical a palavia lexical (plena), ou seja, o processo oposto ao da gramaticalizacäo (cf. Cap. 10 sobre processos de gramaticalizacäo). 2 Consideramos que estes grupos formam unidades multilexicais, independentemente da sua ortografia. Alguns constam de vocabulários e de dicionários com o estatuto de entradas autónomas e säo grafados com hífen. Mas é extremamente hesitante esta gratia, quer nos dicionários, quer na escrita corrente; assim, näo trataremos de modo diferente os grupos que alguns dicionários registam com entrada propria, ortografados com hífen (consagrando-os como unidades no léxico) e aqueles que näo säo habitualmente registados dessa maneira, sendo antes tratados no interior dos artigos dos dicionários, sob a entrada de um dos seus componentes. 216 9 PROCESSUS DE LEXICALIZACÄO Os compostos sintáticos (cf. Cap. 58) como desportos radicals, condomínio fechado ou cadeira de rodas podem ser vistos como expressöes sintáticas lexicalizadas, isto é, como unidades multilexicais. O mesmo acontece com as siglas, como PS, e os acrónimos, como ONU, que também těm na base da sua formacäo sequéncias lexicais de natureza sintagmática (respetivamente Partido Socialista e Organizacäo das Nagöes Unidas (cf. Caixa [2]). O processo de lexicalizacäo das unidades multilexicais é um processo gradual, näo regular e, em caso de forte grau de fixidez e coesäo semäntica dos seus elementos, o resultado final tem de ser defmido individualmente no dicionário, pois a expressäo, no seu sentido atual, näo é (ou já näo é) analisável semanticamente. Por exemplo, o sentido da expressäo meter os pés pelas mäos näo se deduz a partir do sentido dos elementos que a formám, sendo necessário defini-lo no dicionário como 'confundir-se, contradizer-se'. Quando a interpretacäo de uma expressäo é obtida a partir do significado dos elementos que a formám, diz-se que o seu significado é composicional (p.e., o significado da sequéncia ver um cäo é obtido a partir do significado das suas palavras constitutivas ver, um e cäo). Quando isso näo acontece, como sucede em meter os pés pelas mäos, diz-se que o significado da expressäo é näo composicional. Existem também muitas sequéncias com um menor grau de fixidez e de coesäo interna que säo incluídas, sem definicäo, nos dicionários que registam grupos de palavras usuais. Por exemplo, na entrada "consumo", estes dicionários podem incluir sequéncias como bens de consumo, sociedade de consumo, impróprio para consumo, consagradas pelo uso, e que, embora mantendo o significado literal de cada elemento e tendo uma interpretacäo composicional, adquiriram também, de acordo com a perspetiva aqui seguida, o estatuto de unidades multilexicais. Ä lexicalizacäo estäo associados processos de ůxacáo sintática, semäntica e pragmática que originam uma mudanca linguística; diz-se que há rotinizacäo quando as expressöes lexicalizadas que decorrem desses processos se tornám familiäres e rotineiras; um processo relacionado e mais avancado é o da instituciona-lizacäo, que ocorre quando säo aceites por toda ou por uma parte signiůcativa da comunidade linguística. Passam, entäo, a fazer parte do inventário lexical da lingua e, como tal, säo adquiridas e memorizadas pelos falantes (nativos ou näo) e inscritas nos dicionários. A lexicalizacäo, no sentido que aqui vamos desenvolver, processa-se ao longo do tempo. Existem sempře, em qualquer periodo da lingua, frases ou grupos ambíguos, que podem serusados quer como "sequéncias livres", i.e., interpretadas composicio-nalmente e contendo elementos sintática e semanticamente independentes, quer (em contextos diferentes) de uma forma na qual se observa um processo de lexicalizacäo, em que os seus elementos perderam parcial ou totalmente a independéncia sintática e semäntica, adquirindo, em maior ou menor grau, um caráter unitário. É o caso, por exemplo, da expressäo fazer a cama, que pode ser usada com a signi-ůcacao literal 'fabricar uma determinada peca de mobiliário' ou entäo, enquanto unidade multilexical, com o sentido de 'arranjar as roupas da cama' ou com o sentido de 'armar uma cilada' (cf. a discussäo desta unidade multilexical em 9.1). Este capítulo articula-se do seguinte modo: em 9.1 discutem-se nocöes gerais sobre lexicalizacäo; em 9.2 caracterizam-se as unidades multilexicais quanto äs areas NOCÓES CERAIS SOBRE LEXICALIZACAO 9.1 217 semánticas (e pragmáticas) em que ocorrem e quanto á sua classe e funcao grama-tical; em 9.3 classificam-se as unidades multilexicais de acordo com o seu grau de lexicalizacao e discutem-se as suas propriedades formais, semánticas e pragmáticas mais salientes. 9.1 Nocóes gerais sobre lexicalizacao A lexicalizacao cria unidades multilexicais cuja estrutura apresenta um maior ou menor grau de coesáo interna, falando-se, concomitantemente, de "lexicalizacao (mais ou menos) forte ou fraca". Revelam um forte grau de lexicalizacao as unidades multilexicais formadas por compostos morfossintáticos, como surdo-mudo, andar--modelo, peixe-espada, por grupos sintagmáticos3, como pés-de-galinha ou andar á nora, por siglas, como TV, por acrónimos, como sida, por formulas ritualizadas de saudacáo, como passou bem?, e de delicadeza, como se faz favor, e ainda por vários tipos de aforismos4, como mais vale prevenir do que remediar. A par destes exemplos com alto grau de unidade formal e semántica, observam--se também, muito frequentemente, outras coocorréncias sistemáticas de palavras, com menos coesáo interna, que mantém o sentido literal de alguns ou mesmo de todos os seus elementos e que formám uma unidade de uso (cf. fogo posto, estado lastimoso, politicamente correto ou induzir em erro). Estes grupos (considerados aqui também como unidades multilexicais) sáo chamados colocacoes, combinatórias ou coocorrentes privilegiados, termos que designam, assim, a tendéncia particular de certas palavras para ocorrerem em combinacáo com determinadas outras, em certos contextos5. [1] As unidades multilexicais těm recebido designacoes genéricas muito diversas e por vezeš conflituosas, como sejam, entre outras, "frases feitas, expressóes/frases estereo-tipadas/cristalizadas", "unidades multilexicais", "expressoes pluriverbais", "locucóes", "lexias complexas", "frasemas", "pragmatemas", "cliches", "idiomatismos", etc. Esta proliferacao terminológica e o uso de termos diferentes com o mesmo sentido em nada těm contribuído para clarificar as nocóes relacionadas com este terna. O que tém em comum estes diversos tipos de sequéncias de palavras é o facto de, em todas elas, se térem estabelecido progressivamente relacóes combinatórias (mais ou menos) fortes entre os seus elementos, relacoes essas que se foram con-solidando formal, semántica e pragmaticamente, em maior ou menor grau, dando origem a grupos (mais ou menos) fixos, mas muito recorrentes no uso, qualquer que seja o seu grau de fixidez. Todos eles sáo grupos de palavras "pré-construídos", de que o falante dispóe e que utiliza automaticamente e de forma inconsciente, mesmo quando sao analisáveis nos seus elementos constitutivos. 3 Alguns destes grupos sao tambem chamados "compostos sintaticos" no Cap. 58. 4 Os aforismos englobam sentencas de origem culta e maximas de cunho popular; adotamos aqui a definicao de "aforismo" dada por Prado Coelho (1969:26), como «expressao concisa de um pensamento moral*. 5 O termo ingles "collocation", que em fiances corresponde a "combinatoire", foi definido pela primeira vez por Firth (1957) como «actual words In habitual company*, «palavras que coocorrem habitualmente» (t.n.). 218 9.1 PROCESSUS DE LEXICALIZACÄO A consolidacäo formal da sequéncia implica, por um lado, que existe pouca (nalguns casos, nenhuma) liberdade de escolha das palavras que a constituem e, por outro lado, que a sua estrutura morfossintática se vai tornando fixa. Dizemos que há des-sintatizacäo quando os falantes deixam de ter consciéncia de uma cons-trucäo sintática subjacente ä sequéncia e esta passa a funcionar como uma palavra simples: cf. cara de pau ou fim de semana. A consolidacäo semäntica consiste na perda do significado composicional dos elementos da unidade multilexical, através de um processo de semantizacäo de todo o grupo. Quer isto dizer que o significado da sequéncia deixa de poder deduzir--se da combinacäo dos signiůcados de cada uma das palavras que a compöem; a sequéncia adquire entäo um significado global, cristalizado e unitário, muitas vezes de caráter metafórico e por vezes completamente opaco. Quando se atinge o grau maximo de fixidez formal e de consolidacäo semäntica, tem-se uma só unidade de forma e de sentido constituída por várias palavras, um processo chamado idio-matizacäo. Neste caso, os falantes já näo encontram nos elementos da expressäo qualquer motivacäo para o seu sentido global. Por exemplo, em estar com a pulga atrás da orelha os falantes näo veem hoje motivacäo para o sentido global de 'des-confiar' que a expressäo tem. A consolidacäo pragmática de uma unidade multilexical, por sua vez, consiste numa habituacäo (ou rotinizacäo) do uso combinado das palavras que a formám. Note-se que, neste caso, as palavras näo perdem necessariamente o seu significado individual, podendo manter uma čerta "liberdade" semäntica. A rotinizacäo é favo-recida pela frequente utilizacäo das unidades multilexicais, quer em usos comuns, do dia-a-dia (cf. cabega no ar, consciéncia tranquila, apinhado de gente, banhado em lágrimas, esfregar as mäos de contente, contrair um empréstimo, estar condenado ao fra-cassó), quer em usos específicos, de natureza técnica, científica, etc. (cf. acidente vascular cerebral, artrite reumatoide, massa molecular, ängulo de reflexäo, consolidacäo orgamental, mercado de capitals, carta rogatória, agäo cível). Existem também situacöes de comunicacäo, sej am elas mais ou menos formais, que favorecem a rotinizacäo das expressöes (cf. as expressöes de saudacäo como bom dial como está? ou de ini-cio ou fim de discurso oral como ora viva! até logo! ou de discurso escrito, como caro amigo, com os meus melhores cumprimentos). Em todos estes casos, os falantes memorizam e armaženam as combinatórias como um todo, no seu léxico mental, e dessa forma as utilizam. Contrariamente äs combinacöes livres de palavras, as unidades multilexicais, enquanto expressöes lexicalizadas, para alem de näo obedecerem ä livre escolha dos falantes no que respeita aos elementos que as constituem e ä sua estruturacäo, adquirem, por vezes, um semantismo proprio, institucionalizado pelo uso. Nomes como lugar e alguns dos adjetivos com que se podem combinar ilustram bem estas observances. Por exemplo, a propösito de um lugar onde as pessoas se sentem bem, pode escolher-se, livremente, dizer que lugar simpático, que sítio apra-zível, que local ameno ou agradável ou qualquer outra combinacäo entre os nomes lugar, sítio e local e os adjetivos simpático, apraztvel, ameno ou agradável, em qualquer das duas ordenacöes nome + adjetivo ou adjetivo + nome. A escolha do nome e do adjetivo, bem como a sua ordern, näo implicam uma alteracäo substancial do significado do sintagma nominal. Estes casos säo, pois, exemplos de sequéncias livres. NOCOES CERAIS SOBRE LEXICALIZACÄO 9.1 Em contrapartida, se se quiser falar de um texto cheio de banalidades, pode dizer-se: quantos lugares comuns! Mas, para este mesmo sentido, näo se poderá optar por dizer quantos lugares usuais, quantos sitios vulgares, quantos locais banais ou qual-quer outra combinacäo dos nomes lugar, sítio e local com os adjetivos usual, vulgar ou banal'. Do mesmo modo, näo é possível inverter a ordern entre o nome lugares e o adjetivo comuns: cf. a estranheza de šquantos comuns lugares!6. Ou seja, a sequéncia lugar comum passou a ser uma unidade multilexical, i.e., urn sintagma fortemente lexicalizado, que näo admite variacäo na escolha nem na ordern dos seus elemen-tos constitutivos, tendo adquirido o sentido figurado de 'banalidade'; como tal, é produzido e reconhecido pelos falantes e atualmente tem entrada propria, sendo grafado com hifen, na maior parte dos dicionários. Quer se trate da formacäo de palavras compostas, como guarda-chuva ou corri-mäo, quer da fixacäo de unidades gramaticais, como em vez de ou por conseguinte, e lexicais, como mercado negro, perder a cabeca ou dar com os burrinhos na água, está--se perante um processo de lexicalizacäo, que pode, na sua origem, ter sido deter-minado pela necessidade de criacäo de novas designacöes, mas que é sempre o resultado da combinacäo frequente de elementos originalmente autónomos. Estes elementos väo perdendo gradualmente a sua autonómia formal, fixando-se, por vezes, em formas totalmente cristalizadas (coca-bichinhos e näo coca-bichos; tem-te näo caias e näo tenha-se näo caid); e vai-se tornando também flxa a sua ordern de ocorréncia no grupo (saia-casaco e näo casaco-saia; de viva voz e näo de voz viva). Concomitantemente, os elementos väo perdendo a sua autonómia semäntica den-tro da unidade multilexical, que passa a ter um significado global, o qual tem de ser adquirido e memorizado pelos falantes da mesma forma que o significado das palavras simples; i.e., o falante tem de aprender que, p.e., perder a cabeca signi-fica 'descontrolar-se' e dar com os burrinhos na água significa 'falhar'. Mesmo nos casos em que os elementos da sequéncia lexicalizada näo perdem o seu significado autónomo, e, logo, o sentido do grupo näo é opaco, o seu uso global näo se confunde com o uso de uma sequéncia idéntica näo lexicalizada (cf. a discussäo a seguir sobre fazer a cama). Sendo a lexicalizacäo o resultado de um processo gradual, é possível observar, tanto diacronicamente como sincronicamente, expressöes que atingiram diferen-tes graus deste processo. Assim, por exemplo, no momento arual, a sequéncia de palavras fazer a cama é ambígua: pode ocorrer como uma combinacäo livre em que cada uma das palavras mantém o seu sentido individual (cf. (la)) ou apresentar caracteristicas que a identificam como uma unidade multilexical, apresentando, contudo, diferentes graus de lexicalizacäo: (i) uma combinatória em que ainda se pode deduzir o sentido global da unidade a partir do sentido dos seus elementos (cf. (lb)), ou (ii) uma combinatória que atingiu o grau máximo de lexicalizacäo, tendo adquirido um sentido näo composicional totalmente idiossincrático (cf. (lc)). A mesma expressäo pode, ainda, fazer parte de um aforismo (cf. (Id)) que tem também, tal como (lc), um significado global, näo composicional: 6 Neste exemplo, e noutros deste texto, o símbolo "#" é usado para indicar que a unidade multilexical näo é possível na interpretacäo que se discute. 220 9.1 PROCESSUS DE LEXICALIZACÄO (1) a. O marceneiro fez-lhe a cama e a cómoda. (= fabricou-lhe a cama) b. A mäe fez-lhe a cama logo de manhä. (= arranjou-lhe as roupas da cama) c. O colega fez-lhe a cama e ele foi despedido. (= armou-lhe uma cilada) d. Quem boa cama fizer nela se deitará. (= terá um bom futuro quem o souber * preparar) Em (la), as palavras fazerecama mantém o seu significado individual de 'produziť e de 'peca de mobiliário para as pessoas se deitarem', entrando as duas em relacöes paradigmáticas com outras palavras da mesma area semäntica, como fabricar e cons-truir (para fazef) e cómoda, cadeira ou estante (para cama). Estas palavras podem ser substituídas na frase, preservando a sua interpretabilidade e alterando-a apenas em partes bem delimitadas do seu conteúdo (cf. o marceneiro fabricou-lhe/construiu-lhe a cómoda/estante. Em (lb-d), no entanto, essas substituicöes säo impossíveis, uma vez que a expressäo fazer a cama (a alguém) funciona globalmente, ou seja, como uma "grande" palavra, com um significado bem diferente do significado composi-cional que a expressäo correspondente tem em (la). Como fica patente nos exemplos (lb,c), as expressöes lexicalizadas, ä seme-lhanca das palavras individuais, podem ter vários sentidos. Em (lb), o sentido da expressäo, embora menos transparente do que o de (la), näo é completamente opaco, pois o verbo fazer näo ficou totalmente vazio de sentido (sendo usado aqui na acecäo de 'arranjar, arrumať) e cama está usado metonimicamente como 'roupa da cama'. Em contrapartida, em (lc), a expressäo fazer a cama, usada metaforica-mente com o sentido de 'armar uma cilada', é semanticamente opaca, näo sendo interpretada de nenhum modo a partir dos seus elementos constitutivos. Esta diferenca semäntica reflete-se também na maneira como a expressäo interage com determinados fenómenos sintáticos. Assim, fazer a cama, em (lb), está mais próxima da sequéncia livre de (la) porque admite, tal como esta7, variacäo flexional (cf. (2a)) e sintática (cf. (2b-e)): (2) a. As mäes faziam as camas das criancas logo de manhä. [variacäo flexional do verbo e dos elementos do SN] b. A cama, a mäe vai fazer-lha logo de manhä. [construcäo de topicalizacäo] c. Que cama é que a mäe fez? [construcäo interrogativa] d. A cama que a mäe fez ficou pronta logo de manhä. [construcäo relativa] e. A cama foi-lhe feita pela mäe logo de manhä. [construcäo passiva] Em (lc), fazer a cama admite variacäo na flexäo verbal (cf. (3a)), mas näo variacäo sintática (cf. (3b-d)): (3) a. Os colegas fizeram-lhe a cama e ele foi despedido. [variacäo na flexäo verbal: pessoa, tempo e modo] b. #A cama, o colega fez-lha e ele foi despedido. [construcäo de topicalizacäo] c. #Que cama é que o colega Ihe fez? [construcäo interrogativa] d. #A cama foi-lhe feita pelo colega. [construcäo passiva] 1 As variacöes de fazer a cama como sequěncia livre, correspondentes äs de (2), säo, lespetivamente, os marceneiros fizeram-lhes as camas; a cama, o marceneiro fez-lha (por bom precö); que cama é que o marceneiro Ihe fez?; a cama que o marceneiro Ihe fez ficou linda e a cama foi-lhe feita pelo marceneiro. VALORES SEMÄNTICOS, CLASSES LEXICAIS OU CRAMATICAIS E VALORES FUNCIONAIS 9.2 Do cotejo destes exemplos se conclui que é em (lc) que a sequéncia atinge um maior grau de lexicalizacäo. Por sua vez, o exemplo (Id) forma, no seu todo, um enunciado completo, de sentido unitário e idiossincrático, com alto grau de generalidade. Trata-se de «uma unidadede comunicacäo minima» (Zuluaga 1980:192, t.n.) e aqui o elemento fazer a cama pode ser interpretado como 'preparar o futuro'. Em sintese, existe lexicalizacäo quando as palavras de um sintagma ou de uma fräse, tipicamente, perdem a sua independéncia semäntica, passando a formar um grupo mais ou menos "fixo" ao qual estäo associados contextos de uso e/ou significados especificos. Consequentemente, existem limitacöes fortes na escolha e na combinacäo das palavras que formám estes grupos; as palavras tendem a "escolher-se" umas äs outras de maneira restrita, ou seja, manifestam aquilo que se chama cosselecäo. Esta situacäo contrasta com o que se passa na formacäo de sintagmas e frases "normais" ou "livres", em que as palavras säo livremente escolhidas pelos falantes e mantém o seu signincado proprio8. Assim, de acordo com Sinclair (1991), quando se constroem sintagmas e frases "livres", faz-se um uso quase ilimitado das possibilidades de estruturacäo sintática das palavras e estas säo selecionadas de acordo com um "principio de livre escolha". Em contrapartida, quando se constroem unidades multilexicais, essas possibilidades estäo, de um modo ou de outro, limitadas, dando lugar ä utilizacäo automática de combinatórias previamente construídas, e a sua selecäo deve-se a um "principio idiomático"9. Valores semänticos, classes lexicais ou gramaticais e valores funcionais das unidades multilexicais As unidades multilexicais distribuem-se por várias areas semänticas e pragmáticas: (i) expressöes com que se designam realidades extralinguisticas do quotidiano (päo com manteiga, café com leite, vinho branco, ferro elétrico, servigo de chä, trem de cozinha); (ii) expressöes que respondem ä necessidade de criar denominacöes especializadas, científicas, técnicas, artísticas, etc. (água forte, água-pesada, órgao consultivo, sequenciagäo do genoma humano, deduzir acusagäo, natureza-mortd); (iii) variantes "expressivas" de palavras ou sintagmas com um significado expres-sivo mais neutro (dias a flo por dias seguidos; fino como um coral por muito flno ('esperto'); tratar alguém abaixo de cäo por tratar alguém muito mal); (iv) expressöes de natureza geral ou específicas de determinadas areas (cultura geral, fluxo migratório, drogas ilícitas, sinais exteriores de riqueza, fóra do comum, do foro privado, matar ä fome, estar em foco); 8 Existem também, obviamente, restricöes de natureza sintática, morfológica e semäntica na construcäo dos sintagmas e das frases. 9 Estes dois princípios näo se excluem mutuamente, podendo, até, coexistir na mesma expressáo, como, p.e., em certas unidades multilexicais com um menor grau de lexicalizacäo. 222 9.2 PROCESSUS DE LEXICALIZACÄO (v) expressöes com uma funcäo exclusivamente pragmática: saudacöes e formulas de cortesia (bom dia ou muito prazer em conhecer), formas de inicio ou fecho de discurso (era uma vez ou sem outro assunto), ditos (quem sai aos seus näo degenera), máximas (näo deixespara amanhä o quepodes fazer hoje); (vi) provérbios (gräo a gräo enche a galinha opapo, cäo que ladra näo morde, dezembro frio, calor no estio); (vii) siglas (RTP - Rádio Televisäo Portuguesa, CTT- Correios, Telégrafos e Telefones, EDP - Eletricidade de Portugal); (viii) acrónimos (sida - sindrome de imunodeňciéncia adquirida ou AMI - Ajuda Médica Internacional). [2] A abreviacäo de unidades sintagmáticas faz parte do processo de lexicalizacäo e inclui a siglacäo (formando siglas), a acronímia (formando acrónimos) e, ainda, o uso de abreviaturas, na escrita. Na siglacäo, combinam-se as iniciais de palavras ple-nas de um sintagma (cf. AR < Assembleia da República, IRS < imposto sobre o rendimento depessoas singulare*) ou as iniciais dos elementoš de palavras complexas (cf. TV< televisäo ou ECQ < eletrocardiograma). Uma característica importante das siglas (que as distingue dos acrónimos) é o facto de a sua pronúncia ser feita letra a letra. A forma-cäo dos acrónimos, por sua vez, é semelhante ä das siglas, com a diferenca de que os acrónimos těm estrutura silábica, isto é, säo pronunciados como uma palavra da lingua (cf. OPA < oferta publica de aquisigäo, IVA < imposto sobre o valor acrescentado, ETAR < estacäo de tratamento de águas residuais). Finalmente, as abreviaturas consistem em reducöes de palavras no registo escrito da lingua (cf. a.C. < antes de Cristo, V. Exa. < Vossa Exceléncia, s.d. < sem data, Sr. Dr. < Senhor Doutor). As unidades multilexicais pertencem a várias classes, lexicais ou gramaticais10, dependendo do seu núcleo (cf. Cap. 11), e těm funcöes variadas na frase ou den-tro de um sintagma nominal: podem ser (i) nominais11 (cf. chamavam-lhe caixa de óculos. só uso sal marinho. é preciso dar-lhes apoio logístico. avaliámos ganhos e per-das), funcionando como argumentos; (ii) adjetivais (cf. o rapaz está säo como um pero), funcionando como modiůcadores nominais restritivos ou como predica-tivo do sujeito; (üi) preposicionais, com a funcäo de adjunto adverbial (cf. a dada altura perguntaram-me por ti, gosto de tripas ä moda do Porto, por alturas de Coim-bra. o carro avariou); (iv) verbais, funcionando como predicado (cf. só ontem me dei conta de que tinhas razäo, mandaste fazer essas calgas, celebraram um contrato de compra e venda de propriedades, eles fazem vista grossa aos erros dos amigos); (v) ora-cöes completivas infinitivas, funcionando como modificador de nome ou como 10 Designam-se por "unidades multilexicais gramaticais" as locucöes gramaticais de vários tipos: conjun-cionais, como ao passo que e ainda que; relativas e/ou interrogativas, como por que, o qual, etc. Autores como Benson et al. (1986a e 1986b) e Hausmann (1989) só consideram como expressöes multilexicais as que säo constituídas por itens lexicais (plenos), excluindo, assim, as locucöes gramaticais. Neste capí-tulo näo consideramos as locucöes gramaticais, que säo tratadas nos capítulos dedicados äs várias classes a que pertencem. 11 Alguns autores incluem nestas categorias nomes próprios geográficos (Mar Vermelho, Golfo Pérsico), de períodos históricos (Idade Média, Revolucäo Francesa), de personalidades históricas (Rei Sol, Dama de Ferro), de instituicöes (Cruz Vermelha, Legiäo Estrangeird). IDENTIFICACÄO DAS UNIDADES MULTILEXICAIS E AFERICÄO DOS SEUS CRAUS DE LEXICALIZACAO 9.3 223 predicativo do sujeito (cf. estou com um vestido de trazerpor casa. o teu procedimento foi de se line tirar o chapéú). Em certos casos, a lexicalizacao reclassiůca uma expressao que pertence origina-riamente a uma classe (lexical ou sintagmática) noutra classe lexical: cf. as pessoas sem abrigo (sintagma preposicional atributivo, com funcao adjetival) -» os sem-abrigo (nome); noutros casos, a lexicalizacao envolve fenómenos de gramaticalizacao das palavras que constituem a unidade multilexical (i.e., a passagem da expressao ou de um dos seus elementos de uma classe lexical para uma classe gramatical. Para vários exemplos desta reclassificacáo, cf. Cap. 10). 9.3 Idenlificacáo das unidades multilexicais e afericáo dos seus graus de lexicalizacao Firth, no artigo em que escreveu a sua célebre frase «You shall know a word by the company it keeps», «Conhecerás uma palavra pela sua companhia» (t.n.) (Firth 195 7), chamava a atencáo para a importáncia de se estudarem e caracterizarem as palavras tendo em atencao as outras palavras com que podem coocorrer, designando por "collocations" ("colocacSes", em portugués) as possibilidades combinatórias de cada palavra. Marcava, assim, o início do desenvolvimento do conceito de "combinatória de palavras" ou de "unidade multilexical", o qual tem sido encarado segundo perspetivas diversas centradas em duas propriedades fundamentals: (i) a ůxidez sintática da sequéncia de palavras que forma o grupo; (ii) a nao composicionalidade semántica dessa sequéncia. Ambas estas propriedades admitem uma gradacao, que decorre da maior ou menor tendéncia associativa das palavras que formám o grupo12. De acordo com a forma como estas propriedades sao perspetivadas, assim se tern dado definicoes mais restritas ou mais latas de unidade multilexical (cf. Bacelar do Nascimento et al. 2006); para alguns autores, estas unidades consistem em associates de palavras com caracteristicas restritas cujo resultado é semanticamente nao composicional (cf. Hausmann 1979, Mel'cuk 1984), enquanto para outros elas abrangem tipos de relacoes associativas menos restritivos (cf. Sinclair 1991). Segundo as definicoes mais restritivas, a unidade multilexical é uma sequéncia de palavras totalmente coesa e indissolúvel, sem possibilidade de variacáo das formas que a constituem, e nao admite a introducao de outros elementos, em particular no seu interior. Semanticamente, o seu significado é único e nao é igual ao conjunto dos signiůcados dos seus componentes (ou seja, nao é composicional); antes, é fruto de um processo acabado de conversáo de uma estru-tura sintática numa unidade de valor lexical ou gramatical, ou numa unidade fraseológica. Pode dizer-se que em unidades děste tipo o processo de lexicalizacao atingiu o seu termo. 12 A determinacäo desta tendéncia associativa exige o recurso a métodos estatísticos que permitam obter dados de frequéncia recolhidos com base em corpora equilibiados de grandes dimensôes. Cf., entre outros, Church e Hanks (1990), Clear (1993), Smadja (1993), Krishnamurthy (1997). 224 9.3 PROCESSUS DE LEXICALIZACÄO Contudo, näo é possível nem estabelecer com exatidäo o momento em que se inicia o processo de lexicalizacäo de uma sequéncia de palavras nem o momento em que está terminado. Por isso, parece-nos demasiado restritivo classificar as unidades multilexicais tomando como critério absoluto a finalizacäo do processo de > lexicalizacäo. Seguimos, por isso, uma perspetiva menos restritiva do que a descrita no parágrafo anterior, estabelecendo vários tipos de unidades mulülexicais segundo o grau de lexicalizacäo que detém. A identificacäo e a afericäo do grau de lexicalizacäo das unidades mulülexicais säo feitas com base nas suas propriedades formais, semänticas e pragmá-ticas; o reconhecimento da consolidacäo pragmática envolve o estabelecimento de dados quantitativos: indices de frequéncia e estaüsticos, incluindo medidas de associacäo lexical, aqui representadas pelo chamado índice Combinatório (IC)13. Estas propriedades säo mais valorizadas ou menos valorizadas conforme a abordagem seguida, sendo as propriedades formais e semänticas as mais utilizadas, tradicionalmente14. Dada a abrangěncia do conceito de unidade multilexical que seguimos nesta Gramática, consideram-se aqui também as propriedades pragmáticas. Para alem disso, consideramos que cada um dos tipos de propriedades, formal, semäntico e pragmático, se manifesta de modo independente dos outros; por outras palavras, cada um deles contribui de modo independente para a identificacäo de uma unidade multilexical e para a determinacäo do seu grau de lexicalizacäo. Assim, p.e., uma unidade multilexical pode atingir um forte grau de lexicalizacäo do ponto de vista semäntico ou pragmático e um fraco grau de lexicalizacäo do ponto de vista formal. Naturalmente, o alto grau de lexicalizacäo de uma unidade multilexical fica tanto mais reforcado quanto mais propriedades se lhe puderem reconhecer. Para exemplificar este ponto, comparem-se duas unidades multilexicais: pau mandado e fontes fidedignas. A primeira é fortemente lexicalizada nas trés dimen-söes consideradas: tem uma forte coesäo formal, é semanticamente opaca e tem um forte índice Combinatório (IC = 10)15. Em contrapartida, fontes fidedignas é uma unidade multilexical formada por coocorrentes privilegiados (cf. 9.1), mas näo apresenta todas as propriedades identificadoras das unidades multilexicais (cf. 9.3.1): formalmente, aceita a comutacäo de um dos seus elementos (cf. fontes seguras) e a inclusäo de uma palavra no seu interior (cf. fontes bastante fidedignas), e semanticamente é transparente. Neste caso, a propriedade que permite o seu reconhecimento como unidade multilexical é a forte tendéncia associativa entre 13 O IC (também chamado "Mutual Information") é um índice que resulta da aplicacäo de uma medida sobre um corpus visando aferii a tendéncia associativa entre duas ou mais palavras (cf. 9.3.3). 14 Cf., por exemplo, Carter (1987) e Zuluaga (1980). 15 Recorde-se que o IC é a medida que identifica a tendéncia associativa de duas ou mais palavras. O valor 10 é o IC desta sequéncia num corpus de 50 milhöes de palavras, corpus do projeto COMBINA-PT - Combinatórias Lexicais do Portuguěs do Centro de Linguística da Universidacle de Lisboa (http://www.clul. ul.pt/en/research-teams/183-reference-corpus-of-contemporary-portuguese-crpc) (cf. Antunes et al. 2008), também referido como corpus COMBINA, extraído do Corpus de Referenda do Portuguěs Contemporáneo, projeto do mesmo Centro. Em todos os casos em que é indicado, neste capítulo, o IC de uma unidade multilexical, ele foi extraído děste corpus. Considera-se que a partir do índice 7 se torna segura a identificacäo de combinatórias no piano estatístico. Em estudos sobre este terna (cf. Bacelar do Nascimento 2002, Evert e Krenn 2001, Pereira e Mendes 2002), foi evidenciado que os valores de Mutual Information entre 7 e 11 correspondem a uma faixa que tem a maior concentracäo de combinatórias num dado corpus. r IDENTIFICACÄO DAS UNIDADES MULTILEXICAIS E AFERICÄO DOS SEUS GRAUS DE LEXICALIZACÄO 9.3.1.1 225 os seus elementos, confirmada pelo seu elevado índice Combinatório (= 12,4), o qual evidencia urna estabilidade de ocorréncia conjunta das duas palavras que a formám. Assim, contrariamente a pau mandado, o grau de lexicalizacäo de fontes ftdedignas é praticamente só de natureza pragmática, näo envolvendo fatores formais ou semänticos. Trata-se de urna "colocacäo", de acordo com a terminológia de Firth, ou sej a, urna coocorréncia típica entre duas ou mais palavras que, com o uso, se convencionalizou. 9.3.1 Propriedades formais das unidades multilexicais Descrevem-se nesta subseccäo algumas propriedades formais que caracterizam as unidades multilexicais. Estas propriedades manifestam-se no piano paradigmá-tico e no piano sintagmático. As primeiras těm a ver com a possibilidade (ou näo) de substituir cada um dos elementos de urna unidade multilexical por outros elementos com um significado semelhante ou próximo, mantendo constante a estrutura da expressäo. A variacäo das unidades multilexicais nesta dimensäo é tanto mais importante quanto nos servirá de base para estabelecer a sua tipologia formal básica, articulada em trés grupos com propriedades distintas: (i) unidades multilexicais fixas, (ii) unidades multilexicais semifixas e (iii) coocorrentes privi-legiados. Esta matéria é abordada em 9.3.1.1. As propriedades sintagmáticas, por sua vez, dizem respeito ä maneira como os vários elementos que formám as unidades multilexicais se combinam linearmente e hierarquicamente entre si. Este aspeto é abordado em 9.3.1.2. 9.3.1.1 Piano paradigmático No piano paradigmático, um critério para avaliar a fixacäo de uma unidade multilexical consiste em observar a maior ou menor possibilidade de substituicäo (ou comutacäo) de cada um dos seus elementos lexicais sem alteracäo da estrutura interna da unidade multilexical ou do seu significado global. Ou seja, as substituicôes restringem-se äquelas palavras que detém com o elemento substituído rela-cöes de sentido próximas: sinónimos, hiperónimos, hipónimos e, por vezes, antó-nimos (cf. Cap. 8)16. O numero de substituicôes lexicais que é possível fazer, quer num lugar fixo, quer em diferentes posicöes dentro da unidade multilexical, apresenta uma rela-cäo inversa com o grau de lexicalizacäo da sequéncia. Por outras palavras, quanto menor for o numero possível de substituicôes maior será o grau de lexicalizacäo da unidade multilexical; inversamente, quanto menos restringida for a selecäo para-digmática, mais "livre" é a sequéncia formada17. É importante ter em conta, no entanto, que mesmo nas unidades multilexicais com menor grau de lexicalizacäo, o numero dos elementos lexicais que podem comutar é tipicamente limitado, for-mando paradigmas mais ou menos fechados. 16 A substituigäo de um elemento de uma unidade multilexical por um antönimo näo altera necessariamente o seu sentido global. Veja-se, p.e., ver com bons olhos vs. ver com maus olhos, em que ambos exprimem a nofäo geral de ter uma determinada opiniäo sobre alguma coisa. 17 Mesmo no "discurso livre" näo envolvendo unidades multilexicais, nunca existe liberdade total nas escolhas, porque existem sempre restriföes de natureza sintätica, semäntica e pragmätica nas escolhas lexicais que levam ä formafäo dos sintagmas e das frases. 226 9.1.1.1.1 PROCESSOS DE LEXICAL1ZACAO E tambem no piano paradigmatico que se tern em conta a possibilidade ou impossibilidade de variacao em ntimero, genero, tempo, modo e aspeto dos ele-mentos que compoem a unidade multilexical. Abordamos a substituicao lexical e a substituicao flexional separadamente. 9.3.1.1.1 Substituicao lexical Para ilustrar este ponto, compare-se a sequencia livre vimos uma estatueta que tinha corpo de gesso e cara de pau com a unidade multilexical contrataram uma secretaria que tinha cara de pau. mas era muito eficiente. Enquanto, no primeiro caso, cara de pau pode ser substituido por rosto depau ou cara de madeira (cf. vimos uma estatueta que tinha corpo de gesso e {rosto depau/cara de madeira}), no segundo tal substituicao e impossivel (cf. #contrataram uma secretaria que tinha [rosto de pau/cara de madeira], mas era muito eficiente). Ou seja, cara de pau, neste exemplo, e uma unidade multilexical com um alto grau de fixidez lexical. Um aspeto muito importante das unidades fixas como cara de pau, e que e fundamental para a compreensao do seu funcionamento, e o seguinte: o seu grau de lexicalizacao (ou seja, a sua fixidez lexical) e tao grande no lexico.mental dos falantes, que praticamente ja nao ocorrem como sequencias livres, precisamente porque sao automaticamente identificadas como unidades multilexicais. Isto explica que o primeiro exemplo dado acima (vimos uma estatueta...) e outros como ele sejam extremamente raros e pouco naturais quando ocorrem (para muitos falantes, a primeira interpretacao que vem a ideia e que a estatueta tern "cara de pau" no sentido idiomatico). <♦ Unidades multilexicais fixas Existem unidades multilexicais que nao aceitam qualquer substituicao dos seus elementos, chamadas, por isso, unidades multilexicais fixas. Apresentam-se a seguir alguns exemplos, organizados por classes lexicais e/ou funcionais: (4) Grupos nominais a. pau mandado (vs. #vara mandada) b. um belo dia18 (vs. #um bonito dia) c. golpe de misericordia (vs. #golpe de compaixao/#golpe de piedade/#golpe misericordioso/#pancada de misericordia) d. falsa modestia (vs. #fingida modestia/#simulada modestia) e. arvore das patacas (vs. #arvore das moedas) (5) Grupos com a funcao de modificador restritivo de nome ou de predicativo do sujeito (passamos a designar esta funcao doravante como "funcao adjetival") a. de se lhe tirar o chapeu (vs. #de se lhe tirar o bone/#de se lhe por o chapeu) b. sao como um pero (vs. #sao como uma maca/#sao como um fruto) c. de tras da orelha/#de tras do ouvido) d. de forca (vs. #de fortaleza/#de fraqueza) e. nao contente (vs. #nao feliz) 18 Entende-se aqui um belo dia com o sentido de adjunto adverbial de tempo, como em um belo dia, cnegaram os livros que tinhamos encomendado. IDENTIFICACÄO DAS UNIDADES MULTILEXICAIS E AFERICÄO DOS SEUS GRAUS DE LEXICALIZACÄO 9.3.1.1.1 227 (6) Grupos com a funcäo de adjunto adverbial a. de pedra e cal (vs. #de rocha e cal) b. com a pulga aträs da orelha (vs. #com a mosca aträs da orelha/#com o inseto aträs da orelha) c. a fio (vs. #a linha/#a cordel) d. a prazo (vs. #a data) (7) Grupos verbais a. näo se dar por achado (vs. #näo se dar por encontrado) b. meter ägua (vs. #pör ägua/#introduzir ägua) c. matar ä fome (vs. #assassinar ä fome) d. näo ser flor que se cheire (vs. #näo ser rosa que se cheire) e. ficar a ver navios (vs. #ficar a ver barcos) f. näo arredar pe (vs. #näo desviar pe/#näo afastar pe) Tambem näo aceitam substituicäo certas unidades multilexicais que incluem elementos com sufixos avaliativos; em particular, o elemento sufixado näo pode ocorrer sem o sufixo: (8) a. coca-bichinhos (vs. #coca-bichos) b. de casa e pucarinho (vs. #de casa e pücaro) c. nervoso miudinho (vs. #nervoso miüdo) d. sair de fminho (vs. #sair de fino) <• Unidades multilexicais semifixas Existem unidades multilexicais que aceitam a substituicäo de alguns elementos da sequencia por outras palavras que mantem com o elemento substituido relacöes semänticas de sinonimia, de hiperonimia, de hiponimia ou mesmo de antonimia, sem que a estrutura e o sentido generico do grupo se älterem. Apresentam-se a seguir alguns exemplos: (9) Grupos nominais a. ödio mortal/odio de morte/odio figadal b. fome de cäo/fome canina/fome de lobo c. varinha mägica/varinha de condäo d. onda de assaltos/mare de assaltos/vaga de assaltos e. desenhos animados/bonecos animados f. habilitacöes literärias/habilitacöes academicas g. altas pressöes/baixas pressöes h. consciencia pesada/consciencia tranquila i. velho continente/novo continente (10) Grupos com funcäo adjetival a. sobejamente conhecido/por de mais conhecido b. de alto nivel/de alto gabarito/de alto coturno c. fora do comum/fora do vulgar/fora do normal d. politicamente correto/politicamente incorreto 1 228 9.3.1.1.1 PROCESSOS DE LEXICALIZACAO (11) Grupos verbais a. armar aos cagados/armar aos cucos/armar ao pingarelho b. near de cara a banda/ficar de cara ao lado c. fechar a porta na cara/dar com a porta na cara/bater com a porta na cara d. dizer a boca cheia/dizer a boca pequena e. dar com o nariz na porta/bater com o nariz na porta f. ver com bons olhos/ver com maus olhos g. dar a sola/dar as de vila-diogo (12) Grupos com funcao de adjunto adverbial a. de forma geral/de modo geral b. a folhas tantas/a paginas tantas c. por via materna/pelo lado materno d. em menos de um amem/em menos de um fosforo e. na mo de cima/na mo de baixo f. a compita/a porfia g. a meio gas/a todo o gas h. com fins lucrativos/sem fins lucrativos i. de bom grado/de mau grado Em certas unidades multilexicais, observa-se tambem variacao entre elementos simples e elementos com morfemas avaliativos: (13) a. um fio de voz/um fiozinho de voz b. carro de linhas/carrinho de linhas c. novo em iolha/novinho em folha d. ter a papa feita/ter a papinha f eita e. de alto nível/de altíssimo nivel f. de primeira água/de primeiríssima água g- de corpo bem feito/de corpinho bem feito h. com um gräo na asa/com um gräozinho na asa i. dar com os burros na água/dar com os burrinhos na água Nos exemplos (9)-(13), a variacao lexical näo e aleatöria. De facto, näo hä total liberdade na escolha dos elementos que aeeitam comutaeäo: os paradigmas admis-siveis (ou seja, as classes de elementos que podem comutar entre si) säo fechados. Por esta razäo, consideram-se estas sequencias näo como expressöes livres mas como unidades multilexicais semifixas. Os exemplos seguintes ilustram algumas restri-cöes que se verificam na selecäo lexical destas unidades: (14) a. fome de cäo/fome canina/fome de lobo (vs. #fome lupina/#fome de raposa) b. varinha de condäo/varinha mägica (vs. #varinha de magia) c. por de mais conhecido/sobejamente conhecido (vs. #demasiadamente conhecido/#demasiado conhecido) d. fora do comum/fora do vulgar/fora do normal (vs. #fora do geral) e. fechar a porta na cara/bater com a porta na cara/dar com a porta na cara (vs. #atirar com a porta na cara) J IDENTIFICACÄO DAS UNIDADES MULTILEXICAIS E AFERICÄO DOS SEUS GRAUS DE LEXICALIZACÄO 9.3.1.1.1 229 As expressöes aforisticas19 (muitas vezes consideradas como unidades altamente rígidas) também admitem alguma variacäo paradigmática, mas de modo mais restrito que os casos anteriores, como se ilustra nos seguintes exemplos (destacam-se com sublinhado as palavras registadas como variantes por substituicäo): (15) a. Depois do temporal vem a bonanca./Depois da tempestade vem a bonanca./Depois da tormenta vem a bonanca. b. Mestre fora, dia santo na loja./Paträo fora, dia santo na loja. c. Longe da vista, longe do coracäo./Longe dos olhos. longe do coracäo. d. Quem näo trabuca näo manduca./Quem näo trabalha, näo come. e. {Brigam/Guerreiam/Pelejam/Ralham/Zangam-se} as comadres, desco-brem-se as verdades. Diz-se que duas ou mais sequéncias säo variantes de uma unidade multilexical semifixa quando (i) näo těm significados globais diferentes, (ii) näo dependem do contexto em que ocorrem e (iii) fazem parte de uma série paradigmática limitada e estável (cf. Corpas 1996:28s). Este tipo de variacäo näo deve confundir-se com "jogos de palavras" inten-cionais, a partir de uma unidade multilexical fixa, que por vezes ocorrem no dis-curso. Assim, por exemplo, no corpus COMBINA, ocorrem as seguintes substituicöes ocasionais na expressäo aforística no poupar é que está o ganho: (16) a. No anunciar é que está o ganho. b. No atacar é que está o ganho. c. No descontar é que está o ganho. d. No esperar é que está o ganho. e. No provař é que está o ganho. f. No comparar é que está o ganho. g. No economizar é que está o ganho. h. No prejuízo é que está o ganho. [3] Nos casos acima descritos, näo se trata de variantes, mas sim de modificacöes criativas. De acordo com Corpas (ibidem), quanto maior é o grau de fixidez de uma unidade, mais possibilidade há de que sofra modificacöes no discurso e de que essas modificacöes e o seu efeito sejam reconhecidos pelos falantes. Ou seja, o facto de a unidade multilexical no poupar é que está o ganho permitir um täo diversif icado numero de alteracöes significa que ela atingiu, efetivamente, um alto grau de lexicalizacäo. É precisamente a sua memorizacäo global que facilita a producäo pelos falantes dos "jogos de palavras" em que se mantém a estrutura da unidade multilexical e se conserva a identidade parcial dos seus componentes, mas se altera o semantismo da unidade multilexical. Isto nada tem a ver com os casos de variacäo da unidade multilexical por substituicäo do léxico. »I* Coocorrentes privilegiados Em (17)-(19), a mesma palavra de base ocorre com modificadores diferentes (sin-tagmas preposicionais atributivos em (17), sintagmas preposicionais "referen- 19 Todos os exemplos de expressöes aforisticas com variacäo dados neste capítulo foiam extiaídos do levantamento apiesentado em Chacoto (1994). 230 9.3.1.1.2 PROCESSUS DE LEXICALIZACÄO ciais" em (18)), ou o mesmo modiůcador, adjetivo, ocorre com nomes diferen-tes, em (19b)): (17) a. garrafa de água, garrafa de vinho, garrafa de cerveja, garrafa de aguar- dente, garrafa de whisky, garrafa de leite, garrafa de azeite b. päo de mistura, päo de milho, päo de trigo, päo de centeio, päo-de-leite, päo de forma c. päo com manteiga, päo com queijo, päo com fiambre d. fora de dúvida, fora de causa, fora de propósito, fora de série, fora de moda, fora de servico (18) contrato de adjudicacäo, contrato de aluguer, contrato de arrendamento, con-trato de compra e venda, contrato de promessa de compra e venda, contrato de concessäo de servicos, contrato de empreitada (19) a. päo branco, päo saloio, päo caseiro, päo quente, päo fresco b. porto fluvial, praia fluvial, transporte fluvial, via fluvial Nestes exemplos, os diferentes modificadores alteram significativamente o sentido do grupo; ou seja, estas sequéncias näo säo variantes de unidades multilexicais semifixas, mas cada uma delas é uma unidade multilexical. Estes grupos säo constituídos por combinacöes de palavras com uma alta fre-quéncia de coocorréncia, superior ao que séria de prever tendo em conta as suas frequéncias individuals. Esse facto justifica que sej am considerados unidades multilexicais, chamadas colocacôes, combinatórias ou coocorrentes privilegiados. Os elementos que compôem os coocorrentes privilegiados mantém o seu sentido proprio e a sua interpretacäo semäntica é plenamente composicional; por outras palavras, os coocorrentes privilegiados tém um fraco grau de lexicaliza^äo. 9.3.1.1.2 Variacäo flexional Para além da substituicäo lexical, contribui também para avaliar o grau de fixidez das unidades multilexicais a possibilidade de flexäo morfológica dos seus elementos adjetivais, verbais ou nominais. Neste aspeto, a generalidade das unidades multilexicais comporta-se da mesma forma que as sequéncias livres de palavras. Assim, muitas delas aceitam a pluralizacäo de nomes e adjetivos de acordo com as regras morfológicas da lingua: (20) a. ódio mortal/ódios mortais b. bom dia!/bons dias! c. motivo de forca maior/motivos de forca maior d. arco do triunfo/arcos do triunfo e. árvore das patacas/árvores das patacas O mesmo acontece em provérbios, onde se registam variantes com formas no singular e no plural: (21) a. Burro velho näo aprende lingua./Runo velho näo aprende línguas. b. A cavalo dado näo se olha o dente./A cavalo dado näo se olha os denies. IDENTIFICACÄO DAS UNIDADES MULTILEXICAIS E AFERICÄO DOS SEUS GRAUS DE LEXICALIZACÄO 9.3.1.1.2 231 Da mesma forma, na flexäo verbal ocorre variacäo em pessoa/número, para alem de variacäo em tempo e modo (cf. (22a,b)). Repare-se também na possibili-dade de ocorréncia de um verbo auxiliar aspetual, no terceiro exemplo de (22b) e no segundo de (22c)20: (22) a. Verdi a cabeca./Perdemos a cabeca. b. Meteste ägua./Meteram água./Continuant a meter água. c. Näo tem papas na lingua./Näo tem tido papas na lingua. Este tipo de variacäo é menos frequente em expressöes de tipo aforistico, embora se encontre nalgumas: (23) a. Maior é o dia, maior a romaria./Quanto maior for o dia, maior a romaria./Se maior fosse o dia, maior era a romaria. b. Quem parte paga./Quem partiu pa^ow. Em contrapartida, algumas unidades multilexicais cristalizam numa determi-nada forma flexiva, ou seja, possuem um maior grau de fixidez no que se refere ä flexäo nominal ou verbal. Veja-se, por exemplo: ganhar terreno (unidade multilexi-cal) mas näo ganhar terrenos (sequéncia livre), deträs da orelha (unidade multilexical) mas näo deträs das orelhas (sequéncia livre), brago direito (unidade multilexical) mas näo bragos direitos (sequéncia livre), quando o rei faz anos (unidade multilexical) mas näo quando o rei fez anos (sequéncia livre), cäo que ladra näo morde (unidade multilexical) mas näo cäes que ladraram näo morderam (sequéncia livre). Os exemplos de (24) ilustram também fixacäo flexional (em (24a), no plural): (24) a. mundos e fundos, primeiros socorros, altas esferas, forcas armadas, (ter) macaquinhos no sotäo, por artes mägicas, direitos humanos, desenhos animados b. caixa alta, ordern do dia, sangue frio É interessante notar que a fixidez lexical das unidades multilexicais fixas (cf. (4)-(8)) é relativamente independente da rigidez flexional. Assim, p.e., há mui-tas unidades multilexicais fixas que näo admitem substituicäo dos seus elementos constitutivos mas que admitem variacäo flexiva: cf. paus mandados, caras de pau, golpes de misericórdia, falsas modéstias, de Se Ihes tirar o chapéu, säos como um pero, näo se deram por achados ou andam a meter ägua. Para finalizar esta subseccäo, mencionamos um tipo de variacäo morfológica que tem um importante correlato semäntico, mais precisamente de natureza refe-rencial. Quando um dos elementos de uma unidade multilexical é um pronome, este pode variar de referenda, e, logo, concomitantemente, em pessoa e numero. Neste caso, diz-se que a posicäo que corresponde ao pronome é de "preenchi-mento livre": (25) a. ä {minha/tua/sua/nossa/...} vontade b. ä (minha/tua/sua/nossa/vossa) espera c. sair-(me/te/lhe/nos/...} um peso de cima dos ombros 20 Note-se que em (22) o norae näo pode variar flexionalmente: cf. #perdemos as cabecas, #meteste äguas ou #näo ter papa na lingua). 1 232 9.3.1.2 PROCESSUS DE LEXICALIZACÄO d. fazer-{me/te/lhe/...} o ninho aträs da orelha e. so {me/te/lhe/lhes/nos/vos} faltava mais essa! f. que {te/lhe/lhes/vos} faca bom proveito! g. näo {me/te/lhe/lhes/nos/vos} faltava mais nada! h. näo {me/te/se/nos/...} dar por achado Nestes exemplos, pode ocorrer, em vez do pronome, um sintagma preposi-cional introduzido por de quando o pronome e possessivo ou dativo de posse, e por a quando o pronome e um dativo etico, como se ilustra a seguir: (26) a. ä vontade da Maria b. ä espera do Joäo c. sair um peso de cima dos ombros do rapaz d. fazer o ninho aträs da orelha do pai e. so faltava mais essa ao Pedro! f. näo faltava mais nada ao Pedro! g. que faca bom proveito a todos! Hä outros casos em que a substituicäo por um sintagma preposicional näo e possivel: p.e., näo e possivel a correspondencia entre estar/ficar fora [de mim/de ti/de si] e #estar/flcar fora de alguem. 9.3.1.2 Piano sintagmätico No piano sintagmätico, a fixacäo (ou "estabilidade") sintätica das unidades mul-tilexicais tem a ver, essencialmente, com os seguintes pontos: (i) possibilidade de alteracäo da ordern dos constituintes, (ii) possibilidade de insercäo de elementos modificadores ou especificadores (artigos, quantificadores, adverbios, adjetivos, pronomes), (iii) possibilidade de reducäo ou extensäo da expressäo e (iv) possibilidade de modificacäo da estrutura sintätica (p.e., em estruturas de nominalizacäo, passivas, interrogativas, relativas, etc.). -t- Ordern dos constituintes Nas unidades multilexicais fortemente lexicalizadas, os constituintes ocupam, em geral, uma posicäo fixa. Quando essa ordern e alterada, deixam de funcionar como unidades multilexicais, o que se ilustra nos seguintes exemplos (primeiro apresenta-se a unidade multilexical e a seguir a sequencia resultante da alteracäo da ordern): (27) a. uso e abuso (vs. #abuso e uso) b. altas esferas (vs. #esferas altas) c. ter lägrimas nos olhos (vs. #ter nos olhos lägrimas) d. trazer ägua no bico (vs. #trazer no bico ägua/#no bico trazer ägua) e. ter um gräozinho na asa (vs. #ter na asa um gräozinho/#na asa ter um gräozinho) f. tirar nabos da pücara (vs. #tirar da pücara nabos/#da pücara tirar nabos) g. näo saber da missa a metade (vs. #näo saber a metade da missa/#da missa näo saber a metade) m IDENTIFICACÄO DA5 UNIDADES MULTILEXICAIS E AFERICÄO DOS SEUS GRAUS DE LEXICALIZACÄO 9.3.1.2 233 Tambem nos coocorrentes privilegiados a alteracäo da ordern pode levar ä perda do estatuto de unidade multilexical, como se ilustra a seguir: (28) a. congresso extraordinärio (vs. #extraordinärio congresso21) b. , pros e contras (vs. #contras e prös) c. claro e inequivoco (vs. #inequivoco e claro) d. certo e sabido (vs. #sabido e certo) Em contrapartida, noutras unidades multilexicais com uma lexicalizacäo mais fraca, a ordern de palavras e livre e o estatuto da sequencia como unidade multilexical mantem-se, independentemente da ordern, como se ilustra nos seguin-tes exemplos, retirados do corpus COMBINA, em que as duas versöes tem um alto Indice Combinatörio: (29) a. aumento considerävel/considerävel aumento b. silencio absoluto/absoluto silencio c. conhecimento previo/previo conhecimento d. consequencias graves/graves consequencias e. consequencias inevitäveis/inevitäveis consequencias f. atual situacäo/situacäo atual Tambem se verifica alteracäo da ordern de palavras em variantes de aforismos: (30) a. Cedo deitar e cedo erguer, da saüde e faz crescer./Deitar cedo e cedo erguer da saüde e faz crescer. b. Deus da nozes a quem näo tem dentes./Dä Deus nozes a quem näo tem dentes. c. Mais vale cair em graca do que ser engracado./Vale mais cair em graca do que ser engracado. d. A palavras loucas orelhas moucas./Orelhas moucas a palavras loucas. e. Pela boca morre o peixe./O peixe morre pela boca. f. Alcanca quem näo cansa./Quem näo cansa alcanca. g. O segredo e a alma do negöcio./A alma do negocio e o segredo. <♦ Insercäo de elementos novos na unidade multilexical Este e outro dos criterios que permitem avaliar o grau de lexicalizacäo de uma unidade multilexical. Quando a unidade multilexical e fortemente lexicalizada, a sequencia e totalmente coesa, näo permitindo a insercäo de qualquer novo ele-mento, em particular no seu interior; se isto acontece, a unidade multilexical torna--se numa sequencia livre (em (31), damos primeiro exemplos da unidade multilexical e depois, entre parenteses, exemplos das sequencias livres resultantes da insercäo de novos elementos): (31) a. sangue frio (vs. sangue muito/extremamente frio) b. arco do triunfo (vs. arco do grande triunfo) c. penas do inferno (vs. penas do terrivel inferno) d. desenhos animados (vs. desenhos muito animados) 21 Neste caso, a alteracäo semäntica deve-se ao facto de o adjetivo em anteposicäo ao nome adquirir sentido avaliativo (cf. Cap. 31). 234 9.3.1.2 PROCESSUS DE LEXICALIZACÄO e. fora de moda (vs. fora daquela moda) f. linguagem natural (vs. linguagem pouco natural) g. fazer prova (vs. fazer uma prova) Em contrapartida, alguns coocorrentes privilegiados admitem a insercäo de novos elementos (em geral, artigos, quantificadores, advérbios, adjetivos) que näo fazem propriamente parte da unidade multilexical: (32) a. votadoao abandono/votado a um completo abandono b. solucäo consensual/solucäo totalmente consensual c. autores consagrados/autores altamente consagrados d. perder a cabeca/perder totalmente a cabeca e. näo passar da cepa torta/näo passar nunca da cepa torta f. conhecer os cantos ä casa/conhecer bem os cantos ä casa O mesmo acontece em certos aforismos, como em quern conta um conto aumenta um ponto vs. quern conta um conto aumenta sempre urn ponto. ❖ Reducäo e extensäo da unidade multilexical Certas unidades multilexicais tém uma variante "curta" e uma variante "longa", sendo relativamente fácil, na maior parte dos casos, identificar qual delas é a básica. Quando a variante básica é a mais curta, diz-se que há extensäo (cf. querer ä forga vs. querer ä viva forgo); quando a variante básica é a mais longa, diz-se que há reducäo (cf. garrafa de vinho do Porto vs. garrafa de Porto). Contrariamente aos casos de "insercäo" analisados acima, nas unidades multilexicais formadas por extensäo, o elemento inserido (geralmente urn especi-ficador com caractérísticas semänticas de intensificador) é intuído pelos falan-tes como pertencendo ä unidade multilexical, e näo como um simples "acrescento", como em (32). Isto é, trata-se, claramente, de variantes curtas e longas, qualquer delas com o estatuto de unidade multilexical, no seu todo. Outra diferenca relativamente aos casos de insercäo é que, tanto nos casos de extensäo como nos de reducäo, as duas variantes säo igualmente reconhecidas pelos falantes como usuais. Däo-se alguns exemplos em (33) e (34) (este ultimo paradigma contendo aforismos): (33) a. com o propósito de/com o firme propósito de b. estar arranjado/estar bem arranjado c. deitar achas para a fogueira/deitar mais achas para a fogueira d. doenca contagiosa/doenca altamente contagiosa e. o päo de cada dia/o päo nosso de cada dia f. levar uma corrida/levar uma corrida em osso/levar uma corrida em pelo g. vai dar uma volta!/vai dar uma volta ao bilhar grande! h. ir para a rua/ir para o olho da rua (34) a. Gaba-te cesta que vais ä vindima./Gaba-te cesta rota que amanhä vais ä vindima. b. Gostos näo se discutem./Gostos e cores näo se discutem. c. Galinha pedrés näo a comas nem a dés./Galinha pedrés nem a comas nem a vendas nem a des. [DENTIFICACÁO DAS UNIDADES MULTILEXICAIS E AFERICÁO DOS SEUS CRAUS DE LEXICALIZACÁO 9.3.1.2 d. Mulher honrada nao tem ouvidos./Mulher honrada náo tem ouvidos nem olhos. e. Abril águas mil./Abril águas mil coadas (por um funil/por um mandli}. Nalguns casos, a variante da unidade multilexical pode ficar reduzida a um único elemento22: (35) a. espinha dorsal/espinha b. ensino secundário/secundário (cf. a foana anda no ensino secundário/a Joana anda no secundário) A extensao e a reducáo ocorrem apenas nalgumas unidades multilexicais, estando longe de constituir fenómenos produtivos, como se pode verificar nos seguintes exemplos, em que se comparam unidades multilexicais da mesma area semántica e com significados relacionados, mas em que só uma delas admite a reducáo/extensao: (36) a. Vai dar uma volta!/Vai dar uma volta ao bilhar grande! (vs. vaipassear!/#vai passear {ao jardim/á praia/ao campo}!) b. garrafa de vinho tinto/garrafa de tinto (vs. garrafa de água mineral/*garrafa de mineral) c. ensino secundário/secundário (cf. a Joana está no ensino secundário/a Joana está no secundário) (vs. ensino universitário/#universitário23 (cf. a Joana está no ensino universitário/*a Joana está no universitário) ❖ Modificacao da estrutura sintática das unidades multilexicais Á semelhanca do que acontece com as sequéncias livres, algumas unidades multilexicais podem ocorrer em construcoes sintáticas diferenciadas (nominaliza-coes, estruturas passivas, relativas, interrogativas, etc.), mas este fenómeno nao é de forma alguma generalizável a todas elas. Descrevem-se a seguir alguns des-tes casos24. ■v Nominalizacoes Algumas unidades multilexicais de natureza verbal admitem uma versáo nomina-lizada, com um núcleo nominal obtido por derivacáo deverbal a partir do verbo correspondente, como se ilustra nos seguintes exemplos: (37) a. abusar da confianca/abuso de confianca b. usar e abusar/uso e abuso c. renovar o contrato/renovacáo do contrato d. suspender o contrato/suspensao do contrato e. abrir as hostilidades/abertura das hostilidades f. abrir a sessáo/abertura da sessao 22 Nestes casos, temos uma palavra simples, fruto da reducáo de uma unidade multilexical da qual é sinónima. 23 Neste caso, dir-se-á está na universidade. 24 Na seccáo 9.1 Já tínhamos chamado a atencao para a importáncia destas propriedades, dando em (1)--(3) exemplos com a unidade multilexical fazer a cama a alguém. 9.3.1.2 PROCESSUS DE LEXICALIZACÄO Ja as seguintes unidades multilexicais näo admitem nominalizacäo: (38) a. brincar com o fogo (vs. #brincadeira com o fogo) b. andar ä nora (vs. #andamento ä nora) c. custar os olhos da cara (vs. #custo dos olhos da cara) Näo sendo possivel generalizar, podemos, no entanto, dizer que a composi-cionalidade da unidade multilexical parece favorecer a existencia de nominaliza-cöes. De facto, em (37), tanto o verbo como o nome mantem os significados que tem fora das unidades multilexicais. Pelo contrario, os sintagmas verbais de (38) säo todos eles näo composicionais, e o seu sentido global näo encontra correspon-dencia nas nominalizacöes. Modificadores adjetivais e preposicionais Algumas unidades multilexicais nominais cujo nücleo e modificado por um sin-tagma preposicional admitem uma alternativa adjetival para o modificador, como se ilustra a seguir: (39) a. fome de cäo/fome canina b. ödio de morte/odio mortal c. metodo de contracecäo/metodo contracetivo Outras, pelo contrario, näo admitem esta alternativa: (40) a. esfera de acäo (vs. #esfera ativa) b. golpe de misericördia (vs. #golpe misericordioso) c. ordern do dia (vs. #ordem diäria) d. cara de fome (vs. #cara esfomeada) e. fogo de artificio (vs. #fogo artificial) Pronominalizacäo A pronominalizacäo de um sintagma nominal dentro de uma unidade multilexical e possivel quando esta e formada por coocorrentes privilegiados e mantem um sentido composicional, como se ilustra em (41) (pöem-se as unidades multilexicais entre parenteses retos, e em itälico o elemento pronominalizado e o pronome): (41) a. Ele ia [celebrar um contrato], mas acabou por näo [o celebrar]. b. Ele tentou [contrair um emprestimo], mas acabou por näo conseguir [con-trai-/o]. c. Ele esta sempre a [dar conselhos]; na realidade, [dä-os] a torto e a direito. d. Adoras [gastar dinheiro]\ E fäcil [gastä-Zo], näo e? e. Tens que [abafar esse escändalo]. E preciso mesmo [abafä-Zo] ja! Em contrapartida, a pronominalizacäo e impossivel em unidades multilexicais fixas, altamente lexicalizadas e sem sentido composicional, como em ä noite todos os gatos säo pardos vs. #pardos, [ä noite todos os gatos o säo]25 (cf. (42)), o que faz com 25 Neste exemplo, o elemento que näo pode sei pronominalizado é um adjetivo predicativo (cf. ele é inteligente, sempre o foi). IDENTIFICACÄO DAS UNIDADES MULTILEXICAIS E AFERICÄO DOS SEUS GRAUS DE LEXICALIZACÄO 9.3.1.2 237 que este fenómeno seja um bom critério para distinguir, nestas sequéncias, aque-las que tem um alto grau de lexicalizacäo: (42) a. [Deste com os burrinhos na água], #mas oh se [deste com eles na água]! b. , Näo [abras as hostilidades], #porque quando [as abrires], vai ser o inferno! c. Isso vai-te [custar os olhos da cara], #vai-te mesmo [custá-Zos]! d. Ela [disse cobras e lagartos] de ti, #e [disse-as] ä pior pessoa! A pronominalizacäo envolve um empobrecimento lexical, e é provavelmente por esse motivo que ocorre menos facilmente nas unidades multilexicais que depen-dem, para o seu processamento, do material lexical que as constitui. -a- Passivizacäo As unidades multilexicais verbais com menor grau de lexicalizacäo podem ser passi-vizadas; em contrapartida, as unidades multilexicais verbais altamente lexicalizadas näo admitem a passivizacäo. Este contraste é ilustrado pela unidade multilexical ambígua fazer a cama (a alguém). Como se observou em 9.1, esta unidade multilexical pode ter como significado 'arranjar as roupas da cama (a alguém)', leitura na qual tern um fraco grau de lexicalizacäo, ou 'armar uma cilada (a alguém)', leitura na qual tem um alto grau de lexicalizacäo e um sentido näo composicional. Na pri-meira leitura pode ser passivizada, como se ilustra em (43a,b), mas na segunda näo, como se ilustra em (43c,d). Outros exemplos de casos que näo admitem passivizacäo säo dados em (43e,f) e (43g,h): (43) a. A mäe fez-lhe a cama logo de manhä. b. A cama foi-lhe feita pela mäe logo de manhä. c. Os colegas fizeram-lhe a cama e ele foi despedido. d. #A cama foi-lhe feita pelos colegas e ele foi despedido. e. O rapaz näo tornou chá em pequeno. f. #Chá näo foi tomado pelo rapaz em pequeno. g. Dá Deus nozes a quem näo tem dentes. h. #Nozes säo dadas por Deus a quem näo tem dentes. Outros fatores que contribuem para se avaliar o grau de lexicalizacäo de uma unidade multilexical säo: ♦t» Auséncia de determinante Quando a unidade multilexical contém um sintagma nominal, a auséncia de determinante no SN revela um alto grau de lexicalizacäo, sendo outro bom critério para distinguir as sequéncias mais lexicalizadas (cf. (44)) das menos lexicalizadas (como fazer a barba ou dar um passeiö): (44) a. meter água (vs. #meter a água) b. näo ser flor que se cheire (vs. #näo ser uma flor que se cheire) c. ficar a ver navios (vs. #ficar a ver os navios) d. näo arredar pé (vs. #näo arredar o pé) 9.3.2 PROCESSUS DE LEXICALIZACÄO <* Subcategorizacäo Algumas unidades multilexicais de natureza verbal, em geral fortemente lexicali-zadas, näo admitem um dos complementos que o verbo seleciona numa constru-cäo livre: (45) a. ajudar (#alguém) ä missa b. dar (#alguma coisa) äs de vila-diogo ❖ Construcöes com tópico e estruturas interrogativas e relativas A impossibilidade de os elementos nominais de uma unidade multilexical ocorre-rem em posicöes que näo sej am aquelas que correspondem ao seu estatuto argu-mental normal constitui prova do seu alto grau de flxidez; assim, um sintagma nominal contido numa unidade multilexical näo pode ser um tópico marcado nem ocorrer sob a forma de um constituinte interrogativo ou de um pronome relativo, trés elementos que tipicamente ocorrem na posicäo iniciál de uma ora-cäo (cf. Caps. 12, 48 e 39, respetivamente). Assim, correspondendo a (46a), näo se tem (46b-d): (46) a. Os colegas fizeram-lhe a cama e ele foi despedido. b. #A cama, os colegas üzeram-lha e ele foi despedido. [tópico] c. #Que cama é que os colegas lhe fizeram? [constituinte interrogativo] d. #A cama que os colegas lhe fizeram acabou com ele. [constituinte relativo] Propriedades semänticas das unidades multilexicais As propriedades semänticas permitem também classificar as unidades multilexicais em trés tipos, numa escala de maior ou menor especializacäo e motivacäo semän-tica: (i) unidades multilexicais (semanticamente) transparentes, (ii) unidades multilexicais (semanticamente) opacas e (iii) unidades multilexicais (semanticamente) semitransparentes. O conceito de "transparéncia semäntica" (cf., adiante, Caixa 3) é usado aqui como indicando a existéncia de algum grau de motivacäo ou funda-mentacäo semäntica, acessivel ao falante, que lhe permite "descodificar" o sentido da unidade multilexical; inversamente, a "opacidade semäntica" remete para uma situacäo em que o falante näo encontra qualquer fundamentacäo semäntica para descodificar o sentido de uma unidade. (i) As unidades multilexicais transparentes těm um significado literal e com-posicional (ou seja, obtido a partir do significado dos seus elementos constitutivos), o que as aproxima das sequéncias livres. Estes grupos säo considerados unidades multilexicais porque ocorrem frequentemente e constituem conjuntos estáveis, sendo muito comuns em linguagens de espe-cialidade (cf. acidente vascular cerebral, apneia obstrutiva do sono, consolidacäo ornamental), embora ocorram também na linguagem comum, como mostram os exemplos de (47): (47) consequéncias inevitáveis, em plena consciéncia, vaga de incéndios, säo e salvo, feito inédito, sigilo absoluta, direitos humanos, entrada livre, opiniäo publica, por artes mágicas, dívida externa, acima de qualquer suspeita, da pior espécie IDENTIFICACÄO DAS UNIDADES MULTILEXICAIS E AFERICÄO DOS SEUS GRAUS DE LEXICALIZACÄO 9.3.2 239 (ii) No extremo oposto, as unidades multilexicais semanticamente opacas säo as que tém uma "especializacäo semäntica" maxima. Neste caso, os falantes näo tém atualmente acesso a qualquer motivacäo ou fundamentacäo para "descodificar" o sentido global que adquiriram e que näo se deduz a partir dos seus componentes (cf. dar com os burrinhos na dgua, dar äs de vila-diogo, ir para o maneta)26. Consequentemente, esse sentido tem de ser aprendido, tal como se aprende o significado de uma palavra simples. Note-se também que nalgumas destas unidades multilexicais ocorrem elementos que, atualmente, fora delas, näo tém qualquer significado, como, por exemplo, os elementos sublinhados das expressöes por um triz, fazer jus, nem chus nem bus, por artes de berliques e berloques, e do provérbio lé com lé, cré com cré. Apresentam-se em (48) outros exemplos de unidades multilexicais semanticamente opacas: (48) a. alma do padeiro = buracos do päo b. menina dos olhos = pessoa preferida, pessoa em quem mais orgulho se tem c. dar äs de vila-diogo = fugir apressadamente d. dar com os burrinhos na água = falhar e. tirar nabos da púcara = tentar saber alguma coisa de forma dissimulada f. fazer o ninho atrás da orelha = enganar g. estar com a pulga atrás da orelha = estar desconfiado h. näo passar da cepa torta = näo progredir i. estar com um gräozinho na asa = estar um pouco alcoolizado j. encanar a perná ä rä = protelar, atrasar o desenvolvimento de alguma coisa k. ter macaquinhos no sótäo = ter manias/desconfiancas, Cismar em alguma coisa 1. fazer jus (a alguma coisa) = merecer (alguma coisa) m. por um triz = por pouco n. por uma unha negra = por pouco o. tomar chá em pequeno = ser bem-educado (iii) As unidades multilexicais semitransparentes säo aquelas em que alguns elementos mantém o seu significado literal, enquanto outros adquiriram sentidos figurados, essencialmente por processos metafóricos ou metoními-cos (cf. Cap. 8). Estas extensöes do sentido, no entanto, säo (ainda) familiäres para os falantes, o que empresta a este tipo de unidades multilexicais um certo grau de motivacäo semäntica. Säo exemplos, entre outros, baixar a cabeca, custar os olhos da cara (formados por metafora), ser um bom garfo (formado por metonímia). Algumas unidades deste tipo säo formadas com os "verbos leves" (cf. Cap. 28) dar, fazer, ter e tomar (cf. dar razäo, fazer anos, ter cabeca/tino, tomar banho, tomar 26 Relativamente a algumas destas unidades multilexicais, como dar äs de vila-diogo ou ir para o maneta, poi exemplo, é ainda possível encontrar hipóteses sobre a sua possível origem, mas o falante comum näo as conhece. 1 240 9.3.2 PROCESSUS DE LEXICALIZACÄO partidö). Como é típico dos grupos formados com verbos leves, o complemento direto destas expressöes é geralmente um grupo nominal (i.e., um sintagma nominal sem determinante (cf. Cap. 20)), e as expressöes säo tipicamente equivalentes a um unico verbo pleno, o que comprova o seu caráter unitário, do ponto de vista lexical é semäntico. Apresentam-se a seguir alguns exemplos: (49) a. fazer pressäo = pressionar b. dar início = iniciar c. dar valor = valorizar d. pór ům = tmalizar e. fazer frente = enfrentar f. tomar partido = optar Apresentam-se seguidamente alguns exemplos de unidades multilexicais semi-transparentes, organizadas segundo o processo semántico que determina a sua interpretacao figurada: (i) Comparacao (sao como umpero, fino como um coral, Undo como os amores, fresco que nem uma alface, magro que nem um carapau, dormir como uma pedra, viverem/ darem-se como Deus com os anjos) (ii) Metafora (palavras azedas, ideias brilhantes, carta fora do baralho, pau mandado, fruto proibido, arma de dots gumes, passar a pente fino, deitar achas na fogueira, dizer cobras e lagartos, as paredes těm ouvidos, voz de cana rachada, lágrimas de crocodile) (iii) Metonímia (fuga de cérebros, ser um bom garfo, ser um bom copo, ser uma boa cabega, pedir a mdo, beber um copo) (iv) Hipérbole (mil e uma coisas, morrer a rir, morrer de medo) (v) Eufemismo (ir desta para melhor, despedir-se da vida, ir para o céu, partir deste mundo) [3] Embora sejam nocoes relacionadas, a interpretacao nao composicional e a opacidade semántica (ou seja, a ausěncia de qualquer motivacao para a descodificacao do significado) nao sao conceitos completamente equivalentes, sendo possfvel encontrar unidades multilexicais com uma, mas nao com a outra propriedade. As unidades multilexicais composicionais sáo sempre semanticamente transparentes (cf. renovar um contrato, falta de preparagao) e as unidades multilexicais semanticamente opacas sao sempre nao composicionais (cf. dar ás de vila-diogo, poruma unha negra). No grupo das unidades semitransparentes, no entanto, encontram-se casos de nao composicionalidade, ainda que a interpretacao náo seja completamente opaca. Assim, por exemplo, baixar a cabega nao tem uma interpretacao composicional, pois nenhum dos seus elementos é usado no seu sentido literal. No entanto, muitos falantes podem considerá-la transparente porque existe um processo metafórico facilmente compreensivel, que compara o sentido estrito da expressao com o significado global de 'aceitacao/desisténcia' que se Ihe atribui; baixar a cabega, no sentido literal, representa uma postura corporal que pode corresponder a submissao, sujeicao. Ou seja, o sentido de uma unidade multilexical náo composicional tern de ser apreendido como um todo, mas a sua maior ou menor transparéncia/opacidade depende da i IDENTIFICACÄO DAS UNIDADES MULTILEXICAIS E AFERICÄO DOS SEUS GRAUS DE LEXICALIZACÄO 9.3.2.1 241 capacidade que o falante tem de recuperar a motivacäo de base, intuindo o sentido figurado que Ihe está associado, em funcäo de condicionantes lexicais, sintáticas, culturais, etc. Note-se também que, ao contrario do que acontece com as propriedades " formais, a determinafäo da transparéncia ou opacidade de uma unidade multilexical v implica uma certa dose de subjetividade. Em contrapartida, é mais fácil (e consensual) determinarse o sentido de uma unidade multilexical é composicional (ou seja, obtido a partir do significado das suas partes constitutivas) ou näo (tendo, neste caso, de ser aprendido de forma global). .3.2.1 Uso das unidades multilexicais em linguas especializadas Muitas unidades multilexicais säo usadas em dominios do conhecimento espe-cializados (embora, por vezes, possam entrar para o uso comum, como se discute adiante), como elementos das chamadas linguas especializadas. Exemplificam-se alguns casos a seguir: (i) Artes (natureza-morta, música de cämara, canto gregoriano, meio soprano, boca de cena, compasso binärio) (ii) Economia (oferta e procura, economia keynesiana, sistemas de valor, estruturas de mercado) (iii) Jurisprudéncia (deduzir acusagäo, decisäo sumária, pena agravada, matéria de facto) (iv) Politica (voto de conftanga, separagäo de podereš, minorias parlamentares) (v) Desporto (livre direto, corrida de fundo, falsa partida, salto ä vara, subir a fasquia) (vi) Marinha (amplitude da maré, ferro a pique, mar chäo, mar grosso, ä holina, vela latina) (viť) Energia (energia solar, energia eólica, energia hidráulica, energia nuclear, central nuclear, gas natural, painel solar) (viii) Zoológia - animais marinhos (linguado legitimo, linguado da areia, perca do Nilo, perca da rocha, pargo mulato, solha das pedras, f also pampo) (ix) Vestuário (fato de saia e casaco - também saia e casaco ou saia-casaco -, camisa de dormir, fato de banho, saltos altos, chapéu de palha) Tal como os diferentes dominios de especialidade, a diferenca de generös discursivos determinauma especializacäo das unidades multilexicais. Assim, algumas säo próprias do discurso técnico-científico, outras do discurso jornalístico, outras do discurso televisivo ou publicitário, etc. Daremos aqui exemplos de unidades multilexicais usadas no discurso técnico-científico e no discurso publicitário. Nas linguas especializadas do discurso técnico-científico, é muito comum o uso de unidades multilexicais de natureza nominal e com caráter denominativo, dada a necessidade de se atribuirem designacöes a novas descobertas científicas e a novas tecnologias ou produtos (cf. genoma humano, ácido desoxirribonucleico (ADN), tomo-grafia axial computorizada (TAC), energia solar, anténa parabólica, cartöes de memoria, computadorpessoal (PC)). 9.3.2.1 PROCESSOS DE LEXICALIZACÁO Nas línguas especializadas, os termos científicos e técnicos (incluindo as unidades multilexieais) admitem variacáo conceptual e denominativa (cf. Cabré 1999:120). Assim, contrariamente ao que tradicionalmente se considerava, esses termos (incluindo as unidades multilexieais) admitem sinonímia, como se exempliňca a seguir: (50) Marinha a. mar chao/mar de leite/mar de rosas b. mar grosso/mar cavado c. ferrar áncora/pór ancora (51) Zoologia (animals marinhos) a. bicuda gigante/barracuda gigante b. escorpiáo de água doce/peixe-sapo c. raia pintada/raia estrelada d. tubaráo-martelo/peixe-martelo (52) Física (energia) a. terrenos de cobertura/terrenos mortos b. carvao classiůcado/carváo calibrado (53) Medicina a. pressao arterial/tensáo arterial b. arteriograůa coronária/angiografia coronária c. doenca de Christmas/hemoůlia B d. esclerose em placas/esclerose múltipla Esta variacáo depende, muitas vezeš, dos públicos a que se destina o discurso científico e técnico, ou seja, do grau de especializacáo desse publico e também da situacáo comunicativa. Por exemplo, o mesmo conceito pode ser transmitido por uma unidade multilexical usada por especialistas - um termo - ou por uma unidade multilexical sinónima, mais típica do discurso oral ou eserito dirigido a leigos - uma expressáo comum - (cf. cefaleia vs. dor de cabega, melanoma maligno vs. canero da pele). Pode, ainda, observar-se variacáo diacrónica na terminologia (cf. holina ester-nida, forma antiga de holina folgada, trissomia xxi, termo que atualmente se usa para designar mongolismo, ou acidente isquémico transitório, que hoje substitui o termo ictus). Também é de notár que, tal como as palavras em geral, as unidades multilexieais científicas e técnicas podem passar a ser usadas em áreas de especialidade diferen-tes daquela em que tiveram origem: p.e., teoria do caos, termo inicialmente usado em física, é hoje usado em muitas disciplinas, da medicina á linguística. Levado ao seu extremo, este processo resulta na vulgarizacao da unidade multilexical (também chamada banalizacáo ou vocabularizacáo), ou seja, na sua passagem ao uso comum a partir de uma lingua de especialidade, com a consequente mudanca de estatuto de termo científico para vocábulo comum. Sáo exemplos děste processo expressoes como anos-luz e entrarem orbita, termos originados na astronomia e cor-rentemente usados, o primeiro, para designar hiperbolicamente grandes distáncias, e o segundo, o facto de alguém ter ficado completamente descontrolado; subir a fasquia, termo com origem no desporto e usado com o sentido de 'subir o nível'; IDENTIFICACÁO DAS UNIDADES MULTILEXICAIS E AFERICÁO DOS SEUS CRAUS DE LEXICALIZACAO 9.3.2.1 243 mar de rosas, termo metafórico da náutica, usado para designar um momento de calma e felicidade. Inversamente, há palavras (cf. rato, usado em informática) e unidades multi-lexicais nao especializadas (cf. correr um programa ou abrir uma janela, usados em informática), que passam a ser usadas como termos científicos ou técnicos, num processo chamado terminologizacáo. O discurso publicitário é um domínio que utiliza frequentemente unidades multilexicais de uso comum, "desconstruindo-as". Assim, p.e., a partir do aforismo diz-me com quern andas, dir-te-ei quem és, foi feito o anúncio dizemos com quem andamos [...] dir-lhe-áo quem somos (Markimagem)27; a partir das unidades multilexicais ter um parafuso a menos, dar uma maozinha ou fazer castelos no ar, encontram-se os seguintes anúncios publicitários: Voce tem um parafuso a menos? Nós nao (Fabory); Sempře que voce dá uma maozinha, alguém recebe duas (peditório nacionál da Abraco); Nestas férias nao faga castelos no ar... faga-os na areia (TAP Air Portugal)28. Inversamente, certas expressoes criadas em anúncios publicitários passam, por vezeš, para a linguagem comum, como, por exemplo, o slogan publicitário da autoria do poeta Alexandre O'Neill há mar e mar, há ir e voltar, para uma campanha de socorros a náufragos, que passou para a linguagem comum como um verdadeiro aforismo, ou o slogan publicitário para a Coca-Cola, da autoria de Fernando Pessoa, primeiro estranha-se, depois entranha-se, que passou a ser usado na linguagem comum relativamente a diversos produtos ou ideias novas. Também as diferentes situacoes de comunicacao em que se inserem os enun-ciados determinam a ocorréncia de diferentes unidades multilexicais próprias da interacáo discursiva. Neste caso, estao envolvidas unidades que correspondem a diferentes atos de fala e a distintas rotinas conversacionais, e que se especializam de acordo com a situacao: p.e., se os participantes se encontram face a face ou se comunicam a distáncia, se o fazem oralmente ou por escrito, segundo o maior ou menor grau de formalidade da interacáo, o tipo de discurso, etc. Alguns destes usos sáo exemplincados a seguir: (i) Formulas de saudacao {Rom dial Boa tardel Boa noite! Como está? Passou bem? Seja bem aparecido! Até qualquer dial Até depois! Até á vista!) (ii) Formulas de cortesia (Com licenga, Pego desculpa, Se faz favor, Paz favor de dizer, É servido?, Bom proveito!, Estimo as melhoras!) (iii) Formulas de organizacao do discurso (como ia dizendo, a propósito, por exemplo, por falar em, por um lado, por outro lado, em primeiro lugar) (iv) Formulas de início do discurso escrito (Meu caro amigo, Caro senhor, Excelen-tíssimo Senhor) (v) Formulas de fecho do discurso escrito (Um abrago, Um beijo, Com os meus melhores cumprimentos) Exemplo de Teixeira (2007). Exemplos de Coimbra (2000). 244 9.3.3 PROCESSUS DE LEXICALIZACÄO (vi) Formulas de modalizacäo (como sabe, pode crer, de facto, com efeito, em principio, quer dizer, isto e, de mais a mais) (vii) Estrategias de diälogo (Näoposso acreditar! Näo {vai/vais/väo} acreditar! Contado ^ ninguem acredita! Quem havia de dizer! Quem adivinhasse! Qual carapuga! Era so o que faltava! Näo faltava mais nada!) 9.3.3 Aspetos quantitativos das unidades multilexicais A intuicäo dos falantes näo e suficiente para identificar as inümeras combinatörias de palavras presentes em värios tipos de discurso como sendo unidades multilexicais; de facto, so o recurso a anälises quantitativas de corpora vastos e diversificados permite faze-lo, mediante a identificacäo das tendencias associativas das palavras e das suas cosselecöes preferenciais29. Por outras palavras, os falantes nativos combinam as palavras que formam as unidades multilexicais de forma adequada porque as restricöes combinatörias (as "cosselecöes") que as regem fazem parte do seu lexico mental, mas isso näo significa que tenham necessariamente consciencia do estatuto da combinacäo que produziram como unidade multilexical, sobretudo quando se trata de coocorrentes privilegiados30. Em contrapartida, num corpus, a existencia regular de padröes colocacionais e quantitativamente observävel. Por exemplo, para qualquer unidade multilexical arbiträria, e fäcil observar num corpus que, de entre um conjunto de palavras sinönimas ou quase sinönimas (cf. Cap. 8), apenas algumas (por vezes uma so) ocorrem na sua formacäo e que as outras näo ocorrem, ou ocorrem apenas pouco significativamente. Assim, p.e., de acordo com dados do corpus COMBINA, duas palavras que nos dicionärios säo dadas como sinönimas, total e absoluta, ocorrem em combinatörias distintas com IC significativos: com total mas näo com absoluta ocorreram, p.e., descalabro total, eclipse total, colapso total, colesterol total; em contrapartida, com absoluta mas näo com total ocorreram prioridade absoluta, recorde absoluta, monarquia absoluta, temperatura absoluta. E principalmente nas unidades multilexicais formadas por coocorrentes privilegiados, os quais, como foi dito, detem um menor grau de coesäo formal e semäntica, que a anälise quantitativa de dados empiricos se torna indispensävel para determi-nar o grau de tendencia associativa que existe entre os seus elementos. O estudo quantitativo inclui anälises de frequencia e outras anälises estatisticas, nomeada-mente o estabelecimento do Indice Combinatörio (IC) (cf. 9.3 e Notas 13 e 15). A identificacäo de unidades multilexicais atraves de dados quantitativos e feita com recurso a corpora linguisticos de grandes dimensöes. So assim, de facto, se pode evidenciar a existencia de associacöes lexicais padronizadas e obter informacäo sobre os seus significados e usos convencionais. Estas associacöes constituem um 29 Nao se trata aqui de "restricoes de selecao" de carater gramatical ou semantico (cf. Cap. 11), mas de associates lexicais que permitem identificar e caracterizar padroes de coocorrencia entre palavras, incluindo no piano gramatical e discursivo. 30 A este proposito, veja-se a seguinte passagem de Fellbaum (2007:2): «A idiomaticidade de uma lingua revela-se talvez melhor atraves dos erros que cometem os que estao a aprende-la.» (t.n.). IDENTIFICACÄO DAS UNIDADES MULTILEXICAIS E AFERICÄO DOS SEUS GRAUS DE LEXICALIZACÄO 9.3.3 245 aspeto importante da estrutura lexical de uma lingua31. Nesses corpora, identifica--se a frequéncia de ocorréncia de cada uma das palavras da sequéncia em estudo, assim como a frequéncia com que ocorre a sequéncia (estes dois tipos de dados permitem estabelecer o índice Combinatório). O índice Combinatório32 é um resultado estatístico que permite avaliar se, num dado corpus, a frequéncia da sequéncia é maior do que seria previsível relati-vamente ä frequéncia de cada um dos seus elementos; este resultado, por sua vez, permite também medir a forca da associacäo lexical existente entre os componentes da sequéncia. O índice Combinatório permite, ainda, avaliar se os elementos da expressäo tém tendéncia para ocorrer apenas ou quase exclusivamente juntos ou se também ocorrem com uma grande variedade de outras palavras que näo aquelas que compöem a expressäo em análise. Se uma determinada palavra ocorrer maiorita-riamente na expressäo em causa e se a sua frequéncia junto de outras palavras for reduzida, isso aponta para uma alta probabilidade de a expressäo ter um grau forte de lexicalizacäo. [4] A identificacäo das unidades multilexicais através de uma análise quantitativa torna patentes vários tipos de tendéncias associativas entre as palavras, de que se däo aqui exemplos para as palavras abolicäo e mág/co33: (i) a. aboligäo: abolicäo da escravatura (11,6), abolicäo da pena de morte (13), abolicäo das fronteiras fiscais (15), abolicäo das portagens (11,7), abolicäo do tráfico de escravos (14,4) b. mágico: artes mágicas (10,1), caixinha mágica (13,3), como que por artes mágicas (12,39), espelho mágico (8), flauta mágica (1 3,1), lanterna mágica (12,5), lugar mágico (7,2), momento mágico (6,9), palavra mágica (7,2), pofäo mágica (14,5), podereš mágicos (11,7), varinha mágica (15,7) Outras palavras há que ocorrem significativamente sempře combinadas com um numero muito restrito de palavras, como ínfimo: cf. ínfímo pormenor (13,3) e ínftmaparte (8,5). Alguns itens lexicais ocorrem frequentemente em unidades multilexicais, o que decorre da sua aplicabilidade a variadas areas da realidade extralinguística. Por exemplo, a palavra contrato entra numa vasta série de unidades multilexicais: (54) a. contrato a prazo, contrato a termo, contrato a termo certo, contrato sem termo b. contrato social, contrato coletivo, contrato coletivo de trabalho c. contrato de adjudicacäo, contrato de aluguer, contrato de arrendamento, contrato de compra e venda, contrato de promessa de compra e venda, contrato de concessäo de servicos, contrato de empreitada, contrato de 31 Cf. Sinclair (1991), Fernando (1996), Biber et al. (1999), Brinton e Traugott (2005), Altenberg (2005) e Bacelar do Nascimento et al. (2006). 32 Cf. Church e Hanks (1990:22ss) e Pereira (1994). 33 Exemplos retirados do corpus COMBINA. Os nümeros entre parenteses säo os dos Indices Combinatörios que se registaram neste corpus. 1 246 9.3.3 PROCESSUS DE LEXICALIZACÁO fornecimento de servicos, contrato de locacäo financeira, contrato de manutencäo, contrato de prestacäo de servicos, contrato de leasing d. regime juridico do contrato, termos do contrato, cláusulas do contrato, data do contrato, minuta do contrato, modelo de contrato, denuncia do contrato, duracäo do contrato, execucäo do contrato, renovacäo do contrato, final do contrato, incumprimento do contrato, cessacäo do contrato, rescisäo do contrato, revisäo do contrato, alteracäo do contrato, vigéncia do contrato As análises quantitativas apontam, ainda, para a recorréncia de diversos tipos de unidades multilexicais, do ponto de vista da sua estrutura gramatical. Assim, säo particularmente frequentes as seguintes estruturas: (i) Nome + adjetivo (agäo prolongada, ajuda humanitäria, ano escolar, ano letivo, ar livre, area coberta, boletim meteorológico, cadeia hierárquica, centro comercial, classe média, condomínio fechado, construgäo civil, culturageral, direitos humanos, drogas ilicitas, entrada livre, estado lastimoso, estrutura hierárquica, facto consumado, fluxo migratório, fogo posto, fonte ßdedigna, forga aérea, formula mágica, guerra aberta, habilitagöes literárias, luto carregado, mercado negro, nomes sonantes, opiniäo publica, orla maritima, ponte aérea, populacäo ativa, suplemento alimentär) (ii) Nome + de + nome (ar de famttia, area de servigo, arma de fogo, ato de misericór-dia, cabega de casal, caixa de óculos, caminho-de-ferro, camisa-de-forgas, campo de agäo, cara depau, carro/carrinho de linhas, carta de recomendagäo, dia de anos, direito de anténa, dor de alma/dó de alma, esfera de agäo, fome [de cäo/de lobo], golpe de misericórdia, motivo de forga maior, orelhas de abano, paz de alma, periodo de garantia, porto de abrigo, prazo de garantia, qualidade de vida, razäo de forga maior, rede de abastecimento, sessäo de abertura, sistema de abastecimento, teia de aranha) (iii) Sintagmas verbais com verbos leves (dar ajuda, dar autorizagäo, dar inicio, dar origem, dar resposta, darum beijo, dar um passeio; fazer abarba, fazer batota, fazer criticas, fazer perguntas, fazerpressäo, fazer queixa, fazer uso; meter dó, metermedo; pór em risco; ter admiragäo, ter duvidas, ter medo, ter necessidade, ter paciěncia, terpena) Concluindo, as unidades multilexicais näo säo casos marginais, antes cons-tituem uma parte importante da producäo lexical34, como diversos estudos sobre corpora rem demonstrado: näo só säo muito recorrentes no discurso, mas também é linguisticamente signiůcativo o seu estatuto na gramática e no léxico mental dos falantes (cf. Fellbaum 2007:2), conforme se procurou mostrar neste capítulo. 34 Moon (1998:57ss) refere a grande recorréncia das unidades multilexicais, em correlacäo também com a tipologia dos textos estudados, e Sinclair (2004), usando uma definicäo lata de unidade multilexical, afirma que, segundo estimativas feitas sobre corpora ingleses, 80% das ocorrěncias das palavras säo cosselecöes, ou seja, apenas 20% seräo escolhas independentes.