Table Of Contentunesp
UNIVERSIDADE ESTADUAL PAULISTA
Faculdade de Ciências e Letras
Campus de Araraquara - SP
ALINE CAMILA LENHARO
DESCRIÇÃO LÉXICO-GRAMATICAL E FUNCIONAL DOS VERBOS
PRONOMINAIS DO PORTUGUÊS BRASILEIRO COM VISTAS AO
APERFEIÇOAMENTO DA BASE DE VERBOS DA WORDNET
BRASILEIRA E DO ALINHAMENTO SEMÂNTICO DESTA À BASE
DE VERBOS DA WORDNET NORTE-AMERICANA
ARARAQUARA – SP
2014
ALINE CAMILA LENHARO
DESCRIÇÃO LÉXICO-GRAMATICAL E FUNCIONAL DOS VERBOS
PRONOMINAIS DO PORTUGUÊS BRASILEIRO COM VISTAS AO
APERFEIÇOAMENTO DA BASE DE VERBOS DA WORDNET
BRASILEIRA E DO ALINHAMENTO SEMÂNTICO DESTA À BASE DE
VERBOS DA WORDNET NORTE-AMERICANA
Tese apresentada ao Programa de Pós-Graduação
em Linguística e Língua Portuguesa da Faculdade
de Ciências e Letras – Unesp/Araraquara, como
requisito para a obtenção do título de Doutor em
Linguística e Língua Portuguesa.
Linha de pesquisa: Análise Fonológica,
Morfossintática, Semântica e Pragmática.
Orientadora: Dra. Angélica Terezinha Carmo
Rodrigues
Bolsa: CNPq
ARARAQUARA – SP.
2014
Lenharo, Aline Camila
Descrição léxico-gramatical e funcional dos verbos pronominais do
português brasileiro com vistas ao aperfeiçoamento da base de verbos da
wordnet brasileira e do alinhamento semântico desta à base de verbos da
wordnet norte-americana / Aline Camila Lenharo – 2014
238 f. ; 30 cm
Tese (Doutorado em Linguística e Língua Portuguesa) – Universidade
Estadual Paulista “Júlio de Mesquita Filho”, Faculdade de Ciências e Letras
(Campus de Araraquara)
Orientador: Angélica Terezinha Carmo Rodrigues
l. Língua portuguesa -- Brasil. 2. Linguística. 3. Lexicologia.
I. Título.
ALINE CAMILA LENHARO
DESCRIÇÃO LÉXICO-GRAMATICAL E FUNCIONAL DOS VERBOS PRONOMINAIS DO
PORTUGUÊS BRASILEIRO COM VISTAS AO APERFEIÇOAMENTO DA BASE DE VERBOS
DA WORDNET BRASILEIRA E DO ALINHAMENTO SEMÂNTICO DESTA À BASE DE
VERBOS DA WORDNET NORTE-AMERICANA
Tese de Doutorado apresentada ao Programa de
Pós-Graduação em Linguística e Língua
Portuguesa da Faculdade de Ciências e Letras –
Unesp/Araraquara, como requisito para a obtenção
do título de Doutor em Linguística e Língua
Portuguesa.
Linha de pesquisa: Análise Fonológica,
Morfossintática, Semântica e Pragmática.
Bolsa: CNPq
Data de aprovação: 26/05/2014
MEMBROS COMPONENTES DA BANCA EXAMINADORA:
Presidente e Orientadora: Dra. Angélica Terezinha Carmo Rodrigues
UNESP – Faculdade de Ciências e Letras – Araraquara/SP.
Membro Titular: Dra. Rosane de Andrade Berlinck
UNESP – Faculdade de Ciências e Letras – Araraquara/SP.
Membro Titular: Dra. Flavia Bezerra de Menezes Hirata-Vale
UFSCar – Centro de Educação e Ciências Humanas – São Carlos/SP.
Membro Titular: Dra. Magali Sanches Duran
Pós-doutoranda na USP – Instituto de Ciências Matemáticas e de Computação – São Carlos/SP.
Membro Titular: Dr. Tiago Timponi Torrent
UFJF – Faculdade de Letras – Juiz de Fora/MG.
Membro Suplente: Dra. Ana Eliza Barbosa de Oliveira Baptista
Profa. Substituta – UFSCar – Centro de Educação e Ciências Humanas – São Carlos/SP.
Membro Suplente: Dra. Gladis Massini-Cagliari
UNESP – Faculdade de Ciências e Letras – Araraquara/SP.
Membro Suplente: Dr. Helio Roberto de Moraes
FATEC – Faculdade de Tecnologia – Mococa/SP.
Local: Universidade Estadual Paulista
Faculdade de Ciências e Letras
UNESP – Campus de Araraquara
Dedico este trabalho a quatro pessoas muito amadas:
Rodrigo, meu marido, o meu maior incentivador, e meus sobrinhos
Alice, Caio e Helena, como um incentivo aos estudos.
AGRADECIMENTOS
Agradeço ao meu marido, meu amigo e companheiro, Dr. Rodrigo dos Santos: Ro,
obrigada por sua constante presença e por seu apoio. Obrigada por acreditar no meu potencial,
especialmente quando eu mesma não acreditava. Sem você, sem o seu incentivo, o curso de
Doutorado seria um sonho distante e este trabalho não teria sido realizado!
Agradeço aos meus orientadores, Dra. Angélica Terezinha Carmo Rodrigues,
especialmente por ter aceitado o convite de assumir a orientação de uma pesquisa já em
andamento, e Dr. Bento Carlos Dias da Silva, pelos longos anos de ensino e orientação que
me ajudaram a trilhar o caminho até aqui. Muito obrigada aos dois.
Agradeço aos integrantes da Banca Examinadora: Dra. Ana Eliza Barbosa de
Oliveira Baptista, Dra. Flavia Bezerra de Menezes Hirata-Vale, Dra. Gladis Massini-Cagliari,
Dr. Helio Roberto de Moraes, Dra. Magali Sanches Duran, Dra. Rosane de Andrade Berlinck
e Dr. Tiago Timponi Torrent, pelas contribuições que trouxeram e pelas que trarão. Obrigada
pela atenção dedicada.
Agradeço também a todos os professores que, em alguma medida, contribuíram com
minha formação e me instigaram a buscar, cada vez mais, o conhecimento – incluindo, com
carinho, além dos professores da Faculdade de Ciências e Letras da Unesp de Araraquara, os
professores da Escola Estadual “Prof. Sebastião Inoc Assumpção”, de Arealva, e do Colégio
Técnico Industrial “Prof. Isaac Portal Roldán”, da Unesp, de Bauru – especialmente os
professores Vera Aparecida do Prado Furlanetti, Ana Flávia Lopes Lenharo e Luiz Vitor
Martinello, que fizeram com que eu me apaixonasse pela leitura e contribuíram com minha
formação em língua portuguesa.
Agradeço, por fim, ao CNPq, pelo financiamento da pesquisa.
RESUMO
Esta tese abrange temas de dois domínios complementares – o Domínio Linguístico e o
Domínio Linguístico-Computacional. No Domínio Linguístico, este trabalho apresenta uma
sistematização das diferentes propostas de classificação dos verbos pronominais do português,
estabelece critérios para identificar os diferentes subtipos de verbos pronominais, construções
do tipo [verbo+SE], e fornece uma proposta de formalização, baseada no Funcionalismo
Holandês, para esses diferentes tipos de [verbo+SE]. Além disso, apresenta diferentes
possibilidades de realização dos verbos pronominais no Brasil. Por fim, observando a
interação entre léxico e gramática, situa os verbos pronominais, especialmente os do tipo
[verbo+SE ], entre as idiossincrasias do léxico e a regularidade da gramática. No
inerente
Domínio Linguístico-Computacional, a partir da apresentação das redes do tipo wordnet,
descreve os principais tipos de alinhamento semântico verificados entre a WordNet de
Princeton e as demais wordnets criadas, especialmente aqueles verificados no alinhamento
entre a base de verbos da WordNet.Br e a base de verbos da wordnet americana. De modo
aplicado, esta pesquisa propõe o refinamento de alguns synsets de verbos constituídos por
verbos+SE, identificando quais são compostos por verbos pronominais do tipo
[verbo+SE ] e estabelecendo seus alinhamentos com os synsets correspondentes do
inerente
inglês. Esta tese fornece, assim, um parâmetro para o refinamento dos demais synsets de
verbos pronominais da base da WordNet.Br.
Palavras-chave: verbo pronominal, clítico se, alinhamento semântico, Processamento
Automático de Língua Natural, wordnets, WordNet.Br.
ABSTRACT
This doctoral dissertation discusses the Brazilian Portuguese pronominal verbs in two
complementary domains – Linguistic Domain and Linguistic-Computational Domain. In the
Linguistic Domain, it presents a systematization of the different classification proposals of
Portuguese pronominal verbs, establishes an identification criterion for the different subtypes
of pronominal verbs, i.e., constructions of the type [verb+SE], and provides a formal proposal
for different [verb+SE] types, based on Dutch Functionalism. Furthermore, it presents
different possibilities of Brazilian pronominal verbs realizations. At last, through the
observation of lexicon and grammar interaction, it places the pronominal verbs, especially
those with [verb+SE ] form, between the lexicon idiosyncrasies and grammar regularity.
inherent
In the Computational-Linguistic Domain, after presenting wordnet projects, it describes the
main types of semantic alignment that can be built between Princeton WordNet and other
wordnets created, especially those found in the alignment between the WordNet.Br verbs base
and American verbs wordnet. In an applied mode, this research proposes the refinement of
some verbs synsets composed of verbs+SE, focusing on which are composed of pronominal
verbs of [verb+SE ] type and on the establishment of their alignment with correspondent
inherent
Princeton WordNet synsets. Thus, this dissertation provides a parameter for refining other
pronominal verbs synsets from WordNet.Br base.
Keywords: pronominal verb, clitic SE, semantic alignment, Automatic Processing of Natural
Language, wordnets, WordNet.Br.
SUMÁRIO
1 INTRODUÇÃO ............................................................................................................................... 10
2 OS VERBOS PRONOMINAIS ..................................................................................................... 18
2.1 O problema: a discrepância verificada entre definições/classificações dos verbos
pronominais em obras lexicográficas e gramaticais 19
2.1.1 Panorama dos estudos linguísticos sobre os verbos pronominais ................................................. 36
2.2 Sistematização dos diferentes tipos de clítico SE dos verbos pronominais 41
2.2.1 Sistematização de critérios para a identificação dos diferentes subtipos de verbos+SE ............... 49
2.3 Proposta de representação formal dos verbos pronominais 64
3 O COMPORTAMENTO DOS VERBOS PRONOMINAIS ....................................................... 69
3.1 Os diferentes usos do clítico SE no Brasil 71
3.2 Processos linguísticos concernentes aos verbos pronominais 81
3.2.1 Os verbos pronominais entre as idiossincrasias do léxico e a regularidade da gramática ............. 93
4 AS REDES WORDNETS .............................................................................................................. 99
4.1 A WordNet de Princeton 99
4.2 A EuroWordNet 115
4.3 A WordNet.Br 125
5 OS VERBOS PRONOMINAIS E A WORDNET.BR ............................................................... 138
5.1 Proposta de refinamento de synsets da WN.Br 146
6 CONCLUSÃO ................................................................................................................................ 184
REFERÊNCIAS ................................................................................................................................ 190
APÊNDICES ..................................................................................................................................... 204
APÊNDICE 1: Listagem comparativa dos verbos com SE oriundos do VOLP e do Webster’s 205
APÊNDICE 2: Metodologia empregada na pesquisa do Córpus web e resultados obtidos 208
ANEXO 1 .......................................................................................................................................... 235
Description:ajustar: O projeto OpenSUSE I]ajustou seu cronograma para permitir uma versão de teste adicional., aplicar: A] Aplicou a LEMLE, Miriam. Análise