SlideShare uma empresa Scribd logo
1 de 16
technology

from seed
ESPERTO	
	
SISTEMA	DE	PARAFRASEAMENTO	PARA	
EDIÇÃO	E	REVISÃO	DE	TEXTO		
	
	
Anabela	Barreiro	
Programa Páginas de Português -Antena 2
entrevista disponível em:
https://www.rtp.pt/play/p263/e314065/paginas-de-portugues
Lisboa, 30 de Outubro de 2017
•  eSPERTo	 -	 acrónimo	 de	 Sistema	 de	 Parafraseamento	 para	
Edição	e	Revisão	de	Texto		
•  O	principal	objetivo	do	projeto	eSPERTo	é	o	desenvolvimento	
de	 um	 sistema	 de	 parafraseamento,	 i.e.,	 um	 sistema	 que	
identiCica	e	gera	paráfrases	
	
O	que	é	o	eSPERTo?	
2
•  Proveniente	 do	 grego,	 a	 palavra	 “para-phrasis”,	 signiHica	
forma	adicional	de	expressão,	i.e.,	dizer	a	mesma	coisa	por	
outras	palavras	
•  A	 língua	 é	 um	 instrumento	 de	 comunicação	 riquíssimo.	
Existem	 muitas	 formas	 de	 transmitir	 a	 mesma	 mensagem	
(ou	 a	 mesma	 ideia)	 usando	 palavras,	 expressões	 ou	 frases	
diferentes	
–  Quando	lemos	um	texto,	ouvimos	uma	notícia	ou	uma	conversa	e	
a	contamos	a	terceiros,	estamos	a	parafrasear		
•  Parafrasear	um	texto	signiHica	recriá-lo	com	outras	palavras,	
mantendo	a	sua	essência	original	
O	Que	é	uma	Paráfrase?	
3
•  construções	com	verbos	suporte	a	partir	de	verbos	e	vice-
versa	
–  a	investigadora	fez	a	apresentação	do	projeto	de	investigação	>	
a	investigadora	apresentou	o	seu	projeto	de	investigação	
•  frases	activas	a	partir	de	frases	passivas	e	vice-versa		
–  o	rapaz	comeu	a	maçã	>	a	maçã	foi	comida	pelo	rapaz	
•  orações	relativas	a	partir	de	orações	participais	e	vice-versa	
–  o	livro	que	foi	escrito	por	António	Lobo	Antunes	>	O	livro	
escrito	por	António	Lobo	Antunes	
•  expressões	adjetivais	idênticas	
–  o	homem	Americano	>	o	homem	dos	EUA	>	o	homem	de	
nacionalidade	americana	>	o	homem	de	origem	americana	
Que	Paráfrases	são	geradas	pelo	
eSPERTo?	
4
As	 paráfrases	 são	 usadas	 para	 Hins	 explicativos,	 interpretativos	
ou	simpliHicadores,	etc.,	dependendo	das	necessidades	do	falante	
•  Interpretação	 de	 termos	 técnicos	 ou	 conceitos/ideias	
complexas	 em	 palavras	 simples	 ou	 expressões	 fáceis	 de	
entender	 para	 o	 falante	 comum,	 não	 especialista	 ou	 menos	
familiarizado	com	terminologias	ou	complexidade	linguística		
•  SimpliCicação	 de	 conceitos/ideias	 através	 do	 uso	 de	 uma	
gramática	simples,	de	modo	a	tornar	clara	a	comunicação	
•  ClariCicação	-	melhorar	a	compreensão	da	comunicação	
•  Redução	 -	 tornar	 um	 texto	 mais	 sucinto,	 conciso,	 menos	
”palavroso”	 através	 da	 eliminação	 de	 repetições	 e	 palavras	
que	não	adicionam	novo	signiHicado	
Funções	da	Paráfrase	
5
•  Estilística	 -	 transmitir	 uma	 mensagem	 num	 estilo	 diferente,	
mais	 ou	 menos	 formal,	 mais	 ou	 menos	 direto,	 metafórico,	
consistente,	uniforme,	etc.		
•  Explicativa-referencial	-	deHinir	termos	ou	conceitos	de	um	
país	estrangeiro	e	diferentes	realidades	socioculturais	
•  Valorização	-	adicionar	valor	/	riqueza	linguística	a	uma	frase	
ou	texto	sem	torná-lo	mais	complexo	-	oportunidades	de	
construir	textos	que	tenham	mais	valor	para	o	público-alvo	
•  Fluência	-	manter	a	Hluência	numa	tradução	
Funções	da	Paráfrase	
6
•  O	 uso	 de	 paráfrases	 para	 tornar	 um	 texto	 mais	
compreensível	
–  Em	oftalmologia,	o	termo	infecção	periorbital	signiHica	infecção	
da	 derme	 e	 tecidos	 associados	 ao	 redor	 dos	 olhos	 ou	 uma	
infecção	 do	 sistema	 lacrimal.	 Assim,	 o	 adjetivo	 periorbital	 é	
parafraseado	pela	expressão	ao	redor	do	olho,	de	modo	que	um	
não-especialista	possa	entender	o	termo	
•  ou	mais	conciso	
–  Em	 escrita	 técnica	 controlada,	 o	 escritor	 técnico	
deliberadamente	escolhe	palavras	que	expressam	um	signiHicado	
mais	sucinto	e	claro	
–  técnica	didática	utilizada	nas	aulas	de	escrita	no	ensino	da	língua	
Funções	da	Paráfrase	
7
•  Desenvolvimento	de	uma	aplicação	interativa	na	web	que	
tem	por	detrás	um	gerador	de	paráfrases	
•  Quando	se	fala	de	geração	de	paráfrases,	fala-se	de	gramática	
transformacional.	Mas,	o	sistema	também	precisa	de	um	
módulo	de	aquisição	de	paráfrases,	que	pode	ser	de	base	
gramatical	ou	de	base	estatística,	usando	métodos	de	
aprendizagem	automática	ou	redes	neuronais,	a	“nova	
tendência”	em	PLN,	ou	de	base	híbrida,	utilizando	uma	
combinação	de	técnicas	e	incorporando	os	diferentes	avanços	
da	tecnologia	da	linguagem	
•  Actualmente,	as	ferramentas	existentes	ainda	pouco	mais	
oferecem	do	que	a	correção	ortográHica	e	ligeira	correção	
gramatical.	Não	oferecem	sugestões	de	reescrita.	O	eSPERTo	
oferece	sugestões	
Quais	são	os	principais	objetivos	do	
eSPERTo?	
8
•  Depois	de	um	sistema	de	parafraseamento	robusto,	que	
contemple	um	grande	número	de	paráfrases	e	paráfrases	cada	
vez	mais	complexas,	as	aplicações	são	variadíssimas	
•  Uma	delas	é	a	de	uma	ferramenta	para	ser	utilizada	num	
ambiente	de	e-learning,	mas	não	só,	pode	ser	utilizada	em	
qualquer	ambiente	de	auxílio	à	escrita	de	frases	e	textos	para	
estudantes	de	português	(tanto	os	que	estão	a	aprender	
português	como	língua	estrangeira,	como	falantes	nativos	que	
estão	a	aprender	a	melhorar	a	sua	própria	língua	e	a	adquirir	
competências	de	leitura	e	escrita)	
A	quem	se	destina	o	eSPERTo?	
9
•  Um	eSPERTo	mais	elaborado	linguisticamente,	com	paráfrases	
de	grande	precisão	pode	servir	também	para	tradutores	
proCissionais	e	editores	e	revisores	de	textos	escritos	em	
língua	portuguesa,	bem	como	em	outros	ambientes	
industriais,	para	auxiliar	escritores	de	escrita	técnica	em	
busca	do	termo	“exato”,	na	produção	e	optimização	de	
documentação	técnica	e	especializada,	se	o	sistema	estiver	
capacitado	de	terminologia	e	aplicação	de	funcionalidades	de	
automatização	(reescrita	controlada)	
A	quem	se	destina	o	eSPERTo?	
10
•  Um	sistema	de	parafraseamento	pode	ser	também	de	utilidade	
para	os	jornalistas	aumentarem	a	sua	produtividade,	i.e.,	a	
eHicácia	e	a	rapidez	na	escrita	de	notícias,	artigos,	etc.	
podendo	aumentar	simultaneamente	a	sua	qualidade	
•  Quando	utilizadas	na	área	da	produção	escrita,	as	paráfrases	
permitem	criar	textos	mais	Hluentes	e	com	mais	variedade	
linguística	
•  Um	sistema	de	parafraseamento	pode	também	ser	utilizado	
em	pesquisa	e	extração	de	informação	porque	as	paráfrases	
ajudam	em	tarefas	de	categorização	de	textos	e	no	
mapeamento	de	textos	com	características	semelhantes.	Estas	
aplicações	ainda	não	foram	cientiHicamente	testadas.	
	
A	quem	se	destina	o	eSPERTo?	
11
•  A	utilidade	dos	recursos	parafrásticos	que	alimentam	o	
eSPERTo	já	foi	investigada	em	2	outros	cenários	aplicativos:	
–  num	sistema	de	pergunta-resposta	(sistema	de	diálogo)	de	um	
agente	virtual	inteligente	que	conversa	com	utilizadores	
humanos.	Os	recursos	parafrásticos	permitem	aumentar	e	
melhorar	o	conhecimento	linguístico	deste	tipo	de	agentes	
aumentando-lhe	a	capacidade	de	compreensão	e	de	resposta	
(e.g.,	responder	a	perguntas	independentemente	de	como	estas	
perguntas	sejam	feitas)	
–  numa	ferramenta	de	criação	de	resumos	de	textos	maiores.	A	
utilização	de	formas	de	expressão	mais	sintéticas	são	recursos	
de	grande	utilidade	para	tarefas	de	sumarização.	A	
identiHicação	de	paráfrases	permite	que	a	informação	entre	
documentos	seja	condensada	tornando	os	resumos	gerados	de	
melhor	qualidade	
A	quem	se	destina	o	eSPERTo?	
12
•  As	paráfrases	são	recursos	linguísticos-chave	na	
interpretação	e	geração	de	linguagem	natural	e,	como	tal,	
desempenham	um	papel	muito	importante	nas	aplicações	de	
processamento	de	linguagem	natural,	não	só	para	o	
português	como	para	qualquer	outra	língua	
•  Mas,	as	paráfrases	podem	ser	utilizadas	para	Cins	educativos	
e	um	parafraseador	pode	ter	um	enorme	impacto	no	processo	
de	ensino	e	aprendizagem	da	língua	portuguesa	
Que	inCluência	pode	ter	o	eSPERTo	na	língua	
portuguesa?	
13
Ao	nível	do	ensino,	por	exemplo,	as	paráfrases	permitem:	
–  avaliar	o	nível	de	conhecimento	da	língua	
–  auxiliar	a	compreensão	das	frases	
–  reduzir	a	complexidade	na	compreensão	de	um	texto	
(simpliHicação	de	frases	longas	e	complexas)	
–  reduzir	a	sua	ambiguidade	
–  aumentar	a	sua	clareza	
–  eliminar	redundâncias	
–  ajudar	na	sua	interpretação		
•  facilitar	a	interpretação	de	expressões	idiomáticas	de	diHícil	
interpretação	para	falantes	não	nativos	do	português	ou	
mesmo	de	falantes	nativos	
•  facilitar	a	compreensão	de	expressões	mais	técnicas	
Que	inCluência	pode	ter	o	eSPERTo	na	língua	
portuguesa?	
14
•  As	paráfrases	podem	também	servir	para	edição	estilística	
em	que	o	utilizador	pode	optar	por	um	estilo	mais	conciso	e	
claro	com	redução	da	palavrosidade	que	nada	acrescenta	ao	
signiHicado	de	um	texto,	ou	até	aumentar	o	número	de	
palavras	de	um	texto,	se	o	utilizador	preferir	um	estilo	menos	
conciso	
•  Por	último,	gostaria	de	mencionar	a	importância	das	
paráfrases	para	a	tradução	e,	nomeadamente,	para	a	tradução	
automática,	no	sentido	de	poderem	contribuir	para	uma	
tradução	mais	Hluente/natural	e,	consequentemente,	
permitirem	uma	melhoria	da	sua	qualidade,	sendo	usadas	nas	
tarefas	e	pré-	e	pós-edição,	mas	também	em	tarefas	de	
avaliação	dos	sistemas	de	tradução	
Que	inCluência	pode	ter	o	eSPERTo	na	língua	
portuguesa?	
15
16	
anabela.barreiro@inesc-id.pt

Mais conteúdo relacionado

Mais de INESC-ID (Spoken Language Systems Laboratory - L2F)

Mais de INESC-ID (Spoken Language Systems Laboratory - L2F) (20)

Multi3Generation@INGL2020
Multi3Generation@INGL2020Multi3Generation@INGL2020
Multi3Generation@INGL2020
 
NooJ 2020 presentation
NooJ 2020 presentationNooJ 2020 presentation
NooJ 2020 presentation
 
PROPOR2020_Barreiroetal
PROPOR2020_BarreiroetalPROPOR2020_Barreiroetal
PROPOR2020_Barreiroetal
 
Análise comparativa das edições portuguesa e brasileira de Os livros que dev...
Análise comparativa das edições portuguesa e brasileira de  Os livros que dev...Análise comparativa das edições portuguesa e brasileira de  Os livros que dev...
Análise comparativa das edições portuguesa e brasileira de Os livros que dev...
 
Welcome session 3rd Annual MC Meeting - enetCollect COST Action
Welcome session 3rd Annual MC Meeting - enetCollect COST ActionWelcome session 3rd Annual MC Meeting - enetCollect COST Action
Welcome session 3rd Annual MC Meeting - enetCollect COST Action
 
Syntactic-semantic analysis for information extraction in biomedicine
Syntactic-semantic analysis for information extraction in biomedicineSyntactic-semantic analysis for information extraction in biomedicine
Syntactic-semantic analysis for information extraction in biomedicine
 
Cross language semantic relations between English and Portuguese
Cross language semantic relations between English and PortugueseCross language semantic relations between English and Portuguese
Cross language semantic relations between English and Portuguese
 
Paraphrasing biomedical support verb constructions for machine translation
Paraphrasing biomedical support verb constructions for machine translationParaphrasing biomedical support verb constructions for machine translation
Paraphrasing biomedical support verb constructions for machine translation
 
ReWriter for legal text
ReWriter for legal textReWriter for legal text
ReWriter for legal text
 
Chatbots for Language Learning
Chatbots for Language LearningChatbots for Language Learning
Chatbots for Language Learning
 
eSPERTo’s Paraphrastic Knowledge Applied to Question-Answering and Summarization
eSPERTo’s Paraphrastic Knowledge Applied to Question-Answering and SummarizationeSPERTo’s Paraphrastic Knowledge Applied to Question-Answering and Summarization
eSPERTo’s Paraphrastic Knowledge Applied to Question-Answering and Summarization
 
Barreiro et al POP@PROPOR2018-informal2formal-language
Barreiro et al POP@PROPOR2018-informal2formal-languageBarreiro et al POP@PROPOR2018-informal2formal-language
Barreiro et al POP@PROPOR2018-informal2formal-language
 
Rebelo-Arnold et al POP@PROPOR2018-EP-BP-alignments
Rebelo-Arnold et al POP@PROPOR2018-EP-BP-alignmentsRebelo-Arnold et al POP@PROPOR2018-EP-BP-alignments
Rebelo-Arnold et al POP@PROPOR2018-EP-BP-alignments
 
Barreiro-Batista-LR4NLP@Coling2018-presentation
Barreiro-Batista-LR4NLP@Coling2018-presentationBarreiro-Batista-LR4NLP@Coling2018-presentation
Barreiro-Batista-LR4NLP@Coling2018-presentation
 
Barreiro-Mota-VarDial@Coling2018-poster
Barreiro-Mota-VarDial@Coling2018-posterBarreiro-Mota-VarDial@Coling2018-poster
Barreiro-Mota-VarDial@Coling2018-poster
 
NooJ-2018-Palermo
NooJ-2018-PalermoNooJ-2018-Palermo
NooJ-2018-Palermo
 
Poster @ enetCollect CA MC meeting in Iasi, Romania
Poster @ enetCollect CA MC meeting in Iasi, Romania Poster @ enetCollect CA MC meeting in Iasi, Romania
Poster @ enetCollect CA MC meeting in Iasi, Romania
 
ReEscreve: A Translator-Friendly Multi-Purpose Paraphrasing Software Tool
ReEscreve: A Translator-Friendly Multi-Purpose Paraphrasing Software ToolReEscreve: A Translator-Friendly Multi-Purpose Paraphrasing Software Tool
ReEscreve: A Translator-Friendly Multi-Purpose Paraphrasing Software Tool
 
Poster l2f 2017
Poster l2f 2017Poster l2f 2017
Poster l2f 2017
 
Nooj2017 cmota-etal
Nooj2017 cmota-etalNooj2017 cmota-etal
Nooj2017 cmota-etal
 

projeto-eSPERTo