Neuerscheinungen 2018Stand: 2020-02-01 |
Schnellsuche
ISBN/Stichwort/Autor
|
Herderstraße 10 10625 Berlin Tel.: 030 315 714 16 Fax 030 315 714 14 info@buchspektrum.de |
Luciano de Souza Cabral, Fred Freitas
(Beteiligte)
Extra‡Æo de Informa‡Æo integrando componentes PLN via framework GATE
Um módulo para extra‡Æo de informa‡Æo utilizando integra‡Æo de componentes PLN através do framework GATE
2018. 156 S. 220 mm
Verlag/Jahr: NOVAS EDICIOES ACADEMICAS 2018
ISBN: 6-202-19084-1 (6202190841)
Neue ISBN: 978-6-202-19084-8 (9786202190848)
Preis und Lieferzeit: Bitte klicken
A Extra‡Æo de Informa‡Æo (EI) é o ramo da área de recupera‡Æo de informa‡Æo (RI) que utiliza técnicas e algoritmos para identificar e coletar informa‡äes desejadas em documentos estruturados ou nÆo, persistindo-as em um formato apropriado para consultas futuras. A utiliza‡Æo de Processamento de Linguagem Natural (PLN) revela-se benéfico ao processo de extra‡Æo, principalmente quando se processam documentos sem estrutura e/ou padrÆo definido. Um framework que reúne dezenas de plug-ins que podem ajudar na tarefa de EI baseada em PLN é o conhecido GATE (General Architecture for Text Engineering). Neste sentido propäe-se o modulo RELPIE (Regular Expressions for Language Processing Information Extraction), contendo plug-ins para a extra‡Æo a partir de texto livre. O módulo é original e integra plug-ins GATE baseados em expressäes regulares (ER) e regras de produ‡Æo (RP), que ficam totalmente separadas do sistema, visando modularidade na EI. Os resultados obtidos demonstram que a proposta apresenta bons níveis de extra‡Æo e reconhecimento de entidades nomeadas (NER), cerca de 80%, em texto livre.
Luciano Cabral é Doutor em Engenharia Elétrica/Comunica‡äes pelo DES-UFPE e Mestre em Ciência da Computa‡Æo pelo CIn-UFPE e Professor Adjunto no IFPE. Fred Freitas é Doutor em Engenharia Elétrica pela UFSC e Professor Adjunto no CIn-UFPE.