MODELO DE ROBÔ PARA EXTRAÇÃO DE DADOS NA ÁREA DE INOVAÇÃO DO ESTADO DE SÃO PAULO
Abstract
Diversos são os dados encontrados no cenário Web, ainda mais quando acontece o relacionamento entre os atores de inovação. Já que o relacionamento existente governo, empresas e universidades é dificultado por possuírem pontos de vista diferentes e as informações encontradas neste meio podem estar espalhadas e sem um formato específico. Assim, foi implementado um Robô Extrator capaz de retirar informações semiestruturadas da página de Chamadas Públicas Abertas do site do CNPq, este foi construído com o auxílio da biblioteca Jsoup e do Framework Jena. Essas informações extraídas da Web, são relacionadas com a parte governamental, são inseridas na estrutura RDF pré-definida, e podem ser realizadas consultas de acordo com a sintaxe das palavras e por um intervalo de tempo utilizando a linguagem SPARQL. Tendo como intuito traçar um caminho para melhorar a extração e esquematização dos dados semiestruturados que são extraídos e consultados pelo usuário, para que futuramente seja realizada a visualização das informações que possuem valor específico e relacionam os Atores de Inovação do Estado de São Paulo.
Collections
- Monografias de TCC [298]