Campus Feira de Santana Trabalhos de Conclusão de Cursos (TCCs) - Feira de Santana
Use este identificador para citar ou linkar para este item: https://repositorio.ifba.edu.br/jspui/handle/123456789/1086
Registro completo de metadados
Campo DCValorIdioma
dc.creatorFreitas, Caique de Brito-
dc.date.accessioned2026-04-28T16:28:43Z-
dc.date.available2026-04-28-
dc.date.available2026-04-28T16:28:43Z-
dc.date.issued2026-03-18-
dc.identifier.citationFREITAS, Caique de Brito. Protótipo de apoio à conformidade com a LGPD: detecção automatizada de dados pessoais em portais acadêmicos. Trabalho de Conclusão de Curso (Bacharelado em Sistema de Informação) - Instituto Federal de Educação, Ciência e Tecnologia da Bahia, Campus Feira de Santana, 2026.pt_BR
dc.identifier.urihttps://repositorio.ifba.edu.br/jspui/handle/123456789/1086-
dc.description.abstractThe digital transformation of higher education institutions has expanded the availability of academic documents and informativo in online environments, but it has also increased the risk of improper exposure of personal data. In this context, the objective of this study was to develop and evaluate a prototype capable of identifying occurrences of CPF and RG in public documents from educational institutions, thereby supporting monitoring practices and compliance efforts related to the Brazilian General Data Protection Law (LGPD). To achieve this, an applied and experimental approach was adopted, integrating Web Crawling, Web Scraping, and Natural Language Processing techniques. A synthetic dataset was manually created and annotated to train a Portuguese-language NER model, which was later complemented by real-world tests based on search engine indexed results. In a controlled environment, the model achieved a precision of 0.967, recall of 1.000, and an F1-score of 0.983. In real-world settings, the solution proved useful as a document screening mechanism, reaching satisfactory average precision in identifying documents containing exposed personal data. The results indicate that the proposed approach is technically feasible and can support academic institutions in the preventive identification of improper data exposure, strengthening information governance and data protection practices.pt_BR
dc.languageporpt_BR
dc.publisherInstituto Federal de Educação, Ciência e Tecnologia da Bahiapt_BR
dc.rightsAcesso Abertopt_BR
dc.rightsAttribution-NonCommercial-ShareAlike 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/us/*
dc.subjectProteção de dadospt_BR
dc.subjectAdministração de dadospt_BR
dc.subjectProcessamento de linguagem natural (Computação)pt_BR
dc.subjectControlador (segurança da informação)pt_BR
dc.subjectInstituição de ensino superiorpt_BR
dc.subjectPortais da Webpt_BR
dc.titleProtótipo de apoio à conformidade com a LGPD: detecção automatizada de dados pessoais em portais acadêmicospt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.creator.Latteshttp://lattes.cnpq.br/1157155619121210pt_BR
dc.contributor.advisor1Rabelo Filho, Raimundo Carvalho-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2303763153447303pt_BR
dc.description.resumoA transformação digital nas instituições de ensino superior ampliou a disponibilização de documentos e informações acadêmicas em ambientes on-line, mas também aumentou os riscos de exposição indevida de dados pessoais. Nesse contexto, o objetivo deste estudo foi desenvolver e avaliar um protótipo capaz de identificar ocorrências de CPF e RG em documentos públicos de instituições de ensino, contribuindo para ações de monitoramento e apoio à conformidade com a Lei Geral de Proteção de Dados Pessoais (LGPD). Para isso, adotou-se uma abordagem aplicada e experimental, integrando técnicas de Web Crawling, Web Scraping e Processamento de Linguagem Natural. Foi construído e anotado manualmente um dataset sintético para o treinamento de um modelo NER em língua portuguesa, complementado por testes em ambiente real a partir de resultados indexados em motores de busca. Em ambiente controlado, o modelo apresentou precisão de 0,967, recall de 1,000 e F1-score de 0,983. Em ambiente real, a solução demonstrou utilidade como mecanismo de triagem documental, com precisão média satisfatória na identificação de documentos contendo dados pessoais expostos. Os resultados indicam que a abordagem proposta é tecnicamente viável e pode apoiar instituições acadêmicas na identificação preventiva de exposições indevidas de dados pessoais, fortalecendo práticas de governança da informação e proteção de dados.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentDepartamento de Ensino Técnicopt_BR
dc.publisher.initialsIFBApt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
Aparece nas coleções:Trabalhos de Conclusão de Cursos (TCCs) - Feira de Santana

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Prototipo_de_Apoio_a_Conformidade_com_a_LGPD_Deteccao_Automatizada_de_Dados_Pessoais_em_Portais_Academicos.pdf1.31 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons

Ferramentas do administrador