Campus Feira de Santana Trabalhos de Conclusão de Cursos (TCCs) - Feira de Santana
Use este identificador para citar ou linkar para este item: https://repositorio.ifba.edu.br/jspui/handle/123456789/1086
metadata.dc.type: Trabalho de Conclusão de Curso
Título: Protótipo de apoio à conformidade com a LGPD: detecção automatizada de dados pessoais em portais acadêmicos
metadata.dc.creator: Freitas, Caique de Brito
metadata.dc.contributor.advisor1: Rabelo Filho, Raimundo Carvalho
metadata.dc.description.resumo: A transformação digital nas instituições de ensino superior ampliou a disponibilização de documentos e informações acadêmicas em ambientes on-line, mas também aumentou os riscos de exposição indevida de dados pessoais. Nesse contexto, o objetivo deste estudo foi desenvolver e avaliar um protótipo capaz de identificar ocorrências de CPF e RG em documentos públicos de instituições de ensino, contribuindo para ações de monitoramento e apoio à conformidade com a Lei Geral de Proteção de Dados Pessoais (LGPD). Para isso, adotou-se uma abordagem aplicada e experimental, integrando técnicas de Web Crawling, Web Scraping e Processamento de Linguagem Natural. Foi construído e anotado manualmente um dataset sintético para o treinamento de um modelo NER em língua portuguesa, complementado por testes em ambiente real a partir de resultados indexados em motores de busca. Em ambiente controlado, o modelo apresentou precisão de 0,967, recall de 1,000 e F1-score de 0,983. Em ambiente real, a solução demonstrou utilidade como mecanismo de triagem documental, com precisão média satisfatória na identificação de documentos contendo dados pessoais expostos. Os resultados indicam que a abordagem proposta é tecnicamente viável e pode apoiar instituições acadêmicas na identificação preventiva de exposições indevidas de dados pessoais, fortalecendo práticas de governança da informação e proteção de dados.
Resumo: The digital transformation of higher education institutions has expanded the availability of academic documents and informativo in online environments, but it has also increased the risk of improper exposure of personal data. In this context, the objective of this study was to develop and evaluate a prototype capable of identifying occurrences of CPF and RG in public documents from educational institutions, thereby supporting monitoring practices and compliance efforts related to the Brazilian General Data Protection Law (LGPD). To achieve this, an applied and experimental approach was adopted, integrating Web Crawling, Web Scraping, and Natural Language Processing techniques. A synthetic dataset was manually created and annotated to train a Portuguese-language NER model, which was later complemented by real-world tests based on search engine indexed results. In a controlled environment, the model achieved a precision of 0.967, recall of 1.000, and an F1-score of 0.983. In real-world settings, the solution proved useful as a document screening mechanism, reaching satisfactory average precision in identifying documents containing exposed personal data. The results indicate that the proposed approach is technically feasible and can support academic institutions in the preventive identification of improper data exposure, strengthening information governance and data protection practices.
Palavras-chave: Proteção de dados
Administração de dados
Processamento de linguagem natural (Computação)
Controlador (segurança da informação)
Instituição de ensino superior
Portais da Web
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
metadata.dc.language: por
metadata.dc.publisher.country: Brasil
Editor: Instituto Federal de Educação, Ciência e Tecnologia da Bahia
metadata.dc.publisher.initials: IFBA
metadata.dc.publisher.department: Departamento de Ensino Técnico
Citação: FREITAS, Caique de Brito. Protótipo de apoio à conformidade com a LGPD: detecção automatizada de dados pessoais em portais acadêmicos. Trabalho de Conclusão de Curso (Bacharelado em Sistema de Informação) - Instituto Federal de Educação, Ciência e Tecnologia da Bahia, Campus Feira de Santana, 2026.
metadata.dc.rights: Acesso Aberto
Attribution-NonCommercial-ShareAlike 3.0 United States
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-sa/3.0/us/
URI: https://repositorio.ifba.edu.br/jspui/handle/123456789/1086
Data do documento: 18-Mar-2026
Aparece nas coleções:Trabalhos de Conclusão de Cursos (TCCs) - Feira de Santana

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Prototipo_de_Apoio_a_Conformidade_com_a_LGPD_Deteccao_Automatizada_de_Dados_Pessoais_em_Portais_Academicos.pdf1.31 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons

Ferramentas do administrador