Use este identificador para citar ou linkar para este item:
https://repositorio.ifba.edu.br/jspui/handle/123456789/1086Registro completo de metadados
| Campo DC | Valor | Idioma |
|---|---|---|
| dc.creator | Freitas, Caique de Brito | - |
| dc.date.accessioned | 2026-04-28T16:28:43Z | - |
| dc.date.available | 2026-04-28 | - |
| dc.date.available | 2026-04-28T16:28:43Z | - |
| dc.date.issued | 2026-03-18 | - |
| dc.identifier.citation | FREITAS, Caique de Brito. Protótipo de apoio à conformidade com a LGPD: detecção automatizada de dados pessoais em portais acadêmicos. Trabalho de Conclusão de Curso (Bacharelado em Sistema de Informação) - Instituto Federal de Educação, Ciência e Tecnologia da Bahia, Campus Feira de Santana, 2026. | pt_BR |
| dc.identifier.uri | https://repositorio.ifba.edu.br/jspui/handle/123456789/1086 | - |
| dc.description.abstract | The digital transformation of higher education institutions has expanded the availability of academic documents and informativo in online environments, but it has also increased the risk of improper exposure of personal data. In this context, the objective of this study was to develop and evaluate a prototype capable of identifying occurrences of CPF and RG in public documents from educational institutions, thereby supporting monitoring practices and compliance efforts related to the Brazilian General Data Protection Law (LGPD). To achieve this, an applied and experimental approach was adopted, integrating Web Crawling, Web Scraping, and Natural Language Processing techniques. A synthetic dataset was manually created and annotated to train a Portuguese-language NER model, which was later complemented by real-world tests based on search engine indexed results. In a controlled environment, the model achieved a precision of 0.967, recall of 1.000, and an F1-score of 0.983. In real-world settings, the solution proved useful as a document screening mechanism, reaching satisfactory average precision in identifying documents containing exposed personal data. The results indicate that the proposed approach is technically feasible and can support academic institutions in the preventive identification of improper data exposure, strengthening information governance and data protection practices. | pt_BR |
| dc.language | por | pt_BR |
| dc.publisher | Instituto Federal de Educação, Ciência e Tecnologia da Bahia | pt_BR |
| dc.rights | Acesso Aberto | pt_BR |
| dc.rights | Attribution-NonCommercial-ShareAlike 3.0 United States | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/3.0/us/ | * |
| dc.subject | Proteção de dados | pt_BR |
| dc.subject | Administração de dados | pt_BR |
| dc.subject | Processamento de linguagem natural (Computação) | pt_BR |
| dc.subject | Controlador (segurança da informação) | pt_BR |
| dc.subject | Instituição de ensino superior | pt_BR |
| dc.subject | Portais da Web | pt_BR |
| dc.title | Protótipo de apoio à conformidade com a LGPD: detecção automatizada de dados pessoais em portais acadêmicos | pt_BR |
| dc.type | Trabalho de Conclusão de Curso | pt_BR |
| dc.creator.Lattes | http://lattes.cnpq.br/1157155619121210 | pt_BR |
| dc.contributor.advisor1 | Rabelo Filho, Raimundo Carvalho | - |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/2303763153447303 | pt_BR |
| dc.description.resumo | A transformação digital nas instituições de ensino superior ampliou a disponibilização de documentos e informações acadêmicas em ambientes on-line, mas também aumentou os riscos de exposição indevida de dados pessoais. Nesse contexto, o objetivo deste estudo foi desenvolver e avaliar um protótipo capaz de identificar ocorrências de CPF e RG em documentos públicos de instituições de ensino, contribuindo para ações de monitoramento e apoio à conformidade com a Lei Geral de Proteção de Dados Pessoais (LGPD). Para isso, adotou-se uma abordagem aplicada e experimental, integrando técnicas de Web Crawling, Web Scraping e Processamento de Linguagem Natural. Foi construído e anotado manualmente um dataset sintético para o treinamento de um modelo NER em língua portuguesa, complementado por testes em ambiente real a partir de resultados indexados em motores de busca. Em ambiente controlado, o modelo apresentou precisão de 0,967, recall de 1,000 e F1-score de 0,983. Em ambiente real, a solução demonstrou utilidade como mecanismo de triagem documental, com precisão média satisfatória na identificação de documentos contendo dados pessoais expostos. Os resultados indicam que a abordagem proposta é tecnicamente viável e pode apoiar instituições acadêmicas na identificação preventiva de exposições indevidas de dados pessoais, fortalecendo práticas de governança da informação e proteção de dados. | pt_BR |
| dc.publisher.country | Brasil | pt_BR |
| dc.publisher.department | Departamento de Ensino Técnico | pt_BR |
| dc.publisher.initials | IFBA | pt_BR |
| dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
| Aparece nas coleções: | Trabalhos de Conclusão de Cursos (TCCs) - Feira de Santana | |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Prototipo_de_Apoio_a_Conformidade_com_a_LGPD_Deteccao_Automatizada_de_Dados_Pessoais_em_Portais_Academicos.pdf | 1.31 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons
Ferramentas do administrador
