# Protocole de traitement des corpus présents sur le dépot CLIMATE et des listes de termes générés à travers leur analyse lexicométrique. Ce dépôt contient un protocole reproductible pour convertir des fichiers PDF en fichiers texte (.txt) à l’aide de l’outil `pdftotext`, intégré dans un script R Markdown. ## Contenu - `conversion_pdf.Rmd` - `conversion_pdf.md` - `nettoyage_corpus.Rmd' - 'nettoyage_corpus.md - 'factorisation_listes_termes.Rmd - 'factorisation_listes_termes.md Note : les fichiers .RMD correspondent au script principal documenté et les fichiers .MD offrent un rendu lisible sans R ## Licence Ces protocoles sont publiés sous licence Creative Commons CC-BY 4.0. ## Auteur Pauline Bureau, 2025. Ces protocolse peuvent être librement utilisés et modifiés, sous réserve de mention de l'autrice.