Formats de fichiers pris en charge
AnonDocs prend en charge l'anonymisation de plusieurs formats de documents pour vous aider à protéger les informations sensibles dans différents types de fichiers.
Formats de documents
Fichiers PDF
- Extension:
.pdf - Fonctionnalités: Extraction et anonymisation complète du texte
- Taille maximale: 25 Mo
- Format de sortie: Texte brut
- Remarque: La mise en forme du document n'est pas préservée - les PDF sont convertis en texte brut
Documents Microsoft Word
- Extensions:
.doc,.docx - Fonctionnalités: Extraction de texte avec préservation de la mise en forme
- Taille maximale: 25 Mo
- Format de sortie: Texte brut avec structure préservée
- Remarque: La mise en forme du document est préservée - les sauts de paragraphe, l'espacement des lignes et la structure sont maintenus
Fichiers texte brut
- Extension:
.txt - Fonctionnalités: Traitement direct du texte
- Taille maximale: 25 Mo
- Idéal pour: Anonymisation rapide du contenu texte
Notes de traitement
- Tous les formats de documents sont convertis en texte pendant le traitement
- La sortie anonymisée est fournie sous forme de texte brut
- Fichiers DOCX: La mise en forme originale (sauts de paragraphe, espacement des lignes, structure) est préservée
- Fichiers PDF: La mise en forme n'est pas préservée - le texte est extrait sans la structure de mise en page
- Fichiers TXT: Pas de mise en forme à préserver
- Plusieurs fichiers peuvent être traités par lots
Limitations
- Taille maximale de fichier: 25 Mo par fichier
- Les images et le contenu intégré ne sont pas traités
- Fichiers PDF: La mise en forme et la mise en page sont perdues lors de l'extraction du texte
- Fichiers DOCX: La mise en forme complexe (tableaux, images, styles spéciaux) peut être simplifiée
- Les PDF avec images numérisées (OCR) ne sont pas pris en charge - seuls les PDF basés sur du texte fonctionnent