Introduction
Bienvenue sur AnonDocs - un outil open source d'anonymisation de documents conçu pour vous aider à protéger la vie privée tout en partageant des connaissances. Fièrement développé par AI SmartTalk, AnonDocs permet aux particuliers et aux organisations de supprimer les informations sensibles des documents avant de les partager, garantissant la conformité aux réglementations sur la vie privée comme le RGPD tout en maintenant la lisibilité des documents (la structure est préservée pour les fichiers DOCX).
Qu'est-ce qu'AnonDocs ?
AnonDocs est un microservice auto-hébergeable axé sur la confidentialité qui utilise l'IA pour détecter et anonymiser automatiquement les informations personnellement identifiables (PII) dans les documents. Il prend en charge plusieurs formats de fichiers (PDF, DOCX, TXT) et peut traiter à la fois des fichiers téléversés et des entrées de texte brut.
Fonctionnalités principales
- 🔒 Priorité à la confidentialité: Tout le traitement se fait localement sur votre infrastructure - aucune donnée ne quitte jamais votre contrôle
- 🤖 Propulsé par l'IA: Utilise des modèles LLM avancés (Ollama, API compatibles OpenAI) pour une détection intelligente des PII
- 📄 Support multi-format: Gère les fichiers PDF, DOCX et texte brut
- ⚡ Progression en temps réel: Server-Sent Events (SSE) pour des mises à jour de progression en direct pendant l'anonymisation
- 🌍 Open Source: Entièrement open source sous licence MIT, transparent et auditable
- 🚀 Auto-hébergeable: Déployez sur votre propre infrastructure pour un contrôle et une conformité maximaux
Comment ça fonctionne
AnonDocs suit une architecture de microservice :
- Téléversement/Saisie: Les documents ou le texte sont envoyés aux points de terminaison de l'API
- Analyse: Les fichiers sont analysés pour extraire le contenu texte (PDF, DOCX, TXT)
- Détection: Les modèles LLM analysent le texte pour détecter les PII (noms, emails, téléphones, adresses, identifiants)
- Anonymisation: Les PII détectées sont remplacées par des espaces réservés génériques
- Sortie: Le texte anonymisé est retourné (la structure DOCX est préservée, les PDF sont convertis en texte brut)
Vue d'ensemble de l'architecture
Démarrage rapide
Essayez-le en ligne
Le moyen le plus simple d'essayer AnonDocs est via notre interface web sur anondocs.org/anonymize. Téléversez simplement un document ou collez du texte, et obtenez des résultats d'anonymisation instantanés.
Exemple rapide avec le SDK (Recommandé)
import { AnonDocsClient } from '@aismarttalk/anondocs-sdk';
const client = new AnonDocsClient({
baseUrl: 'http://localhost:3000'
});
const result = await client.anonymizeText(
'Contactez John Doe à john@example.com ou appelez le 555-1234'
);
console.log(result.anonymizedText);
// Sortie: Contactez [NOM] à [EMAIL] ou appelez le [TÉLÉPHONE]
Exemple rapide d'API
import requests
# Anonymiser du texte
response = requests.post('http://localhost:3000/api/anonymize', json={
'text': 'Contactez John Doe à john@example.com ou appelez le 555-1234',
'provider': 'ollama'
})
print(response.json()['data']['anonymizedText'])
# Sortie: Contactez [NOM] à [EMAIL] ou appelez le [TÉLÉPHONE]
Auto-hébergement (5 minutes)
# 1. Installer Ollama
curl -fsSL https://ollama.ai/install.sh | sh
# 2. Télécharger un modèle
ollama pull mistral-nemo
# 3. Cloner et démarrer AnonDocs
git clone https://github.com/AI-SmartTalk/AnonDocs.git
cd AnonDocs
npm install
# 4. Configurer (créer .env)
echo "DEFAULT_LLM_PROVIDER=ollama
OLLAMA_BASE_URL=http://localhost:11434
OLLAMA_MODEL=mistral-nemo" > .env
# 5. Démarrer
npm start
Pour des instructions d'auto-hébergement détaillées, consultez notre Guide d'auto-hébergement.
Cas d'utilisation
- 🏥 Santé: Anonymiser les dossiers des patients avant de les partager avec des chercheurs
- ⚖️ Juridique: Caviarder les informations sensibles des documents juridiques pour divulgation publique
- 💼 RH: Traiter les données des employés tout en maintenant la confidentialité
- 🏦 Finance: Assainir les documents financiers pour l'analyse
- 📊 Recherche: Partager des ensembles de données sans exposer d'informations personnelles
- 🔐 Conformité: Respecter le RGPD, HIPAA et autres réglementations sur la vie privée
Confidentialité et sécurité
Conformité RGPD
✅ Les données ne quittent jamais votre infrastructure - Tout le traitement se fait localement sur vos serveurs
✅ Zéro conservation des données - Les fichiers sont immédiatement supprimés après le traitement, aucun stockage
✅ Open Source et auditable - Examinez chaque ligne de code vous-même
Pour plus de détails, consultez notre documentation Confidentialité et sécurité.
Et ensuite ?
- 📦 SDK et référence API - Utilisez le SDK TypeScript/JavaScript ou l'API REST
- 📚 Formats pris en charge - En savoir plus sur la prise en charge des formats de fichiers
- 🚀 Guide d'auto-hébergement - Déployez votre propre instance
- 🔒 Confidentialité et sécurité - Comprendre nos garanties de confidentialité
Obtenir de l'aide
- 💬 Discussions GitHub - Posez des questions et partagez des idées
- 🐛 Issues GitHub - Signalez des bugs ou demandez des fonctionnalités
- 📖 Dépôt GitHub - Consultez le code source et contribuez
AnonDocs - Protégez la vie privée, partagez les connaissances. Anonymisation de documents open source par AI SmartTalk.