Aller au contenu principal

Introduction

Bienvenue sur AnonDocs - un outil open source d'anonymisation de documents conçu pour vous aider à protéger la vie privée tout en partageant des connaissances. Fièrement développé par AI SmartTalk, AnonDocs permet aux particuliers et aux organisations de supprimer les informations sensibles des documents avant de les partager, garantissant la conformité aux réglementations sur la vie privée comme le RGPD tout en maintenant la lisibilité des documents (la structure est préservée pour les fichiers DOCX).

Qu'est-ce qu'AnonDocs ?

AnonDocs est un microservice auto-hébergeable axé sur la confidentialité qui utilise l'IA pour détecter et anonymiser automatiquement les informations personnellement identifiables (PII) dans les documents. Il prend en charge plusieurs formats de fichiers (PDF, DOCX, TXT) et peut traiter à la fois des fichiers téléversés et des entrées de texte brut.

Fonctionnalités principales

  • 🔒 Priorité à la confidentialité: Tout le traitement se fait localement sur votre infrastructure - aucune donnée ne quitte jamais votre contrôle
  • 🤖 Propulsé par l'IA: Utilise des modèles LLM avancés (Ollama, API compatibles OpenAI) pour une détection intelligente des PII
  • 📄 Support multi-format: Gère les fichiers PDF, DOCX et texte brut
  • Progression en temps réel: Server-Sent Events (SSE) pour des mises à jour de progression en direct pendant l'anonymisation
  • 🌍 Open Source: Entièrement open source sous licence MIT, transparent et auditable
  • 🚀 Auto-hébergeable: Déployez sur votre propre infrastructure pour un contrôle et une conformité maximaux

Comment ça fonctionne

AnonDocs suit une architecture de microservice :

  1. Téléversement/Saisie: Les documents ou le texte sont envoyés aux points de terminaison de l'API
  2. Analyse: Les fichiers sont analysés pour extraire le contenu texte (PDF, DOCX, TXT)
  3. Détection: Les modèles LLM analysent le texte pour détecter les PII (noms, emails, téléphones, adresses, identifiants)
  4. Anonymisation: Les PII détectées sont remplacées par des espaces réservés génériques
  5. Sortie: Le texte anonymisé est retourné (la structure DOCX est préservée, les PDF sont convertis en texte brut)

Vue d'ensemble de l'architecture

Démarrage rapide

Essayez-le en ligne

Le moyen le plus simple d'essayer AnonDocs est via notre interface web sur anondocs.org/anonymize. Téléversez simplement un document ou collez du texte, et obtenez des résultats d'anonymisation instantanés.

Exemple rapide avec le SDK (Recommandé)

import { AnonDocsClient } from '@aismarttalk/anondocs-sdk';

const client = new AnonDocsClient({
baseUrl: 'http://localhost:3000'
});

const result = await client.anonymizeText(
'Contactez John Doe à john@example.com ou appelez le 555-1234'
);

console.log(result.anonymizedText);
// Sortie: Contactez [NOM] à [EMAIL] ou appelez le [TÉLÉPHONE]

Exemple rapide d'API

import requests

# Anonymiser du texte
response = requests.post('http://localhost:3000/api/anonymize', json={
'text': 'Contactez John Doe à john@example.com ou appelez le 555-1234',
'provider': 'ollama'
})

print(response.json()['data']['anonymizedText'])
# Sortie: Contactez [NOM] à [EMAIL] ou appelez le [TÉLÉPHONE]

Auto-hébergement (5 minutes)

# 1. Installer Ollama
curl -fsSL https://ollama.ai/install.sh | sh

# 2. Télécharger un modèle
ollama pull mistral-nemo

# 3. Cloner et démarrer AnonDocs
git clone https://github.com/AI-SmartTalk/AnonDocs.git
cd AnonDocs
npm install

# 4. Configurer (créer .env)
echo "DEFAULT_LLM_PROVIDER=ollama
OLLAMA_BASE_URL=http://localhost:11434
OLLAMA_MODEL=mistral-nemo" > .env

# 5. Démarrer
npm start

Pour des instructions d'auto-hébergement détaillées, consultez notre Guide d'auto-hébergement.

Cas d'utilisation

  • 🏥 Santé: Anonymiser les dossiers des patients avant de les partager avec des chercheurs
  • ⚖️ Juridique: Caviarder les informations sensibles des documents juridiques pour divulgation publique
  • 💼 RH: Traiter les données des employés tout en maintenant la confidentialité
  • 🏦 Finance: Assainir les documents financiers pour l'analyse
  • 📊 Recherche: Partager des ensembles de données sans exposer d'informations personnelles
  • 🔐 Conformité: Respecter le RGPD, HIPAA et autres réglementations sur la vie privée

Confidentialité et sécurité

Conformité RGPD

Les données ne quittent jamais votre infrastructure - Tout le traitement se fait localement sur vos serveurs
Zéro conservation des données - Les fichiers sont immédiatement supprimés après le traitement, aucun stockage
Open Source et auditable - Examinez chaque ligne de code vous-même

Pour plus de détails, consultez notre documentation Confidentialité et sécurité.

Et ensuite ?

Obtenir de l'aide


AnonDocs - Protégez la vie privée, partagez les connaissances. Anonymisation de documents open source par AI SmartTalk.

Proudly made byAI SmartTalkAI SmartTalk