Pourquoi le XML domine encore
Les exports XML sont le standard de fait depuis 20 ans en France. Tous les portails (SeLoger, LeBonCoin, Logic-Immo) acceptent du XML. Les CRM exportent en XML par défaut. Difficile à déloger.
Les principaux formats
| CRM | Format | Transport |
|---|---|---|
| Hektor | XML propriétaire (ou CSV) | FTP/SFTP |
| Netty | XML / CSV | FTP |
| Iris / FNAIM | XML FNAIM standardisé | URL |
| Immofacile (AC3) | XML AC3 propriétaire | URL |
| Ubiflow | XML Ubiflow | FTP |
| Convert Immo | XML | URL |
Les pièges classiques
- Encodage : ISO-8859-1 vs UTF-8 — accents cassés si mauvais decode
- Photos liées : URLs absolues ou relatives, parfois zippées
- Dépublications : pas toujours signalées, à déduire par diff
- Identifiants instables : référence qui change entre 2 exports
- Champs manquants : DPE souvent absent ou mal valorisé
Bonnes pratiques de parsing
- Streaming XML (pas de chargement complet en mémoire pour les gros flux)
- Validation XSD quand disponible
- Dédoublonnage par référence + ville
- Détection des dépublications par diff vs cycle précédent
- Téléchargement des photos en parallèle (avec backoff)
Ts-Immo gère tout ça en amont
Ts-Immo parse les XML de tous les CRM supportés, normalise dans le modèle unifié, gère les dépublications, télécharge les photos haute définition et les sert via CDN. Côté site, vous consommez une API REST JSON — aucune logique XML à gérer.