PropTech : Comment une IA analyse 450 000 photos par an

Comment l’IA transforme la création d’annonces immobilières en automatisant l’analyse de 450 000 photos par an.

En bref

ÉlémentDétail
ClientÉditeur CRM immobilier SAAS
SecteurPropTech / Logiciel immobilier
ExpertiseComputer Vision, IA Générative, API temps réel
Durée6 semaines (POC + Production)
Impact clé
-15% temps de création d’annonce

Le défi​

Contexte business

Notre client édite un CRM immobilier utilisé par près de 2 000 agences en Europe. Sa plateforme permet aux agents de gérer l’intégralité de leur activité : de la prospection à la signature. Dans un marché où la réactivité est clé, chaque minute compte pour publier une annonce attractive.

Problématiques identifiées

  • Saisie manuelle chronophage : les agents passent un temps considérable à remplir des dizaines de champs pour décrire un bien (type de pièces, équipements, caractéristiques extérieures…)
  • Méconnaissance des filtres disponibles : le CRM propose plus de 40 critères de recherche (piscine, cheminée, véranda…), mais les agents n’en renseignent qu’une fraction par manque de temps ou d’habitude
  • Qualité variable des annonces : des informations manquantes réduisent la visibilité des biens et l’efficacité du matching acheteur/vendeur
  • Pression concurrentielle : dans l’immobilier, le premier à publier une annonce complète capte l’attention des acheteurs potentiels

Notre approche

L’idée : faire parler les photos

Chaque bien immobilier est photographié avant d’être mis en vente. Ces images contiennent déjà toutes les informations nécessaires : type de pièce, équipements visibles, style architectural… Notre solution extrait automatiquement ces données pour pré-remplir le formulaire du CRM.

Phases du projet

Phase 1 : Proof of Concept

Durée:  2 semaines

Validation de la faisabilité technique et définition du périmètre fonctionnel.

  • Analyse du catalogue de critères existant dans le CRM (40+ attributs)
  • Sélection des modèles de vision par ordinateur adaptés (GPT-4 Vision, Llama Vision)
  • Développement des prompts spécialisés par type d’analyse
  • Tests sur un échantillon représentatif d’images immobilières

Phase 2 : Industrialisation

Durée : 4 semaines

Mise en production d’une API robuste et performante.

  • Architecture API asynchrone avec file d’attente Redis pour le traitement batch
  • Optimisation des temps de réponse (<1 seconde par image en mode synchrone)
  • Pipeline d’analyse en cascade : intérieur/extérieur → type de pièce → objets détaillés
  • Intégration via webhook pour une expérience utilisateur fluide
  • Déploiement sur infrastructure cloud sécurisée

Stack technologique

ComposantTechnologies
BackendPython, FastAPI, Redis, PostgreSQL
IA & VisionOpenAI, Groq Vision
InfrastructureGoogle Cloud, Docker, Traefik
IntégrationAPI REST, Webhooks, traitement batch

Équipe projet

1 Data Scientist senior IALab en collaboration directe avec l’équipe produit du client.

Les résultats

Impacts quantifiables

MétriqueRésultat
Temps de création d’annonce-15%
Temps de réponse API<1 seconde (90%)
Volume traité450 000 images/an
Délai de livraison6 semaines

Capacités déployées

  • Classification automatique : distinction intérieur/extérieur avec identification précise du type de pièce (cuisine, salon, chambre, salle de bain…)
  • Détection d’équipements : plus de 40 objets reconnus (cheminée, piscine, panneaux solaires, climatisation, garage, véranda…)
  • Extraction de métadonnées : style architectural, type de revêtement, nombre d’étages pour les vues extérieures
  • API double mode : synchrone pour l’analyse instantanée à l’upload, batch pour le traitement de masse

Enseignements clés

Facteurs de succès

  • Approche pragmatique : POC en 2 semaines pour valider rapidement la valeur avant d’investir dans l’industrialisation
  • Architecture modulaire : pipeline d’analyse en cascade permettant d’optimiser les coûts et la précision
  • Focus performance : temps de réponse <1s essentiel pour une intégration transparente dans le workflow utilisateur
  • Multi-modèles : combinaison de modèles rapides (Groq/Llama) et précis (GPT-4 Vision) selon les besoins

Défi technique surmonté

L’optimisation du temps de réponse a été le principal challenge. Le traitement d’une image par un modèle de vision prend habituellement plusieurs secondes. En architecturant un pipeline intelligent (pré-classification rapide, puis analyse détaillée ciblée) et en parallélisant les appels, nous avons atteint l’objectif de <1 seconde en mode synchrone.

Perspectives

Roadmap d’évolution

  • Boucle d’amélioration continue : exploitation des corrections utilisateurs pour affiner les modèles
  • Génération automatique de descriptions : rédaction du texte de l’annonce à partir des éléments détectés

Vous avez un projet similaire ?

IALab accompagne les éditeurs SaaS et les entreprises innovantes dans l’intégration de l’IA au cœur de leurs produits. De la vision par ordinateur au traitement du langage naturel, nous transformons vos données en avantage concurrentiel.

Image de Leo Bourrel
Leo Bourrel