Saltar al contenido
AtalayaAtalaya
Retour

Méthodologie

Comment nous construisons chaque score, sans boîte noire.

Cette page documente les sources, transformations et pondérations qui produisent l'Atalaya Score. Si une décision d'investissement repose sur un nombre, ce nombre doit être auditable. Voici le modèle complet.

Modèle · heuristic-v2026.04.23 · vision-v1

Sources

Quatre sources officielles, ingérées directement.

Nous ne revendons pas de listings. Chaque actif est ingéré depuis la source originale, normalisé vers un schéma unique et exposé avec traçabilité par actif. Aucune donnée sans provenance.

  • Solvia

    REST API · POST

    Inventaire ex-Banco Sabadell géré par Cerberus. Hourly scrape, ~8 000 actifs.

  • Aliseda

    REST API · GET

    Banco Santander + Blackstone. Apporte référence cadastrale, coordonnées et état de possession quand disponibles.

  • Altamira

    REST API · POST

    doValue (multi-banque). Enchères extrajudiciaires et biens avec champs enrichis publishedAt / lastPriceUpdate.

  • BOE

    HTML scrape + LLM

    Enchères judiciaires du Bulletin Officiel de l'État. Texte légal parsé avec LLM → phase procédurale, créancier, dépôt, occupant vulnérable.

Score 0–100

Cinq composantes, pondérations fixes, total 100.

Chaque actif reçoit un score entier entre 0 et 100. Les pondérations des composantes somment exactement à 100 ; aucun multiplicateur ni boost caché. Un actif qui ne maximise pas une composante perd littéralement ces points.

ComposantePoidsCe qu'elle mesure
Δ vs zone
30
Différence entre €/m² de l'actif et la médiane €/m² de sa zone (cascade postale→municipale). Pénalise les actifs sur-cotés malgré une décote publiée élevée.
État physique
25
Analyse visuelle des photos par modèle Haiku. États : optimal, habitable, à rénover, en ruine. Pending_vision si pas de photo traitée (placeholder 14/25).
Possession
20
Libre / occupé / cédé / incertain. Signaux source + parsing BOE + données cadastrales croisées.
Liquidité zone
15
Activité de marché dans la zone : nouveaux listings/30j, rotation, demande. Zones haute/moyenne/basse.
Charges légales
10
Hypothèques actives, saisies, annotations marginales. Trois couches (A/B/C) à pondération décroissante.
Total100Somme fixe. Sans boost ni multiplicateur.

Niveaux de score

90100

Exceptional

7589

Excellent

6074

Good

4059

Average

2039

Below avg

019

Poor

Cascade zonale

Résolution par niveaux, fallback explicite.

Le prix de zone utilisé pour Δ-zone est résolu en cascade. Chaque niveau n'est tenté que si le précédent manque d'échantillon (par défaut 20 transactions). Le niveau résolu est enregistré dans zoneRefUsed pour audit ultérieur.

  1. 01

    01 · Code postal

    Médiane €/m² du CP exact. Le plus précis mais exige un échantillon suffisant. Source : dataset interne Atalaya.

  2. 02

    02 · Quartier

    Quand le CP manque d'échantillon. Pour les grandes villes, le quartier capte mieux la variance que la commune.

  3. 03

    03 · Commune

    Médiane €/m² communale issue de transactions réelles (pas d'annonces).

  4. 04

    04 · Province

    Dernier niveau du dataset interne lorsque la commune manque d'échantillon.

  5. 05

    05 · MITMA

    Source externe officielle : indices municipaux du Ministère espagnol des Transports. Indépendant du prix bancaire — casse le biais banque-vs-banque. Fallback final.

Parsing légal BOE

Texte judiciaire brut vers champs structurés.

Chaque enchère BOE inclut un texte légal dense. Atalaya extrait avec un pipeline LLM propriétaire les champs clés qu'un investisseur examinerait manuellement : NIF du débiteur, situation possessoire, charges enregistrées, mise à prix, date de clôture. Schema versionné, fallback gracieux si le modèle échoue.

  • Phase procédurale

    Exécution hypothécaire · faillite · exécution monétaire · administrative. Définit le risque procédural et les délais.

  • Type de créancier

    Banque · servicer · administration · particulier. Indique le profil du processus et la prédisposition à négocier.

  • Dépôt légal

    Montant du dépôt requis pour participer à l'enchère et délais associés.

  • Occupant vulnérable

    Drapeau d'occupation protégée (famille avec mineurs, personne dépendante). Risque réglementaire significatif.

Computer vision

État physique inféré depuis les photos du listing.

Pour les actifs avec photos traitées, un sous-agent Haiku évalue : cuisine, salles de bain, peinture, sols, extérieur. Sortie structurée avec quality score, observations et drapeau d'alertes. Sans photo disponible ou si le traitement n'a pas encore tourné, l'actif est marqué pending_vision avec score physique placeholder 14/25 — visible et traçable, jamais masqué.

Versionnage

Traçabilité par actif, sans réécriture silencieuse.

Chaque score porte la promptVersion du modèle qui l'a généré. Quand le modèle change, les scores antérieurs ne sont pas réécrits silencieusement : l'historique est préservé et le nouveau calcul est étiqueté avec la nouvelle version. L'historique est auditable depuis le détail de chaque actif.

Commencez avec des données auditables, pas avec des promesses.