Comment nous construisons chaque score, sans boîte noire.
Cette page documente les sources, transformations et pondérations qui produisent l'Atalaya Score. Si une décision d'investissement repose sur un nombre, ce nombre doit être auditable. Voici le modèle complet.
Modèle · heuristic-v2026.04.23 · vision-v1
Sources
Quatre sources officielles, ingérées directement.
Nous ne revendons pas de listings. Chaque actif est ingéré depuis la source originale, normalisé vers un schéma unique et exposé avec traçabilité par actif. Aucune donnée sans provenance.
Solvia
REST API · POST
Inventaire ex-Banco Sabadell géré par Cerberus. Hourly scrape, ~8 000 actifs.
Aliseda
REST API · GET
Banco Santander + Blackstone. Apporte référence cadastrale, coordonnées et état de possession quand disponibles.
Altamira
REST API · POST
doValue (multi-banque). Enchères extrajudiciaires et biens avec champs enrichis publishedAt / lastPriceUpdate.
BOE
HTML scrape + LLM
Enchères judiciaires du Bulletin Officiel de l'État. Texte légal parsé avec LLM → phase procédurale, créancier, dépôt, occupant vulnérable.
Score 0–100
Cinq composantes, pondérations fixes, total 100.
Chaque actif reçoit un score entier entre 0 et 100. Les pondérations des composantes somment exactement à 100 ; aucun multiplicateur ni boost caché. Un actif qui ne maximise pas une composante perd littéralement ces points.
| Composante | Poids | Ce qu'elle mesure |
|---|---|---|
| Δ vs zone | Différence entre €/m² de l'actif et la médiane €/m² de sa zone (cascade postale→municipale). Pénalise les actifs sur-cotés malgré une décote publiée élevée. | |
| État physique | Analyse visuelle des photos par modèle Haiku. États : optimal, habitable, à rénover, en ruine. Pending_vision si pas de photo traitée (placeholder 14/25). | |
| Possession | Libre / occupé / cédé / incertain. Signaux source + parsing BOE + données cadastrales croisées. | |
| Liquidité zone | Activité de marché dans la zone : nouveaux listings/30j, rotation, demande. Zones haute/moyenne/basse. | |
| Charges légales | Hypothèques actives, saisies, annotations marginales. Trois couches (A/B/C) à pondération décroissante. | |
| Total | 100 | Somme fixe. Sans boost ni multiplicateur. |
Niveaux de score
90–100
Exceptional
75–89
Excellent
60–74
Good
40–59
Average
20–39
Below avg
0–19
Poor
Cascade zonale
Résolution par niveaux, fallback explicite.
Le prix de zone utilisé pour Δ-zone est résolu en cascade. Chaque niveau n'est tenté que si le précédent manque d'échantillon (par défaut 20 transactions). Le niveau résolu est enregistré dans zoneRefUsed pour audit ultérieur.
- 01
01 · Code postal
Médiane €/m² du CP exact. Le plus précis mais exige un échantillon suffisant. Source : dataset interne Atalaya.
- 02
02 · Quartier
Quand le CP manque d'échantillon. Pour les grandes villes, le quartier capte mieux la variance que la commune.
- 03
03 · Commune
Médiane €/m² communale issue de transactions réelles (pas d'annonces).
- 04
04 · Province
Dernier niveau du dataset interne lorsque la commune manque d'échantillon.
- 05
05 · MITMA
Source externe officielle : indices municipaux du Ministère espagnol des Transports. Indépendant du prix bancaire — casse le biais banque-vs-banque. Fallback final.
Parsing légal BOE
Texte judiciaire brut vers champs structurés.
Chaque enchère BOE inclut un texte légal dense. Atalaya extrait avec un pipeline LLM propriétaire les champs clés qu'un investisseur examinerait manuellement : NIF du débiteur, situation possessoire, charges enregistrées, mise à prix, date de clôture. Schema versionné, fallback gracieux si le modèle échoue.
Exécution hypothécaire · faillite · exécution monétaire · administrative. Définit le risque procédural et les délais.
Banque · servicer · administration · particulier. Indique le profil du processus et la prédisposition à négocier.
Montant du dépôt requis pour participer à l'enchère et délais associés.
Drapeau d'occupation protégée (famille avec mineurs, personne dépendante). Risque réglementaire significatif.
Computer vision
État physique inféré depuis les photos du listing.
Pour les actifs avec photos traitées, un sous-agent Haiku évalue : cuisine, salles de bain, peinture, sols, extérieur. Sortie structurée avec quality score, observations et drapeau d'alertes. Sans photo disponible ou si le traitement n'a pas encore tourné, l'actif est marqué pending_vision avec score physique placeholder 14/25 — visible et traçable, jamais masqué.
Versionnage
Traçabilité par actif, sans réécriture silencieuse.
Chaque score porte la promptVersion du modèle qui l'a généré. Quand le modèle change, les scores antérieurs ne sont pas réécrits silencieusement : l'historique est préservé et le nouveau calcul est étiqueté avec la nouvelle version. L'historique est auditable depuis le détail de chaque actif.