Sette capability
fanno il dato.
Ogni servizio FabbricaAnalitica (Dataset, Stream, Briefing, Feed, Studio) si poggia sulle stesse sette capability sottostanti. Cambia il formato di consegna, non il modello del dato.
Ontology.
Un solo modello descrive ogni entità commerciale italiana. 47 attributi normalizzati, 20 classi di segnale, una tassonomia di settore allineata ad ATECO. È il contratto comune fra tutti i nostri prodotti: cambia il formato di consegna (CSV, dashboard, API), non l'asse del dato.
Multi-sorgente per default.
Nessuna fonte da sola è sufficiente. Fondiamo registri ufficiali (CCIAA, IRPET), presenza fisica osservabile (OSM, Google Business Profile), presenza digitale storica e attuale (Wayback, scraping ToS-clean), recensioni, network locali, tribunali (PVP + Inlinea). La fusione è il prodotto.
Signal fusion.
Per ogni entità calcoliamo segnali derivati: apertura stimata, salute digitale 0–100, drift recensioni, gap di copertura, prossimità competitiva, cambi di stato. Sono i campi che fanno la differenza fra anagrafica e intelligence. Combiniamo segnali base in punteggi compositi su misura.
Iperlocale fino alla via.
Geocodifichiamo fino al livello di via e isolato. Le aggregazioni standard (provincia, comune) sono il minimo. La ricchezza si vede a 250 metri di raggio, dove ogni esagono racconta una storia diversa. Densità, gap di copertura, prossimità competitiva — tutto lavora su scala micro.
Audit-trail per record.
Ogni record porta con sé sorgente, momento di rilevazione, base giuridica, trasformazioni applicate. È l'unico modo per consegnare dato in un mercato in cui la provenienza è il primo controllo. Tracciabilità retroattiva su tutto il dataset, esportabile come tabella separata.
Refresh predicibile.
Cadenza standard T+30 sui perimetri vivi (Stream). Cadenza T+90 sui dataset una tantum. Per gli Studio la frequenza la decide il mandato. Niente snapshot annuali polverosi. Quando un dato si muove, te ne accorgi entro 30 giorni — sennò non ti serve davvero.
GDPR-IT by design.
Lavoriamo nel quadro del Provv. Garante 9993808/2024 e del GDPR. Persona giuridica e persona fisica distinte al livello del modello dati, non a parole. Audit-trail per record. DPA template pronto al firmatario. RPO registrato preventivamente. Compliance scritta nei campi del database, non in una pagina legale.
Lo stack tecnico, per chi vuole capire come.
- INGESTION
- Python · Playwright · Cheerio · Postgres FTS
- NORMALIZATION
- pandas · pydantic · fuzzy match · entity resolution
- SIGNAL ENGINE
- scipy · scikit-learn · feature engineering
- GEOCODING
- Nominatim · H3 grid · isoline polygons
- STORAGE
- Postgres + S3 (Hetzner nbg1, EU)
- DELIVERY
- Next.js dashboard · REST + webhook · CSV/Parquet export
- AUDIT
- Per-record trail · diff log · ToS compliance check
- COMPLIANCE
- GDPR · Provv. 9993808 · DPA standard · RPO registrato