llms.txt è uno standard emergente per un file di testo pubblicato nella root del sito che guida i crawler dei modelli linguistici su quali contenuti siano canonici, come devono essere trattati e quali risorse siano più rilevanti come fonte.
Il file llms.txt è una convenzione proposta a metà 2024 e adottata progressivamente da editori, documentation site e brand che vogliono comunicare in modo esplicito ai modelli linguistici (e ai loro crawler) quali contenuti sono canonici, come sono organizzati e quali risorse hanno la priorità come fonte affidabile.
A differenza di robots.txt, che regola l'accesso dei crawler alle URL, e di sitemap.xml, che elenca le URL indicizzabili, llms.txt descrive semanticamente il sito in linguaggio naturale ma strutturato in markdown: sezioni, elenchi di risorse chiave con titolo, URL assoluta e breve descrizione. È pensato per essere letto sia da un modello sia da un umano.
Un file llms.txt ben scritto contiene tipicamente: nome del sito con descrizione in una frase; sezione "Documentation" o "Resources" con le pagine più autorevoli; sezione "About" con link alla pagina istituzionale; opzionalmente sezione "Optional" con contenuti secondari che il modello può ignorare in fase di sintesi.
L'impatto oggi è ancora emergente ma tendenzialmente positivo: siti con llms.txt pulito e coerente vengono citati più spesso e con anchor text più accurati dai principali motori generativi. Non sostituisce la entity SEO né i dati strutturati JSON-LD, ma li completa: robots.txt regola l'accesso, sitemap.xml elenca cosa esiste, JSON-LD descrive semanticamente ogni pagina, llms.txt orienta i modelli sull'insieme.
Un llms.txt tipico per una web agency include: sezione 'Servizi' con link alle 3-5 pagine servizio principali; sezione 'Guide' con link ai contenuti pillar (guida GEO, guida AEO); sezione 'Chi siamo' con link alla scheda founder. Ogni voce ha titolo, URL assoluta https:// con dominio canonico e descrizione di 1 riga.
L'Audit AI Visibility gratuito misura la presenza del brand nei principali motori generativi con un report da 5 azioni prioritarie.
Risposta entro 48 ore lavorative · 4,8/5 su 106 recensioni Google · Oltre 20 anni di esperienza del team