Rubriky
Blog o SEO - Optimalizace pro vyhledávače Umělá inteligence v analytice a marketingu

Má llms.txt reálný smysl? Pomůže vám to v Generative Engine Optimization?

Má llms.txt reálný smysl? Pro běžný web dnes spíš ne. Jako dokumentační rozcestník pro LLM a agenty možná ano. Je ale velký rozdíl mezi tím, že soubor existuje, že ho crawler stáhne a tím, že podle něj LLM provider opravdu produkčně rozhoduje. Pro poslední bod zatím veřejné důkazy chybí.

Stav vyhodnocení k 18. květnu 2026. Oblast se rychle mění; závěr stojí na veřejné dokumentaci providerů, specifikaci a dostupných log-based studiích.

Tento článek jsem napsal, protože až příliš mnoho lidí mimo obor SEO generuje pomocí AI články o tom, jak optimalizovat na „GEO“ (generative engine optimization) a ty jsou velmi často založené na halucinacích. Pokud na to chci upozornit, potřeboval jsem ozdrojovaný článek, jako je tento 🙂 , abych se na něj mohl odkazovat.

Krátký verdict

Pro většinu publisherů, e-commerce webů a obsahových projektů je llms.txt dnes spíš jen nice-to-have experiment než priorita před technickou přístupností, robots.txt, indexovatelností a skutečně citovatelným obsahem.

  • Jako AI search / GEO ranking signal je zatím velmi slabě podložený.
  • Nejsilnější evidence dnes podporuje spíš závěr, že hype je větší než prokázané produkční použití pro third-party web crawl.

Kdy to smysl má

  • API dokumentace a developer docs.
  • Produktové knowledge base, které mají být snadno stravitelné agentem.
  • Situace, kdy je implementace levná a údržba téměř nulová.

Kdy to není priorita

  • Když web bojuje se základní indexovatelností.
  • Když důležitý obsah není dobře čitelný v HTML.
  • Když od toho čekáš růst AI citací nebo návrat trafficu.
OtázkaDnešní odpověďDůkazní síla
Je to oficiální Google requirement?Ne. Google výslovně říká, že pro generativní AI Search není potřeba.Silná: oficiální Google dokumentace.
Je to oficiální ChatGPT search workflow?Ne veřejně. OpenAI pro publishery řeší hlavně OAI-SearchBot, robots.txt a noindex.Silná: oficiální OpenAI FAQ.
Používají ho AI firmy někde?Ano, hlavně na vlastních dokumentačních webech.Silná pro docs use case, slabá pro obecný web crawl.
Stahují ho hlavní AI crawleři?Dostupné log studie zatím ukazují spíš minimální nebo žádný významný fetch pattern.Střední: externí log data, ne celý web.
Může se vyplatit ho vytvořit?Ano, pokud je levný, dobře udržovaný a neodvádí pozornost od důležitějších věcí.Praktická inference.

1. Co llms.txt skutečně je

Podle specifikace na llmstxt.org je llms.txt jednoduchý textový nebo markdown rozcestník na důležité části webu. Jeho účel je usnadnit LLM zpracování obsahu, hlavně tam, kde je HTML složité, rozbité navigací nebo zatížené JavaScriptem.

Specifikace sama o sobě ale neslibuje ranking boost, vyšší pozici v AI Overviews, automatický růst citací ani preferenční crawl od velkých LLM hráčů. Na úrovni návrhu je to tedy spíš rozšíření odesílaných dat než reálný visibility signal.

2. Tři otázky, které se často pletou

Debata kolem llms.txt bývá zmatená, protože přeskakuje mezi třemi různými úrovněmi důkazu.

  1. Soubor je publikovaný. Na doméně existuje /llms.txt nebo /llms-full.txt. To je nejnižší laťka.
  2. Soubor je stahovaný. Konkrétní crawler nebo agent na tuto cestu skutečně chodí. To je silnější signál, ale stále nic nemusí znamenat.
  3. Soubor je reálně používaný. AI systémy podle něj rozhodují, co najdou, jaké informace si stáhnou, co vyberou jako zdroj nebo jak celý proces zpracování obsahu proběhne. To je nejvyšší laťka a právě tady je dnes důkazů nejméně.

Veřejný internet je plný článků, které skočí rovnou z první úrovně na třetí. Z toho, že někdo soubor publikuje, ale ještě neplyne, že ho hlavní AI crawleři pravidelně čtou. A z toho, že ho někdo občas stáhne, ještě neplyne měřitelný dopad na citace nebo traffic.

3. Co říkají Google, OpenAI, Anthropic a Perplexity

Google: explicitně říká, že to není potřeba

Google Search Central ve svém průvodci pro generativní AI Search uvádí, že pro AI Overviews a AI Mode je stále zásadní běžné SEO: crawlability, indexovatelnost, kvalitní obsah a způsobilost zobrazit se v Search se snippetem. V části mythbusting navíc výslovně říká, že není potřeba llms.txt, speciální AI markup ani markdown soubory vytvářené kvůli visibility (Google AI optimization guide).

Praktický závěr: pro Google Search dnes llms.txt není doporučená stack vrstva. To není absolutní tvrzení, že Google soubor nikdy nikde nevidí, ale pro rozhodování webu je to silný protiargument proti prioritizaci.

OpenAI: docs ano, publisher workflow ne

OpenAI veřejně hostuje developers.openai.com/llms.txt. To je dobrý důkaz, že formát má hodnotu pro dokumentaci a agentické použití. Není to ale důkaz, že OpenAI používá llms.txt jako obecný signal pro cizí weby.

Když OpenAI vysvětluje publisherům, jak se dostat do ChatGPT search, staví guidance na OAI-SearchBot, robots.txt a případně noindex, ne na llms.txt (OpenAI Publishers and Developers FAQ, OpenAI crawler docs).

Anthropic a Perplexity: stejný vzorec

Anthropic má v Claude Docs sekci pro AI ingestion, kde uvádí llms.txt a llms-full.txt (Claude Docs resources). Současně jeho veřejná crawler dokumentace stojí na konkrétních botech a blokaci přes robots.txt (Anthropic crawler guidance).

Perplexity podobně hostuje vlastní docs llms.txt, ale jeho crawler dokumentace pro site visibility řeší PerplexityBot, Perplexity-User, robots.txt a IP adresy (Perplexity Crawlers).

Interpretace

Provider může llms.txt používat na vlastním docs webu a současně na něm nestavět svůj veřejný crawler-control nebo search visibility workflow pro cizí weby. To je dnes nejdůležitější nuance celé debaty.

4. Co ukazují server log data

Server log data nejsou perfektní obraz celého internetu, ale jsou velmi dobrý reality check proti marketingovým tvrzením.

Studie WISLR sledovala 48 dní bot trafficu a přes 12 tisíc bot requestů. Podle autorů žádný sledovaný AI bot nepožádal o /llms.txt ani /llm.txt; jediný zaznamenaný přístup pocházel od analytické služby, ne od velké AI platformy (WISLR log analysis).

Seekio analyzovalo přibližně 900 domén za 191 dní. Našlo jen 1227 requestů na llms.txt, llms-full.txt a příbuzné cesty, zatímco ve stejném období evidovalo téměř 45 milionů requestů od AI botů obecně (Seekio log study).

Mám data z hodně webů a potvrzuji tyto zjištění. Pro příklad na mém blogu byl soubor /llms.txt stáhnut za poslední rok celkem 9x  to od Dataprovider.com a 1x od AI-Security-Scanner a to je vše. Žádný Google, OpenAI, Anthropic etc.

Pro pobavení ještě přidám ukázku z většího webu … nejčastěji llms.txt stahují boti kontrolující jeho dostupnost.

LLMS example scaled

To je klíčový kontrast: AI boti web opravdu stahují, ale dostupná logová evidence zatím neukazuje, že by to typicky dělali přes llms.txt. Sekundární syntéza Ahrefs stejný stav popisuje jako navržený standard s hype větším než potvrzená adopce (Ahrefs).

Co z toho plyne

Absence stahování souboru není absolutní důkaz, že soubor nikdy nikdo nepoužívá. Je ale silný praktický signál, že nejde o hlavní produkční discoverability vrstvu pro běžný web. A i kdyby někdo soubor občas stáhl, samotné stažení ještě neznamená citation uplift, referral uplift ani ranking signal.

5. Praktické doporučení

Pro většinu webů je rozumný tento pořadník:

  1. Nejprve vyřešit robots.txt, indexovatelnost, čisté HTML, server-side dostupnost obsahu a preview controls.
  2. Pak řešit kvalitu obsahu, entitní srozumitelnost, informační architekturu a citační použitelnost.
  3. Teprve potom případně přidat llms.txt jako levný experiment.

Nejlepší formulace je: llms.txt může pomoci tam, kde chceš LLM nebo agentovi levně ukázat mapu dokumentace. To je ale jiný problém než dostat se do AI search odpovědi a ještě jiný problém než řídit přístup crawlerů.

Vytvořit, když

  • máš silnou dokumentační vrstvu, API nebo produktový knowledge base
  • umíš generovat markdown verze bez ruční údržby
  • chceš být přívětivější pro agenty a interní tooling
  • nudíš se

Neřešit prioritně, když

  • web má technické SEO nebo indexační dluhy
  • obsah není dobře čitelný v základním HTML
  • očekávání je přímý růst AI citations, rankings nebo referral trafficu

FAQ

Je llms.txt nový robots.txt pro AI?

Ne. robots.txt je stále hlavní veřejně dokumentovaná vrstva crawler governance u Google, OpenAI, Anthropic i Perplexity. llms.txt je spíš mapa obsahu pro snazší ingest.

Může mi llms.txt zvýšit citace v ChatGPT nebo Perplexity?

Možné to teoreticky je v úzkých use casech, ale dnes pro to není dobrý veřejný důkaz. Pokud chceš měřit AI visibility, důležitější je sledovat citace, referraly, bot traffic a dotazové clustery než předpokládat efekt ze samotné existence souboru.

Když ho mají OpenAI, Anthropic a Perplexity, neměl bych ho mít taky?

Možná ano, pokud máš podobný docs use case. Ale to, že AI platforma publikuje vlastní dokumentaci v LLM-friendly podobě, neznamená, že její crawler používá stejný mechanismus jako hlavní způsob práce s cizím webem.

Jak poznám, že se situace změnila?

Silný signál by byl, kdyby Google, OpenAI, Anthropic nebo Perplexity začali llms.txt doporučovat pro third-party discoverability, kdyby nezávislé log studie ukázaly pravidelné fetchování hlavními crawlers, nebo kdyby vznikl důvěryhodný experiment s měřitelným citation či referral upliftem.

Co dělat, když se mi někdo snaží prodat „GEO“ a tvrdí, že llms.txt je nutnost?

Odkažte ho prosím na tento článek.

Hlavní zdroje

Update 20.5.2026

Abychom se nenudili, tak 15. 5. 2026 Google ve své „GEO“ guide popřel, že llms.txt má nějakou hodnotu z pohledu SEO.Snimek obrazovky 2026 05 19 233817

Aby ho 20. 5. 2026 na Google IO 2026 přidal mezi věci, které se testují v Google Chrome Lighthouse. Zde bych se asi zaměřil na slovíčka „llms.txt: Checks for the presence of a machine-readable summary at the domain root.“. Testují, jestli je soubor přítomný, ale neříká to nic o tom, že ho reálně použijí k čemukoliv. Asi bych to bral jako vyjádření dvou skupin lidí. První skupina byli lidé z vyhledávání Google … pro ty tento soubor nemá žádnou hodnotu. A jak jsem se bavil s vývojáři vyhledávačů, dokud není signál kvalitní, je plně ignorován. Beru to tak, že llms.txt je většinou plný nesmyslů, takže je ignorován. Druhá skupina jsou tvůrci AI agentů a webMCP, kteří si kontrolují, že tento soubor existuje a možná ho nějací agenti třeba použijí… třeba ne ti od Googlu, ale od ostatních lidí a pro ty je tato kontrola.

Add as a preferredsource on Google

.