Sitemap.xML - un ghid pentru începători
Ce este o hartă XML?
XML-Sitemap – un fișier pentru roboții motoarelor de căutare cu o listă a tuturor paginilor site-ului în format XML. Este necesar pentru ca motoarele de căutare să acceseze cu crawlere și să indexeze conținutul site-ului mai eficient. Analiza sitemap-ului vă permite să aflați de ce acest sau acel conținut nu este indexat. xml
Din ce elemente constă un Sitemap XML?
Mai multe moduri de a crea un sitemap:
- folosind un sistem de management al conținutului (CMS). Sisteme precum WordPress sau Wix pot genera o hartă a site-ului prietenoasă cu motoarele de căutare. Trebuie să găsiți informații despre modul în care este generată harta site-ului în CMS-ul pe care îl utilizați – procesul este automat sau trebuie să efectuați unele operațiuni pentru aceasta;
- manual. Dacă site-ul este mic, vă puteți crea o hartă de site folosind un editor de text și urmând standardele de sintaxă;
- folosind generatoare terțe. Există multe servicii care pot genera sitemap-uri. Printre ei:
- https://www.mysitemapgenerator.com/;
- xml sitemap generator de la https://smallseotools.com/ (versiunea gratuită are o limită de până la 500 de pagini);
- https://www.xml-sitemaps.com/.
Informații generale și Ghid Google pentru Sitemaps XML
- Google va accesa cu crawlere adresele URL pe care le furnizați. Prin urmare, specificați adrese URL corecte și precise.
- Toate adresele URL pe care le introduceți în harta site-ului trebuie să provină din domeniul corespunzător. Nu specificați alt domeniu/subdomeniu.
- O hartă a site-ului poate fi plasată oriunde pe site, dar va afecta numai directoarele de sub directorul părinte. Prin urmare, ar trebui să plasați XML-Sitemap în directorul rădăcină al site-ului.
- Un link către un fișier XML obișnuit sau către un fișier index poate fi specificat în fișierul Robots.txt, după cum urmează: sitemap: https://site.com/sitemap.xml.
- Sitemap-urile trebuie să fie codificate UTF-8, ceea ce înseamnă că trebuie utilizate numai caractere ASCII.
- Dacă adresele paginilor conțin alte caractere, acestea trebuie să fie excluse. Acest lucru se întâmplă de obicei automat, cu excepția cazului în care creați manual adresele paginilor. Dacă caracterele din adresa URL nu sunt codificate corect și nu sunt corectate, atunci când adăugați harta site-ului, este posibil să primiți o alertă Google că nu a fost găsită nicio pagină din harta dvs. XML.
- Google nu garantează accesarea cu crawlere a fiecărei adrese URL dintr-un sitemap. Acest fișier ajută sistemul doar să determine ce pagini considerați importante.
- Google ignoră ordinea adreselor URL din harta site-ului.
- Fișierul XML-Sitemap nu trebuie să aibă o dimensiune mai mare de 50.000 de pagini și să nu depășească 50 MB în greutate. Dacă greutatea este mai mare, creați un sitemap index care va conține mai multe fișiere sitemap.
- Includeți în XML-sitemap numai pagini canonice care sunt deschise pentru indexare și accesare cu crawlere, oferind un cod de răspuns de 200, excluzând paginile de paginare.
- Toate adresele URL din Sitemap XML trebuie să fie deschise în robots.txt pentru accesare cu crawlere, indexare și nu trebuie să conțină metaeticheta „noindex”.
Harta site-ului ar trebui să fie actualizată automat în mod regulat la adăugarea / ștergerea, închiderea / deschiderea paginilor specificate pentru indexare.
Principalele concluzii
- Un sitemap ajută Google să găsească și să înțeleagă mai ușor paginile site-ului tău, ceea ce îmbunătățește șansele de apariție în rezultatele căutării.
- Există diferite tipuri de sitemap-uri (pentru pagini, imagini sau videoclipuri), iar cel potrivit depinde de tipul de conținut al site-ului.
- Un sitemap poate fi creat simplu, fie manual, fie cu ajutorul plugin-urilor sau al instrumentelor online.
- Google Search Console este cea mai ușoară metodă de a trimite sitemap-ul către Google și de a urmări dacă paginile sunt indexate corect.
Indiferent dacă este vorba despre un magazin online, un catalog sau un site de servicii, niciun website nu poate funcționa eficient fără un sitemap, deoarece acesta ajută motoarele de căutare să descopere și să indexeze corect conținutul important.
