XML Sitemap format

Table of contents:

This document describes the XML schema of the Sitemap protocol.

The format of the Sitemap protocol consists of XML tags. For all data values ​​in the Sitemap, you must use masking . The file must use the UTF-8 encoding.

A Sitemap must:

  • In the beginning, put the opening tag < urlset > , and in the end, put the closing </urlset> tag.
  • Specify the namespace (protocol standard) in the <urlset> tag.
  • Include a < url > entry for each URL as the parent XML tag.
  • Include a child < loc > entry for each parent <url> tag.

All tags are optional. Support for optional tags may vary depending on the search engine. For more information, see the documentation for the search server.

Also, all URLs in the Sitemap must be from the same site, for example www.example.com or store.example.com. For more information, see Location of the Sitemap

XML Sitemap example

The following is an example of a Sitemap file that contains only one URL and uses all optional tags. Optional tags are in italics.

<?xml version="1.0" encoding="UTF-8"?> < urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> < url > < loc >http://www.example.com/</loc> < lastmod >2005-01-01</lastmod> < changefreq >monthly</changefreq> < priority >0.8</priority> </url> </urlset>

See also the example with several URLs .

XML tag definitions

The following are the available XML tags.

Attribute Description
<urlset> mandatory

Encapsulates this file and specifies the standard of the current protocol.

<url> mandatory

Parent tag for each URL entry. The rest of the tags are children of this tag.

<loc> mandatory

The URL of the page. This URL should start with a prefix (for example, HTTP) and end with a slash if your web server requires it. The length of this value can not exceed 2048 characters.

<lastmod> not necessary

The date the file was last modified. This date must be in the W3C Datetime format. This format allows you to omit the time segment if necessary and use the YYYY-MM-DD format.

Note that this tag is not relevant to the "If-Modified-Since (304)" header, which can return the server, so search engines can use information from these two sources differently.

<changefreq> not necessary

The likely frequency of this page change. This value provides general information for search engines and may not correspond to the exact scanning frequency of this page. Valid values ​​are:

  • Always
  • Hourly
  • Daily
  • Weekly
  • Monthly
  • Yearly
  • Never

The value "always" should be used to describe the documents that change each time you access these documents. The value "never" should be used to describe the archive URLs.

Keep in mind that the value for this tag is treated as a hint , not as a command. Despite the fact that search engine scanners take this information into account when making decisions, they can scan pages marked "hourly" less often than indicated, and pages marked "annually" - more often than indicated. Scanners can periodically scan pages marked "never" to track unexpected changes on these pages.

<priority> not necessary

Priority of the URL relative to other URLs on your site. The valid range of values ​​is from 0.0 to 1.0. This value does not affect the procedure of comparing your pages with pages on other sites - it only allows you to tell search engines which pages, in your opinion, are more important for scanners.

The default page priority is 0.5.

Please note that the priority you assigned to the page does not affect the position of your URLs on the pages of the results of a particular search engine. Search engines use this information when processing URLs that refer to the same site, so you can use this tag to increase the likelihood of your most important pages being in the search index.

In addition, it should be borne in mind that assigning high priority to all URLs on your site does not make sense. Because priority is a relative value, this parameter is used to determine the order of URL processing within the site.

Back to top

Masking Characters

The Sitemap file should use UTF-8 encoding (usually you can select it when saving this file). In XML files, for all data values ​​(including URLs), the characters listed below in the table should be masked.

Symbol Masking
Ampersand & &amp;
Single quotes ' &apos;
Double quotes " &quot;
More > &gt;
Less < &lt;

In addition, for all URLs (including the URL from your Sitemap), you must use masking and encoding for readability by the web server on which they are hosted. However, if you use any kind of script, tool, or journal to create your own URLs (any way other than entering them manually), then masking and encoding are automatically applied. Ensure that all URLs comply with the RFC-3986 standard for the URI, the RFC-3987 standard for IRI, and the XML standard .

The following is an example of a URL that uses a character other than ASCI ( ü ), as well as the character for which you want to mask ( & ):

http://www.example.com/ümlat.php&q=name

Below, the same URL is coded in ISO-8859-1 (for posting on the server that uses this encoding) with masking:

http://www.primer.ru/%FCmlat.html&q=name

Below, the same URL is encoded in UTF-8 (for placement on the server that uses this encoding) and using masking:

http://www.example.com/%C3%BCmlat.php&q=name

The following is the same URL, but using masking:

http://www.example.com/%C3%BCmlat.php&amp;q=name

XML Sitemap example

The following example shows a Sitemap in XML format. The Sitemap in this example contains a small number of URLs, each of which uses a different combination of optional parameters.

<?xml version="1.0" encoding="UTF-8"?> < urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> < url > < loc >http://www.example.com/</loc> < lastmod >2005-01-01</lastmod> < changefreq >monthly</changefreq> < priority >0.8</priority> </url> < url > < loc >http://www.example.com/catalog?item=12&amp;desc=vacation_hawaii</loc> < changefreq >weekly</changefreq> </url> < url > < loc >http://www.example.com/catalog?item=73&amp;desc=vacation_new_zealand</loc> < lastmod >2004-12-23</lastmod> < changefreq >weekly</changefreq> </url> < url > < loc >http://www.example.com/catalog?item=74&amp;desc=vacation_newfoundland</loc> < lastmod >2004-12-23T18:00:15+00:00</lastmod> < priority >0.3</priority> </url> < url > < loc >http://www.example.com/catalog?item=83&amp;desc=vacation_usa</loc> < lastmod >2004-11-23</lastmod> </url> </urlset>

Back to top

Using Sitemap index files (to create a group of multiple Sitemap files)

You can provide multiple Sitemap files, however, each of these files must have no more than 50,000 URLs, and the size of each of these files must not exceed 10 MB. If necessary, the Sitemap can be compressed using the gzip archiver to reduce bandwidth requirements for the channel. However, the size of the sitemap file without compression should not exceed 10 MB. If you need to list more than 50,000 URLs, you should create multiple Sitemap files.

If you want to submit multiple Sitemap files, you must list each of these files in the Sitemap index file. A Sitemap index file can only list up to 1,000 Sitemaps. The size of this file should not exceed 10 MB (10,485-60 bytes) and can be compressed. You can have multiple Sitemaps. The XML format of the Sitemap index is very similar to the XML Sitemap format.

The Sitemap index file must:

  • In the beginning, put the opening < sitemapindex > tag, and then put the closing </sitemapindex> tag.
  • Add a < sitemap > entry for each Sitemap as the parent XML tag.
  • Include a child < loc > entry for each parent <sitemap> tag.

The optional < lastmod > tag is also available for Sitemap index files.

Note. The Sitemap index file can only specify Sitemap files that are on the same site as the Sitemap index file. For example, the index file http://www.vashsait.ru/sitemap_index.xml can include Sitemaps located on the site http://www.vashsait.ru, but not on the site http://www.example.com or http : //vashkhost.vashsait.ru. For the Sitemap index file, as for Sitemaps, you must use UTF-8 encoding.

Sample XML Sitemap Index

The following example shows a Sitemap index file that contains two Sitemaps.

<?xml version="1.0" encoding="UTF-8"?> < sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> < sitemap > < loc >http://www.example.com/sitemap1.xml.gz</loc> < lastmod >2004-10-01T18:23:17+00:00</lastmod> </sitemap> < sitemap > < loc >http://www.example.com/sitemap2.xml.gz</loc> < lastmod >2005-01-01</lastmod> </sitemap> </sitemapindex>

Note: for Sitemap URLs, as for all values ​​in XML files, masking must be used .

The XML Sitemap index definitions

Attribute Description
<sitemapindex> mandatory Encapsulates information about all Sitemaps in this file.
<sitemap> mandatory Encapsulates information about a single Sitemap.
<loc> mandatory

Specifies the location of the Sitemap.

This location can be a Sitemap, an Atom file, an RSS file, or a plain text file.

<lastmod> not necessary

Specifies the time for the corresponding Sitemap to be modified. It does not match the time to change any of the pages in this Sitemap. The value of the "lastmod" tag must be represented in the W3C Datetime format.

By providing a timestamp for the last change, you allow search engine crawlers to retrieve only a portion of the Sitemap files in the index, that is, the scanner can only retrieve those Sitemap files that have changed after a certain date. This mechanism for partial retrieval of Sitemap files allows you to quickly discover new URLs on large sites.

Back to top

Other sitemap file formats

The Sitemap protocol makes it possible to provide search engines with detailed information about the pages, and we recommend using it, because you can specify additional information about the site pages, not just their URLs. In addition to the XML protocol, we also support RSS feeds and text files that provide more limited information.

Syndication channel

You can provide RSS 2.0, Atom 0.3 or 1.0. Typically, this format is used only if the site already has a syndication channel. Note that in this case, the search engines may not be able to get information about all the URLs on your site, since this channel provides information only on the latest URLs. However, search engines can use this information to discover other pages of the site by clicking on the links on the channel pages during the normal scanning process. Make sure that the channel is located in the highest-level directory, which must be scanned by the search engine. Search engines retrieve information from the channel as follows.

  • <Link> - specifies the URL
  • Change date field (<pubDate> field for RSS feeds and date <change> for Atom feeds) - Indicates when each URL has been changed the last time. You do not need to use the change date field.

The text file

You can provide a simple text file containing one URL per line. This text file must meet the following requirements.

  • In this text file, there must be only one URL per line. These URLs can not contain new embedded strings.
  • You must specify the entire URL, including the http prefix.
  • Each text file can contain no more than 50,000 URLs, and its size should not exceed 10 MB (10,485,760 bytes). If the site includes more than 50,000 URLs, you can divide this list into several text files and transfer each file separately.
  • For this text file, you must use the UTF-8 encoding. You can specify it when saving a file (for example, in Notepad it is listed in the "Encoding" menu of the "Save As" dialog).
  • This text file should not include any other data than the URL list.
  • This text file should not contain header or footer data.
  • If necessary, the Sitemap can be compressed using the gzip archiver to reduce bandwidth requirements for the channel.
  • This text file can be assigned any name. Make sure that your URLs comply with RFC-3986 for URIs and RFC-3987 for IRI files.
  • Download this text file to the highest-level directory that you want to crawl by the search engine, and make sure that URLs in the higher-level directory are not included in the file.

Below is an example of lines of a text file.

http://www.example.com/catalog?item=1
http://www.example.com/catalog?item=11

Back to top

Sitemap file location

The location of the Sitemap determines the set of URLs that can be included in this Sitemap. The Sitemap file, located in the directory http://example.com/catalog/sitemap.xml, can include any URLs that begin with http://example.com/catalog/, but should not include URLs that begin with Http://example.com/images/.

If you have permission to edit the http://primer.org/path/sitemap.xml file, you can assume that you also have permission to provide information for the URL with the prefix http://primer.org/path/. Examples of valid URLs in http://example.com/catalog/sitemap.xml include:

http://example.com/catalog/show?item=23 http://example.com/catalog/show?item=233&user=3453

The invalid URL-addresses in the file http://example.com/catalog/sitemap.xml include the following:

http://example.com/image/show?item=23 http://example.com/image/show?item=233&user=3453 https://example.com/catalog/page1.php

This means that all the URLs listed in the Sitemap must use the same protocol (in this case HTTP) and must be hosted on the same host as the Sitemap. For example, if the Sitemap is located at http://www.example.com/sitemap.xml, it may contain URLs from the subdomain http://subdomain.example.com.

URLs that are considered invalid are excluded from further consideration. It is strongly recommended that you place the Sitemap in the root directory of your web server. For example, if your server's address is example.com, your Sitemap index file should be located at http://example.com/sitemap.xml. In some cases, it may be necessary to create different Sitemaps for different paths on your site (for example, if access rights in your organization are set so that write access to different directories is provided separately).

If you use a path that contains a port number when you submit a Sitemap file, you must include this port number in the path in each URL listed in the Sitemap. For example, if your Sitemap is located at http://www.example.com:100/sitemap.xml, then every URL listed in the Sitemap must begin with http://www.example.com:100.

Sitemaps and cross-feeds

To send Sitemaps to multiple sites from one site, you must "confirm" the ownership of the host (s) for which the URLs are sent in the Sitemap. Below is an example. Let's say you need to submit Sitemaps for 3 sites: www.host1.com с файлом Sitemap sitemap-host1.xml www.host2.com с файлом Sitemap sitemap-host2.xml www.host3.com с файлом Sitemap sitemap-host3.xml

Moreover, it is necessary to place all three Sitemap files on one node: www.sitemaphost.com. Therefore, the Sitemaps URLs are: http://www.sitemaphost.com/sitemap-host1.xml http://www.sitemaphost.com/sitemap-host2.xml http://www.sitemaphost.com/sitemap-host3.xml

By default, this will result in a "cross-send" error, since an attempt was made to send URLs to the host www.host1.com via a Sitemap that is located on the site www.sitemaphost.com (the same for the other two sites) . The first way to avoid this error is to prove your ownership (for example the right to modify files) by the node www.host1.com. You can do this by modifying the robots.txt file on the www.host1.com node to point to the Sitemap file on www.sitemaphost.com.

In this example, the robots.txt file on the http://www.host1.com/robots.txt node would contain the string "Sitemap: http://www.sitemaphost.com/sitemap-host1.xml". By modifying the robots.txt file on the site www.host1.com with the Sitemap on www.sitemaphost.com, you indirectly proved that you own the site www.host1.com. In other words, whoever manages the robots.txt file on the site www.host1.com, he trusts the Sitemap file at http://www.sitemaphost.com/sitemap-host1.xml for the content of the URLs for the www node. Host1.com. The same procedure can be repeated for the other two nodes.

Now you can send Sitemaps to www.sitemaphost.com.

If a specific host is specified in the robots.txt file, for example http://www.host1.com/robots.txt, this indicates a Sitemap or a Sitemap index file on another node. Most likely this means that for every final Sitemap file, for example http://www.sitemaphost.com/sitemap-host1.xml, all URLs belong to the node that points to them. This is because, as mentioned earlier, it is expected that the Sitemap will contain URLs from only one node.

Back to top

Verify Sitemap

The following XML schemas are used to define the elements and attributes that can appear in your Sitemap. This scheme can be downloaded using the links below.

For Sitemap files: http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd
For Sitemap index files: http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd

A number of tools can help in validating the structure of a Sitemap based on this schema. You can find a list of tools for working with XML files in each of the following locations:

Http://www.w3.org/XML/Schema#Tools
Http://www.xml.com/pub/a/2000/12/13/schematools.html

To verify your Sitemap or Sitemap index file using this schema, you need to add additional headers to the XML file, as shown below.

Sitemap:

<?xml version='1.0' encoding='UTF-8'?> <urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9" url="http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> ... </url> </urlset>

Sitemap index file:

<?xml version='1.0' encoding='UTF-8'?> <sitemapindex xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9" url="http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> ... </sitemap> </sitemapindex>

Back to top

Extending the Sitemaps Protocol

You can extend the Sitemap protocol with your own namespace. Just specify this namespace in the root element. For example:

<?xml version='1.0' encoding='UTF-8'?> <urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9" url="http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:example="http://www.example.com/schemas/example_schema"> <!-- namespace extension --> <url> <example:example_tag> ... </example:example_tag> ... </url> </urlset>

Back to top

Notifications for search engine crawlers

Once the Sitemap has been created and hosted on the web server, you must report the location of this file to the search engines that support this protocol. This can be done as follows.

Then the search engines will be able to extract the Sitemap and allow their scanners access to the URLs.

Submit a Sitemap using the search engine interface

To send a Sitemap directly to a search engine that provides information about status and processing errors, see the documentation for the search engine.

How to specify the location of a Sitemap in a robots.txt file

You can specify the location of the Sitemap using the robots.txt file. To do this, simply add the following line:

Sitemap: <sitemap_location>

URL <sitemap_location> must be a complete URL for the Sitemap, for example: http://www.example.com/sitemap.xml

This statement does not depend on the user agent string, so it does not matter where it is located in the file. If you have a Sitemap index file, you can include the location of only this file. You do not need to list each individual Sitemap specified in the index file.

You can specify multiple Sitemap files for each robots.txt file.

Sitemap: <sitemap1_location> Sitemap: <sitemap2_location>

Passing a Sitemap using an HTTP request

To send a Sitemap using an HTTP request (replace <searchengine_URL> with the URL specified by the search engine), create a request for the next URL.

<searchengine_URL>/ping?sitemap=sitemap_url

For example, if the Sitemap file is in the archive file http://www.example.com/sitemap.gz, the URL will be as follows:

<searchengine_URL>/ping?sitemap=http://www.example.com/sitemap.gz

Add the URL encoding for all characters after / ping? Sitemap =:

<searchengine_URL>/ping?sitemap=http%3A%2F%2Fwww.vashsait.com%2Fsitemap.gz

Можно отправить http-запрос, используя "wget", "curl" или другой механизм по выбору. Успешный запрос возвратит код отклика HTTP 200; если получен другой отклик, необходимо повторно передать запрос. Код отклика HTTP 200 указывает только на то, что поисковая система получила Ваш файл Sitemap, но это не значит, что сам файл Sitemap или содержащиеся в нем URL допустимы. Самый простой способ — создать автоматическое задание для регулярного создания и передачи файлов Sitemap.
Note. Предоставляя файл индекса Sitemap, необходимо инициировать только один http-запрос, который включает местоположение файла индекса Sitemap; отправлять отдельные запросы для каждого файла Sitemap, указанного в этом индексе, не нужно.

Back to top

Как исключить содержание

Протокол Sitemaps предоставляет поисковым системам информацию о содержании, которое необходимо включить в индекс. Чтобы сообщить поисковым системам о содержании, которое не следует включать в индекс, используйте файл robots.txt или метатег robots. Более подробную информацию о том, как исключить содержание из поисковых систем, см. на странице robotstxt.org .

Back to top

Frequently asked Questions

Как представлять URL в файле Sitemap?

Имеет ли значение, какой метод кодирования символов используется для создания моих файлов Sitemap?

Как указать время?

Как рассчитать дату последнего изменения?

Куда поместить мой файл Sitemap?

Какой размер файла Sitemap является допустимым?

На моем сайте десятки миллионов URL-адресов; можно ли отправить только те из них, которые изменились недавно?

Что нужно делать после создания файла Sitemap?

Нужно ли полностью указывать URL-адреса в файле Sitemap?

В URL-адресах моего сайта используются оба префикса "http" и "https". Нужно ли перечислять оба варианта?

URL-адреса на моем сайте включают идентификаторы сеанса. Нужно ли удалять эти индентификаторы?

Влияет ли положение URL-адреса в файле Sitemap на его использование?

На некоторых страницах моего сайта используются фреймы. Нужно ли включать URL-адрес набора фреймов или URL-адрес содержания фреймов?

Можно ли использовать архиватор zip для моих файлов Sitemap, или их можно сжимать только с помощью архиватора gzip?

Будет ли параметр приоритетности в XML-файле Sitemap влиять на рейтинг моих страниц в результатах поиска?

Существует ли XML-схема, по которой можно проверить мой XML-файл Sitemap?

Куда мне обратиться, если у меня возникли другие вопросы по поводу использования протокола или процедуры отправки сведений о размещении файла Sitemap?


Question. Как представить URL-адрес в файле Sitemap?

В XML-файлах для всех значений данных (включая URL-адреса) маскирование принято использовать для следующих символов: амперсанд (&), одинарная кавычка ('), двойная кавычка ("), знак "меньше" (<) и знак "больше" (>). Кроме того, Вы должны убедиться в том, что все URL-адреса соответствуют стандарту RFC-3986 для URI, стандарту RFC-3987 для IRI и XML-стандарту . Если для создания URL-адресов используются сценарии, маскирование символов в URL-адресе обычно является частью этого сценария. Однако для них все равно необходимо применять маскирование символов. Например, следующий сценарий "python" использует маскирование http://www.primer.ru/view?widget=3&count>2

$ python Python 2.2.2 (#1, Feb 24 2003, 19:13:11) >>> import xml.sax.saxutils >>> xml.sax.saxutils.escape("http://www.example.com/view?widget=3&count>2")

В приведенном выше примере результирующим является следующий URL-адрес:

http://www.example.com/view?widget=3&amp;count&gt;2

Question. Имеет ли значение метод кодирования символов, который используется для создания моих файлов Sitemap?

Yes. Для файлов Sitemap должна использоваться кодировка UTF-8.

Question. Как указать время?

Используйте кодировку W3C Datetime для меток времени "lastmod" и всех других дат и времен в этом протоколе. Например, 2004-09-22T14:12:14+00:00.

Эта кодировка позволяет опустить сегмент времени формата ISO8601; например, использование формата 22-09-2004 также допустимо. Однако, если Ваш сайт часто изменяется, рекомендуется включить сегмент времени, чтобы сканеры получили более полную информацию о Вашем сайте.

Question. Как рассчитать дату последнего изменения?

Для статических файлов это фактическая дата обновления файла. Для получения этой даты можно использовать команду "UNIX date":

$ date --iso-8601=seconds -u -r /home/foo/www/bar.php >> 2004-10-26T08:56:39+00:00

Для многих динамических URL-адресов можно легко рассчитать дату последнего изменения на основе даты изменения исходных данных или с помощью приближения на основе периодических обновлений (если применимо). Даже использование приблизительной даты или отметки времени может помочь сканерам избежать сканирования URL-адресов, которые не были изменены. Это позволяет снизить требования, предъявляемые к пропускной способности канала и к процессорам веб-серверов.

Question. Куда поместить мой Sitemap?

Настоятельно рекомендуется поместить файл Sitemap в корневой каталог на Вашем HTML-сервере по адресу http://primer.ru/sitemap.xml.

Возможно, в некоторых случаях нужно будет создать несколько файлов Sitemap для различных путей на Вашем сайте, — например, если полномочия доступа в Вашей организации установлены таким образом, что доступ с правом записи к различным каталогам предоставляется отдельно.

Если у Вас есть разрешение на загрузку файла http://primer.ru/path/sitemap.xml, то предполагается, что у Вас также имеется разрешение размещать отчеты по метаданным по адресу http://primer.ru/path/.

Все URL-адреса, указанные в том или ином файле Sitemap, должны размещаться на том же хосте, что и файл Sitemap. Например, если файл Sitemap расположен по адресу http://www.primer.ru/sitemap.xml, в нем могут быть указаны URL-адреса из субдомена http://subdomen.primer.ru. Если файл Sitemap расположен по адресу http://www.primer.ru/mojapapka/sitemap.xml, в нем могут быть указаны URL-адреса из субдомена http://www.primer.ru.

Back to top

Question. Какой размер файла Sitemap является допустимым?

Размер файлов Sitemap не должен превышать 10 МБ (10485760 байт), и эти файлы не должны включать более 50000 URL. Эти ограничения помогают исключить остановки веб-сервера при размещении очень больших файлов. Это означает, что если Ваш сайт содержит более 50000 URL или размер файла Sitemap превышает 10 МБ, необходимо создать несколько файлов Sitemap и использовать файл индекса Sitemap . Необходимо использовать файл индекса Sitemap даже для небольшого сайта, если предполагается, что количество URL превысит 50000 или размер файла будет больше 10 МБ. В файле индекса Sitemap может быть перечислено не более 1000 файлов Sitemap. Размер этого файла не может превышать 10 МБ. Кроме того, для сжатия файлов Sitemap можно использовать архиватор gzip.

Question. На моем сайте десятки миллионов URL-адресов, можно ли передать только те из них, которые были изменены недавно?

Можно перечислить часто изменяемые URL-адреса лишь в некоторых файлах Sitemap, а затем использовать тег lastmod в файле индекса Sitemap для идентификации этих файлов Sitemap. После этого поисковые системы могут последовательно сканировать только измененные файлы Sitemap.

Question. Что нужно делать после создания файла Sitemap?

После создания файла Sitemap сообщите о нем поисковым системам , передав его напрямую, проверив связь с ними или добавив местоположение файла Sitemap в файл robots.txt.

Question. Необходимо ли полностью указывать URL-адреса в Sitemap?

Yes. Необходимо включить протокол (например, HTTP) в Ваш URL-адрес. Кроме того, необходимо включить концевую косую черту, если этого требует Ваш веб-сервер. Например, адрес http://www.primer.ru/ является допустимым URL-адресом для файла Sitemap, а адрес www.primer.ru — нет.

Question. В URL-адресах моего сайта используются оба префикса "http" и "https". Нужно ли перечислять оба варианта?

No. Укажите в своих файлах Sitemap только одну версию URL-адреса. Добавление нескольких версий URL-адреса может привести к неполному сканированию Вашего сайта.

Question. URL-адреса на моем сайте включают идентификаторы сеанса. Нужно ли удалять эти идентификаторы?

Yes. Включение идентификаторов сеансов в URL-адреса может привести к неполному и излишнему сканированию Вашего сайта.

Question. Влияет ли положение URL-адреса в файле Sitemap на его использование?

No. Положение URL в файле Sitemap не влияет на то, как он будет использоваться или рассматриваться поисковыми системами.

Question. На некоторых станицах моего сайта используются фреймы. Нужно ли включать URL-адреса набора фреймов или URL-адреса содержания фреймов?

Включите оба URL-адреса.

Question. Можно ли использовать архиватор zip для моих файлов Sitemap, или их можно сжимать только с помощью архиватора gzip?

Используйте архиватор gzip для сжатия файлов Sitemap. Помните, что размер файла Sitemap (как в сжатом, так и в несжатом виде) не должен превышать 10 МБ.

Question. Будет ли параметр приоритетности в XML-файле Sitemap влиять на рейтинг моих страниц в результатах поиска?

Параметр "приоритетность" в файле Sitemap используется для того, чтобы определить очередность обработки URL в пределах Вашего собственного сайта и не влияет на рейтинг страниц в результатах поиска.

Question. Существует ли XML-схема, по которой можно проверить мой XML-файл Sitemap?

Yes. XML-схема для файлов Sitemap приведена на странице http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd , а схема для файлов индекса Sitemap — на странице http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd . Дополнительную информацию о проверке файлов Sitemap см. здесь .

Question. Куда мне обратиться, если у меня возникли другие вопросы по поводу использования протокола или процедуры отправки сведений о размещении файла Sitemap?

Обратитесь к доступной документации поисковых систем, чтобы получить дополнительную информацию относительно отправки сведений о размещении файла и о работе с файлами Sitemaps.