<<
>>

Динамически формируемый контент

Вам когда-нибудь встречался похожий URL? http://www. site. ru/product. asp?productid=2
Этот URL говорит о том, что контент страницы создаётся динамически с помощью таких технологий, как:
- Active Server Pages (.asp);
- Cold Fusion Pages (.cfm);
- Java Server Pages (.jsp);
- Hypertext PreProcessor (.php).
Сайты, создаваемые динамически, обычно содержат несколько шаблонов страниц, а их содержимое хранится в базе данных.
Когда страница запрашивается браузером, шаблон автоматически обращается к базе за нужным содержимым.
Чтобы отобразить нужную страницу, шаблон смотрит на указания, заключённые в URL, и запрашивает у базы соответствующее содержание. Эти указания называют параметрами или переменными, а часть URL, содержащую их, - строкой запроса (“query string”).
Например, приведённый выше URL указывает шаблону product.asp, что при каждом обращении к данной странице необходимо загрузить из базы содержание для продукта номер 2.
Влияние динамического содержания на совместимость с ПМ
Вопросительный знак (?) или другой стоп-символ информируют ПМ о том, что данная страница формируется динамически. Стоп-символы, способные помешать индексированию: амперсанд (&), доллар ($), равенство (=), плюс (+), процент (%).
В приведённом примере (http://www.site.ru/product.asp?productid=2) URL содержит только один параметр. В настоящее время большинство ПМ могут индексировать страницы с таким адресом. При большем количестве параметров возможны затруднения.
Несколько параметров могут понадобиться на больших сайтах, где на одной странице используется несколько шаблонов, каждый из которых отвечает за некоторую её область. Параметры отделяются друг от друга амперсандом (&):
http://www.site.ru/productasp?productid=2&producttype=large
Приведённый выше URL указывает шаблону product.asp, что при каждом обращении к данной странице необходимо загрузить из базы содержание для продукта номер 2, причем для версии «large» этого продукта.
Такой вид URL усложняет индексирование, так как ПМ не знает, что означает каждый параметр, а также является ли данный URL уникальной страницей. URL динамически создаваемых страниц выглядят очень похоже - ещё одна головная боль для ПМ, которые пытаются выделить и проиндексировать уникальные страницы и избежать повторного индексирования. ПМ всего лишь хотят индексировать содержание один-единственный раз и предпочитают, чтобы один и тот же текст не подсовывали им снова и снова, что часто случается с динамически формируемыми страницами.
Поэтому когда поисковый робот встречает URL с несколькими параметрами, который он не может понять, или со стоп-символами, которые показывают наличие нескольких параметров, он, скорее всего, откажется следовать по этому URL. Отсюда жалобы владельцев больших динамически формируемых сайтов на то, что их страницы не индексируются.
Будьте осторожны с ID-сессиями.
ID-сессии - это уникальные идентификаторы, часто вкладываемые в URL, которые позволяют сайту отслеживать перемещения пользователя со страницы на страницу. Например, когда пользователь совершает покупки в Инетернет-магазине, ID-сессии предназначены для того, чтобы отслеживать объекты, находящиеся в вашей корзине покупок.
Страницы, URL которых уникален для каждой сессии каждого пользователя, сталкиваются с такой же проблемой.
Для слайдеров поисковых машин ID- сессии могут создать проблемы, потому что они могут непроизвольно создать огромное количество ссылок для посещения слайдера. Опасность заключается в том, что слайдер может повторно индексировать одну и ту же информацию снова и снова. Он может попасть в ловушку, так как каждая посещенная страница мгновенно производит еще больше ссылок для следования слайдера.
Вот как выглядит система, которая использует ID-сессии:
http://www.yoursite.ru/shop.cgi?id=dkom2354kle03i
Такой она попадает к слайдеру, когда он впервые загружает одну из ваших страниц. Эта страница затем обрабатывается, но когда слайдер возвращается на ваш сайт, чтобы загрузить больше страниц, он находит другой URL:
http://www.yoursite.ru/shop.cgi?id hi545ikf93jf4k
Фактически, это та же самая страница, представленная другим ссылочным путем. Но для слайдера это выглядит как совершенно новый URL, поэтому, как в ловушке, слайдер может загружать одну и ту же страницу много раз. Вот почему слайдеры избегают подобных ссылок.
Многие ПМ не индексируют страницы, URL которых содержит динамические параметры, так как это может оказаться ловушкой: бесконечный цикл или бесконечное число таких страниц могут «поймать» поискового робота и остановить процесс индексирования.
Если вам необходимо использовать ID-сессии для отслеживания, храните их в cookies вместо ваших URL.
Оптимизация динамических сайтов
Многие сайты (особенно сайты больших корпораций) применяют динамическое формирование содержания. Как уже говорилось в этом уроке, страницы динамически формируемых сайтов создаются «на лету»; каждая секция страницы заполняется из центральной базы данных.
Некоторые ПМ (например, Google) могут индексировать сайты, URL которых содержит строки запроса, но чаще всего индексирование в этом случае не заходит значительно глубже главной страницы, поскольку потенциальный размер базы данных контента может вызвать перегрузку на сервере ПМ, снизить его работоспособность и повлиять на размер базы самой ПМ.
К сожалению, это означает, что если сайт основан на базе данных, то ПМ может его просто пропустить! Таким образом, web-мастер совершенно упускает из вида, что его новенький, с иголочки сайт, динамически формируемый с помощью базы данных, - «головная боль» для ПМ.
Итак, каковы же выводы? Лучшее решение проблемы - убрать параметры из URL и сделать станицы статическими, а не динамическими. Если это невозможно, уменьшить количество параметров или использовать специальное программное обеспечение, которое автоматически удаляет стоп-символы и делает URL дружественным ПМ.
Другое решение - использовать Robots Exclusion Protocol (файл Robots.txt). В этом файле можно задать страницы, которые не следует индексировать. Таким образом, на сайтах с динамически формируемым содержанием можно проинструктировать робота опускать дублируемые или препятствующие индексированию страницы.
Ещё одно решение - техника «переговоров» (“content negotiation”).
Основная идея техники «переговоров» в следующем: браузер посылает серверу информацию о ресурсах, которые он поддерживает (типы MIME, язык, кодировки и т.д.). Эта информация (вместе с текущими настройками сервера) используется, чтобы определить, какой контент и в каком формате лучше всего отправить пользователю. Образно говоря, браузер и сервер ведут переговоры о том, каким из доступных представлений определённого ресурса лучше всего обмениваться, учитывая предпочтения друг друга.
Специальные приёмы для сайтов с динамическим контентом
Существует несколько специальных приёмов, используя которые Вы можете быть уверены, что Ваш динамически созданный сайт будет проиндексирован. Их основной принцип - удаление стоп-символов из URL. В зависимости от сервера, на котором размещается сайт и технологии, которая использовалась при его создании, используются различные приёмы:
- для ASP: http://www.asp 101.com/articles/wayne/extendingnames;
- для Apache: http://www.apache.org/docs/mod/mod rewrite.html;
- для IIS: http://www.seoconsultants.com/windows/isapi.
<< | >>
Источник: Механов Е.В.. Базовый курс поисковой оптимизации. 2008

Еще по теме Динамически формируемый контент:

  1. 6.7. Динамически формируемый контент
  2. 6.7.1. Что такое динамически формируемое содержимое?
  3. 6.7.5. Специальные приемы для сайтов с динамическим контентом
  4. 2.13. Динамический технический анализ 2.13.1. Истоки динамического технического анализа
  5. 6.7.4. Оптимизация динамических сайтов
  6. Требования к информации, формируемой в бухгалтерском учете
  7. Методический инструментарий оценки стоимости формируемых финансовых ресурсов
  8. Оценка стоимости формируемых инвестиционных ресурсов
  9. Содержание информации, формируемой в бухгалтерском учете
  10. Методы оптимизации структуры формируемых инвестиционных ресурсов