Сказать однозначно "да" на вопрос о закрытии PDF-файлов от индексации, нельзя. Например, если вы продаете радиоэлектронное оборудование или какое-то другое сложное оборудование, то часто принципиальные схемы выносят именно в PDF-файл, а структурную схему размещают в теле HTML-страницы. Поэтому, прежде, чем закрывать PDF-файл от индексации проанализируйте структуру сайта, и определите в каком виде вам удобнее представлять информацию пользователям.
Google и Яндекс индексируют данные документы, и по многим запросам эти файлы попадают в ТОП-10 поисковой системы.
Но существуют некоторые ограничения:
- Файлы больше 10 МБ не индексируются
- Если PDF-файл содержит только изображения, то индексируются первые три страницы. Если помимо изображений в PDF-файле имеется текстовое описание, то такой документ индексируется полностью.
Во многих случаях, PDF-файлы содержат техническую информацию (характеристики) о продаваемом товаре или услуге. Поисковые системы умеют различать данный вид текста и понимают, что на многих сайтах будет одна и та же техническая информация, поэтому боятся фильтра за дублирование контента не надо.
Могут ли PDF-файлы появляться на высоких позициях в результатах поиска?
Да! Позиции PDF-файлов определяются примерно так же, как и позиции обычных веб-страниц. Например, по актуальным на сегодняшний день запросам на высоких позициях в результатах поиска появляются PDF-документы. Это обусловлено как актуальностью содержания таких PDF-файлов, так и тем, что ссылки на них часто встречаются на других сайтах.
Важно: не рекомендуется размещать один и тот же контент в нескольких форматах. Если вам это необходимо, отметьте предпочтительную версию. Для этого можно включить URL предпочтительной страницы в файл Sitemap или указать каноническую версию в HTML-файле, либо в HTTP-заголовках PDF-файла.