Что делать с дублированием текстов на сайтах интернет-магазинов?

2025
33

Одной из основных проблем интернет-магазинов является дублирование (или если проще «воровство») контента. Эта проблема может очень существенно повлиять на магазин, поскольку дублирование зачастую влияет на позиции сайта в поисковых системах. А «вылет» позиций сайта за ТОП10 приводит к снижению трафика, а, следовательно, и уменьшению количества покупок.

Понятие «контент» довольно широкое, сюда можно отнести и текстовые описания и картинки, и статьи, ссылки, данные. И все это «нажитое непосильным трудом» могут скопировать конкуренты или блоггеры. Сначала поделюсь своим взглядом на дублирование именно текстового описания товаров, потому как именно оно имеет огромный вес на ранжирование поисковой системой страницы.

Причины дублирования текстов достаточно просты:

  1. описание товара можно скопировать на сайте производителя – оно доступно и ничего не нужно придумывать;
  2. владельцы новых небольших интернет-магазинов полностью копируют стратегию лидеров рынка, а копируя стратегию, копируют и содержание сайта, потому как у лидера «работает»;
  3. некоторые не задумываются над тем, что нужен уникальный контент, просто копируют с первого попавшегося сайта, чтобы было как у всех;
  4. ну и самая распространенная, на мой взгяд, это ограниченность ресурсов новых игроков. Написать тексты на основные разделы магазина – это не так и дорого, как правило, основных разделов 30-50, а вот написать уникальные тексты на тысячи моделей, это уже не одна сотня, а то и тысяча долларов.

Если возраст вашего интернет-магазина 3-5 лет, то бояться копирования текстов, конечно, не стоит. Как правило, такие магазины в глазах поисковых систем обладают некоторым доверием – трастом, что позволяет им быть «устойчивыми» к подобным проискам конкурентов.

Но если ваш ресурс молод и его не часто посещают поисковые роботы, то вероятность появления вашего материала на стороннем сайте увеличивается в разы. Также хочется добавить, что особо разбираться, кто сидел и длинными вечерами сочинял контент поисковые системы не будут, как не будут рассматривать и жалобы. Для молодых и не устоявшихся сайтов, копирование вызывает резкое падение позиций и трафика, и может быть «смертельно».

Для наглядности, срез позиций сайта интернет-магазина, один из разделов которого был продублирован на стороннем сайте.

Даже убрав созданные дубли, позиции в поисковых системах не восстановились.

В таком случае можно обращаться к службе поддержки поисковых систем с помощью панелей вебмастеров с жалобами на того, кто это сделал. Служба поддержки ПС Яндекс довольно оперативно обрабатывает такие запросы, а вот служба поддержки ПС Google в Украине не только не отвечает на жалобы пользователей, но и не реагирует на них (хотелось бы отметить, что речь идет только о google.com.ua).

Утверждать, что именно вы столкнетесь с заимствованием, никто не решится, но «кто предупрежден, тот вооружен». Поэтому нужно действовать и защищать свой контент самим.

Одним из важнейших условий высокого ранжирования вашего сайта в Топе поисковых систем является наличие на страницах проекта статического текста (другими словами, постоянного текста). Если на странице есть статический текст, с определенными ключевыми словами в нем, то релевантность страницы выбранным поисковым запросам будет намного выше. Например, описание модели не должно изменяться. Если такое описание уникально, то эта страница будет ранжироваться поисковой системой.

А как же постоянное обновление контента, которое так ценят поисковые машины? В качестве такой динамической составляющей можно использовать ленту новостей, отзывы клиентов о данной модели, а также тематические статьи. Наличие такой ленты позволит улучшить вам индексацию страницы.

А теперь о методах защиты описаний моделей. Отбросим сразу те методы, которые в нашем случае не помогут, и посмотрим, как можно защититься «до».

Для полной 100% защиты необходимо использовать юридическую защиту, сейчас можно даже он-лайн заказать процедуру депонирования, которая обеспечит доказательство авторских прав. Вы с помощью нотариуса, у которого на хранении остается экземпляр вашего текста, получаете свидетельство о депонировании. Также можно провести депонирование контента в США.

Я думаю, все понимают, что один единственный минус такой защиты – дороговизна!

На мой взгляд, самым действенным будет использование в тексте описания ссылок на другие схожие или связанные описания или разделы сайта.

От таких ссылок можно получить как минимум 2 выгоды: улучшение перелинковки вашего сайта и получение ссылок на ваш ресурс при копировании материала.

Но тут есть и некоторые недостатки: во-первых, мы можем увести пользователя по ссылке и уже не вернуть, и, во-вторых, необходимо тщательно продумать механизм проставления таких ссылок (ручное проставление таких ссылок на большом объеме страниц очень трудозатратно, ведь способ может и не сработать).

Также можно рассмотреть как вариант защиты — уникализацию тегов.

Все парсеры текстового содержания работают одинаково, они определяют по тегам текст и копируют его. Чтобы защититься от таких программ, можно изменить эти теги.

К недостаткам можно отнести: трудоемкость метода, так как сложно написать скрипт, генерирующий уникальные теги и такой метод бессилен перед парсерами, границы парсинга которым задаются вручную. Однако это наиболее действенный способ от автоматического копирования.

Довольно интересным и легким способом, если не помешать скопировать контент, то значительно растянуть по времени эту процедуру будет добавление на проект скрипта, который будет добавлять ссылку на источник.

Данный скрипт работает так: при копировании материалов с сайта в конец скопированной статьи добавляется какой-то текст, например этот текст, был скопирован с ресурса www.site.com. Автор статьи получает естественную ссылку на свой сайт.

Есть масса вариаций такого вида скриптов, для некоторых платформ есть плагины, которые работают подобным образом.

Этот способ наиболее часто применим и действен, потому как не требует особых вложений ни времени, ни средств, и в то же время заставит столкнуться с неожиданностями злоумышленников.

И хотелось бы отметить еще один метод. Применить его к большому количеству страниц трудно, но наиболее существенные страницы можно им защитить.

Принцип достаточно прост: на только что написанное описание покупается небольшое количество ссылок с частью текста в качестве анкора ссылки. Поисковые системы, увидев такую ссылку, определяют ваш текст как первоисточник.

Увы, метод дорогостоящ, но защитить наиболее приоритетные страницы мы все-таки сможем.

Конечно же, хорошо бы уберечься от воровства контента, но не всегда мы об этом думаем, иногда можно просто забыть, а порой и не успеть.

Как быть после того, как у вас украли часть контента? Что делать «после»?

Самый легкий вариант – переписать контент или сделать качественный рерайт. Так будет правильно, но очень дорого. По сути, эти деньги к нам вернутся в виде трафика, но всегда хочется сэкономить. Богатые люди говорят: «Я богат не потому что много зарабатываю, а потому что мало трачу.» Отчасти может это и верно.

Уникализировать описания на сайте можно и довольно простыми способами, что к тому же не требует больших затрат.

Для поисковых систем страница нашего сайта – это всего лишь последовательность тегов, которые отображаются в браузере как полноценная страница с содержанием.

Изменив последовательность тегов на странице, например, добавим между тегами, в которые обернут текст, теги с картинками, элементами меню или другими элементами дизайна, мы изменим структуру сайта, а, следовательно, добавим ей уникальности.

И парсить такую страницу гораздо сложнее.

У нас в описании, как правило, можно выделить несколько абзацев (если нет, то можно разбить описание на несколько абзацев в зависимости от объемов текста). После чего мы можем добавить к каждому из абзацев отдельный подзаголовок. После чего проверить описание на уникальность с помощью сервисов Advego, Copyscape или других.

Если текст не достаточно уникален, то идем дальше и подготавливаем несколько шаблонных текстов и добавляем их в описание. Добавить такой текст можно как угодно, тут уже полет вашей фантазии. Можно добавить пару шаблонных предложений в начало, можно между существующими абзацами, а можно приписать где-то в конце. Какое количество шаблонов использовать? Чем больше их разнообразие – тем лучше, не стоит использовать один текст на все модели на сайте, подготовьте шаблонные тексты на разные товарные группы, к примеру. Ну и еще один маленький штрих – можно в шаблонный текст добавлять название модели товара или название товара, программно это довольно легко.

Ну и, наверное, самый легкий способ, это разбавление текстов описаний – отзывами клиентов или текстами «законспирированными» под них.

Главное тут, немного поэкспериментировать и все получится. После того, как вы уникализируете тексты описаний, советую, вам ускорить индексацию таких страниц. Способов сделать это довольно много, можно добавить страницы в сервисы, пингующие адреса страниц или создать карту сайта, которая будет содержать только интересующие нас страницы.

Также стоит остановиться на картинках. По картинкам, как правило, приходит неплохая часть трафика, а поскольку в данной нише не такая большая конкуренция как в текстовой выдаче, стоит на нее обратить внимание.

Если у вас картинки уникальные, то их необходимо защитить. В этом помогут «водяные» знаки, избавиться от них достаточно сложно.  Определить уникальность ваших картинок могут такие сервисы как TinEye, Google Similar Images и другие.

Для уникализации картинок есть несколько проверенных способов:

  1. нужно изменить название самого рисунка, иногда копируют рисунки даже с ссылкой на сайт источник (что в принципе можно использовать с пользой для себя);
  2. изменение контрольной суммы рисунка (контрольная сумма – это некоторая величина, которая присваивается рисунку при занесении его в базу поисковой системы, по которой потом определяется ее уникальность).

Наиболее действенными методами изменения этой величины является:

— зеркалирование изображения (для надписей и логотипов – не подойдет)

— поворот картинки вокруг своей оси на некоторый градус (величина может быть разной, насколько позволяет сама картинка)

И хотя бытует мнение, что работают такие методы как обрезание картинки, размытие, всевозможные фильтры, это всего лишь вымысел.

Хотя стоит также отметить, что в поисковой оптимизации, что работает для одного порой совершенно бессмысленно применять для другого.

Наверное, ключевым и наглядным доказательством будет практический кейс. Рассмотрим выведение в ТОП новой модели телефона nokia N8, для которой при ее запуске был написан уникальный текст описания и закуплены ссылки в бирже sape. Оговорюсь, сайту на момент выведения модели было 2 года. Динамика позиций показана на рисунке.

Выведение в ТОП10 данной модели заняло 7 дней. Для продвижения срок небольшой, потому как обычно до появления результата необходимо подождать месяц другой. При этом основным фактором при продвижении было уникальный контент (описание, картинка, title), поскольку ссылки необходимы не столько для передачи веса, сколько для индексации новой страницы.

Если взять пул из 50-100 моделей для интернет-магазина с возрастом 2-3 года, показательное повышение позиций по модельным запросам будет 5-10%, что не так уж и много, если смотреть только позиции. Если же обратить внимание на этот факт с точки зрения продаж, уверена, ситуация будет куда приятней.

В заключение, скажу, 100% способа защититься от воровства контента нет, как только появляется новый способ защиты, так сразу же находится способ его миновать. Но проблему решать нужно в любом случае. Надеюсь, в этом вам помогут советы, приведенные в статье.

Оставить комментарий

Комментарии | 33

  • Адовые у Вас, Марина, красный и зеленый, которыми веделен контент на скриншотах и таблицах 😉

  • Хорошая статья. Моему сайту 4,5 месяца и чтобы сохранить контент за мной я ускоряю индексацию. Вроде помогает) 

  • уникальный контент 3.5 грн за 1000 символов (промышленные объемы, мгновенное написание, минимальный заказ 1 000 000 символов)
    аська 399 609 681

  • как-то 7 дней не получается судя по графику. А еще есть такие старые добрые методы как ddos, спам-рассылки с вражеского домена и прочие хитрости. Насколько часто юр. защита применяется там и для каких случаев «дорого» оправдано?

  • последняя картинка..
    >> Выведение в ТОП10 данной модели заняло 7 дней

    Ссылки с SAPE за такое короткое время не успели бы проиндексироваться, тем более, в Google ссылки начинают работать не сразу после индексации. А вот за счет уникального текста — да это возможно. Можна было не покупать ссылки в SAPE :)))

  • Мы
    — перестали отдавать контент в прайс-агрегаторы
    — ставим ссылку в соц сетях на новый товар (заменяет покупку ссылок)
    — делаем перелинковку по разделу
    — и главная защита: нельзя нажать контрол и правую кнопку мышки. Эта защита условная, можно скопировать текст в коде. И есть неудобства для желающих открыть что-то в новом окне например. + в конце текста автоматом появляется текст картинкой о том что описание принадлежит, защищено и т.п.
    НО именно последний метод очень помог, т.к. основные воры контента были не конкуренты, а желающие продать аналогичный товар бу на досках объявлений. (Сландо всегда! реагирует на обращение магазина и удаляет объявление).
    С конкурентами проще. Вежливое письмо с абзацем о вреде краденного контента, ссылка на описание поставщика, пожелание хороших продаж и надежд на взаимопонимание.
    Из агрессивных и крайних методов борьбы — перекупка товара заказанного конкурентом у поставщика. «Сколько они заказали, 20?(шт, ящиков). Мы купим 30, но им не отгружайте». Описание этой «игры» потянет на отдельную статью ))

  • Странно, но забыли о самом простом способе спасти текст от копирования в глазах Google..

    Просто использовать мета-тег Author. 🙂

    • мета-тег Author не учитывается при ранжировании.
      — трастовость сайта
      — кто первый был проиндексирован.
      Убедите в обратном. Буду рада если Author работает

      • Я не говорю, что раньше работал этот тег, сейчас тестирую сам эти сведения, после того как почитал этот материальчик — http://www.aweb.com.ua/seo-blog/beseda-metta-katsa-s-denni-salivanom-o-pande-2-2/#comment-236037885.
        А вот и сам текст — «Теперь время для объявлений (Мэтт рассказывает про новый тег Google для защиты контента: rel=autor).
        ДС: Это специфика Google.
        МК: Да, мы решили поддерживать этот тег.
        (Дэнни спрашивает о авторстве при перемещении с одного сайта на другой.)
        МК: Будем надеятся на это.ДС: То есть, у вас может быть концепция авторского ранжирования.»

        • Авторская метка использует существующие стандарты HTML5 (rel=”author”) и XFN (rel=”me”),
          чтобы помочь поисковым системам и другим веб-сервисам распознавать
          работы одного автора по всему Интернету. На странице с авторским
          контентом ставится особая ссылка, которая должна вести на личную
          страницу автора на том же домене.
          http://www.seonews.ru/events/detail/122940.php
          И с этого места непонятно как это применимо к интернет-магазинам.
          Допустим, магазин «нокиа4ю» пишет свой уникальный авторский контент. Кого указывать в теге автором? Магазин? К тому же авторов у магазина может быть несколько, но заказанный текст принадлежит магазину, а не автору.
          @tumanenko:disqus , как использовать этот тег интернет-магазину? Спрашивала знакомых, говорят к магазинам не относится, но никто толком ничего не знает. Подскажите, пожалуйста

          • вся деятельность seoшника построена на экспериментах, я сегодня на одном из магазинов буду делать менеджера магазина автором контента 🙂 В целом это не должно нарушать правила тега, посмотрим что будет в итоге, но зная последствия слов Мэтта уверен, что все сработает как надо.

          • пожалуйста поделитесь в блоге как сделали и результатами )

          • Обязательно)

          • вся деятельность seoшника построена на экспериментах, я сегодня на одном из магазинов буду делать менеджера магазина автором контента 🙂 В целом это не должно нарушать правила тега, посмотрим что будет в итоге, но зная последствия слов Мэтта уверен, что все сработает как надо.

  • Кстати в яндексе можно просто поработав с кодом интернет магазина вывести ресурс в топ и без уникального контента, посмотрите на wikimart, кстати на эту тему есть даже материалы на мегаинекс тв(может ошибся и на другом подобном видео ресурсе)

  • спасибо за статью, насущная тема

  • Очень актуально, недавно столкнулся с этой проблемой. Молодой сайт-первоисточник попал под фильтр, т.к. сайт, который копировал материал, был более трастовый. Вот думаем как решать. 800 позиций товаров сделать уникальное описание — задача не из простых…

  • Вопрос. А если в самой статьи проставлять руками ссылку на свой же ресурс. По-типу внизу статьи, «источник мой сайт» — скрипты как правило которые парсят статьи убирают гиперссылки или же нет?! Спасибо.

  • Мда, как говорится «и эти люди запрещают мне ковыряться в носу», зашел на упоминаемый на скриншотах магазин mobilluck и так сходу — грубейшая ошибка в разметке, причем элементарная.
    Еще один показатель «качества сео услуг», уникализация и защита контента это круто конечно, но не настолько чтобы элементарные правила верстки игнорировать, а бюджет на сео у мобиллака неслабый подозреваю)

  • А вот что-то новенькое… наткнулся на сайт http://nocopypaste.com обещают защищать текстовый контент и отдаваться ПС. У кого какие мнения на сей счет? p.s. Зарегистрировался там.. вроде все красиво, текст отдается на флеше но флэш зашифрован и разрабы божатся что текста в флеше нет… какой-то у них там технология. А ну и бесплатно это все 🙂 У кого какие есть мнения на сей счет?

Поиск