Уникальность контента: шинглы и честность

6 марта 2013 г. Время чтения: меньше минуты Опубликовано в разделах: Блог, Общее

Как создать уникальный контент?
Не секрет, что уникальный контент на сайте не всегда должен быть абсолютно новым текстом. Трудно, к примеру, написать что-то совершенно новое, если стоит задача подготовить описание товаров для интернет-магазина. Поэтому оригинальный контент для интернет-ресурса следует готовить по следующим правилам:

1. контент должен быть уникальным с точки зрения поисковика;

2. на коммерческих сайтах допустим не только копирайт, но и  глубоко переработанный рерайт;

3. на сайтах, занимающихся продажей ссылок, уникализация контента может проводиться более грубо, чем на коммерческих сайтах.

Говоря о том, что контент сайта должен быть уникальным с точки зрения поисковика, необходимо понять, каким образом поисковый робот распознает заимствования. Поисковые роботы пользуются для распознания страниц-дубликатов алгоритмами шинглов.

Шинглы – что это такое?
Shingle в переводе с английского обозначает гонт –  кровельный материал, представляющий собой дощечки с пазами и выступами для соединения в единый лист. В нашем случае шингл – это алгоритм, позволяющий находить дубликаты.

Работает алгоритм следующим образом: вначале из анализируемого текста убираются все служебные слова, а значимые слова ставятся в начальную форму. Такой текст разбивается на части длиной от 3 до 10 слов; наиболее частое разбиение – на 7-8 слов. Текст может разбиваться как стык в стык, так и внахлест. Эти разбиения и будут шинглами. Каждому шинглу присваивается то или иное цифровое значение (контрольная сумма), после чего создается выборка уже контрольных сумм шинглов. Далее сравнивается выборка контрольных сумм двух документов на одну и ту же тематику; если наблюдается высокий уровень их совпадения, то и сам контент на анализируемой странице признается не уникальным, а дублированным.

Другие методы установления уникальности
В работе поисковых роботов также применяются и другие методы, позволяющие установить уникальность контента: это статистический анализ частотности слов с использованием распределения Цифра для поиска аномалий, наложение рамок длинных пассажей (абзацеподобных последовательностей слов, длинных шинглов) для поиска совпадений в тех документах, которые были переработаны для разрушения шинглов, а также другие алгоритмы. Очевидно: уникальным может быть признан только максимально глубокий рерайт текста; фактически – новый по структуре текст с той же информацией.

Понравился пост?

Подпишитесь на ежедневное обновление нашего блога прямо сейчас! Будьте в курсе новостей интернет-маркетинга!

Интернет-магазин и развитие
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Интернет-магазин и развитие на 100%
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Корпоративный сайт и развитие
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Корпоративный сайт и развитие на 100%
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Сайт-визитка и развитие
Получать новости компании 


×
Сайт-визитка, тексты и развитие
Получать новости компании 


×
Сайт-визитка и развитие на 100%
Получать новости компании 


×
Сайт, тексты и развитие (36 262 р)
Получать новости компании 


×
Лэндинг пейдж и Яндекс.Директ
Получать новости компании 


×
Лэндинг пейдж и Google.Adwords
Получать новости компании 


×
Лэндинг пейдж и Яндекс.Директ и Adwords
Получать новости компании 


×
Лэндинг пейдж и Яндекс.Директ 35 300 руб.
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Пакетное предложение
Получать новости компании 


×
Курс «Продвижение сайта без бюджета»
Получать новости компании 


×
Курс «Продвижение сайтов. Модуль 2»
Получать новости компании 


×
Курс «Профессиональная работа с контекстной рекламой»
Получать новости компании 


×
Курс «Создание Landing page + Яндекс.Директ»
Получать новости компании 


×
Курс «Создание сайта на Joomla 3! Модуль 2. Разработка»
Получать новости компании 


×
Курс «Создание интернет-магазина на VirtueMart»
Получать новости компании 


×
Курс «Создание интернет-магазина на VirtueMart»
Получать новости компании 


×
Курс «WordPress. Модуль 1. Управление сайтом»
Получать новости компании 


×
Курс«WordPress. Модуль 2. Разработка»
Получать новости компании 


×
Курс «Создание интернет-магазина»
Получать новости компании 


×
Курс «Создание сайта на основе CMS/HTML»
Получать новости компании 


×
Курс «Профессиональная веб-аналитика Google и Яндекс»
Получать новости компании 


×
Курс «Непоисковое продвижение сайтов в Интернет»
Получать новости компании 


×
Лэндинг пейдж на готовом дизайне и Яндекс.Директ
Получать новости компании 


×
Лэндинг пейдж на готовом дизайне и Яндекс.Директ
Получать новости компании 


×
Лэндинг пейдж на готовом дизайне и Google Adowrds
Получать новости компании 


×
Лэндинг пейдж на готовом дизайне и Яндекс.Директ и Google Adowrds
Получать новости компании 


×
Лэндинг пейдж на готовом дизайне и Яндекс.Директ и Google Adowrds 2 месяца
Получать новости компании 


×