Поделиться «Эксперимент: Сможет ли «GooglePanda» «вычислить» автоперевод…»
Всем известно, что «Панда» представляет собой поисковый алгоритм от «Google», целью которого является борьба с низкокачественным контентом. Данному алгоритму уже более четырех лет, и за этот период он неоднократно обновлялся. Вполне логично, раз алгоритм является детищем от «Google», то в идентифицировании сайтов на автоперевод, он будет использовать базу переводчика от компании «translate.google.com». Было принято решение, провести небольшой эксперимент, в ходе которого хотелось бы узнать, справиться ли алгоритм «Панда» с автопереводом сайта на менее чем 40 языков посредством API «translate.yandex.ru.», ну и, собственно, как он это сделает. В качестве базы была выбрана лексика компьютерных игр, при этом объем контента составил 20 млн. символов.
В качестве целей эксперимента выделим:
- установить справиться ли алгоритм «Панда» с идентификацией автоперевода при использовании баз неродных переводчиков;
- установить регионы, более подходящие для положительного ранжирования некачественного контента;
- провести оценку качества между различными регионами ссылочного;
- узнать регионы, которые являются для сайтов МFA наиболее привлекательными.
Условиями эксперимента выступают:
- Для отдельного целевого региона — 37 поддоменов (xx.name.info).
- Целиком переведенные сайты (мета данные, навигация, текстовый контент).
- Была проведена перегенерация ЧПУ.
- Вместе с тем (февраль, 2015), произвели запуск в индекс системы поиска «Google».
- Провели с версией на русском языке абсолютную синхронизацию. После опубликования новости на русском языке, её автоматом перевели на другие языки, после чего новость была опубликована на ресурсах регионального значения.
- На версию на русском языке были залинкованы все региональные сайты. Каждая страничка в зоне домена «.ru» ссылается на русскоязычную версию, при этом используется анкор «Название страницы».
- Ресурсы имеют одинаковые IP, дизайн и данные для контактов.
Сведения для проведения эксперимента собирались на протяжении года. В данный промежуток времени активность размещения уникального контента постоянно поддерживалась.
Результаты проведенного эксперимента:
Сперва посмотрим на цифры в процентном эквиваленте, какое количество страничек попало в индекс, используя региональные домены.
Как видите, можно выделить три группы:
- Страницы с плохим показателем индекса (до 40 процентов). Вполне возможно, что алгоритм распознал нечто неладное.
- Нормально проиндексированные страницы (40-70%%). Алгоритму удалось найти несколько страниц сомнительного качества, но сайт ранжируется неплохо.
- Страницы с хорошим показателем индекса выше 70%. В данном случае автоперевод воспринят системой довольно дружелюбно.
Важно отметить, что значение «всего проиндексировано страниц» равняется «общему индексу для всех доменов». Это значит, что система «Google» не взяла во внимание «Дополнительный индекс» при рассмотрении автоперевода, то есть она просто откидывала из индекса то, что воспринимала в качестве негодного контента. Правда, тут имеются исключения. К примеру, Финскую языковую версию проиндексировала система на 76 процентов.
Давайте посмотрим, сколько на протяжении года было получено поискового трафика от системы «Google».
Отметим, что не очень правильно проводить сравнение регионального трафика со всей Россией, поскольку отсутствует выравнивающий коэффициент, который бы учитывал уровень популярности общей группы запросов для отдельно взятого региона. Для его вычисления потребуются высококачественные переводчики, а также сбор сведений по конкретным странам. На это нет лишних средств. Следовательно, полученную информацию стоит рассматривать для независимого анализа, или же для общего развития.
Стоит в отдельную группу выделить пять стран, тут поисковик «Google» не выступил в качестве трафикообразующего компонента:
- в Чехии 50% трафика получено от «Seznam»;
- в Турции 30% от «Яндекс»;
- в Китае 75% от «Baidu»;
- в Малайзии 50% получено от местных поисковиков;
- в Сербии от «Яндекс» 70%.
Взглянув на панель вебмастера от «Google», мы увидели следующие сведения. На домене «.ru» учтено 222 700 ссылок, ведущих с ресурсов регионального значения. Они, в свою очередь, отправляли на 3 821 страницу. Отметим, абсолютно все ссылки имели различные анкоры и были распределены по своим соответствующим аналогам на русском языке. Подобные показатели являются значимыми, и они никоим образом не оказали влияния на позиции сайта и его трафик.
Поделиться «Эксперимент: Сможет ли «GooglePanda» «вычислить» автоперевод…»