Почему Google лучше Яндекса

Метки: google | яндекс
Вторник, 21 октября 2008 г.
Просмотров: 22703
Подписаться на комментарии по RSS

Главная проблема, с которой столкнулись поисковики - рейтинг не всегда точно отражает авторитетность сайта.

Для примера возьмем довольно типичную ситуацию создания ГС или сателита. С сайтов конкурентов (тематических) воруются тексты. Прописываются ключевые слова, описания и т.д. Сайт проходит индексацию и поисковик начинает выдавать его в результатах поиска. До появления ссылочных бирж, рейтинг можно было накрутить с помощью разных каталогов или простым обменом, что требовало довольно много времени и не гарантировало положительного результата. Но теперь, за мизерную сумму можно накупить несколько сотен ссылок на самых разных сайтах и поисковик присвоит такому ГС более высокий рейтинг.

Конечно же программисты поисковиков сразу уловили ситуацию, и предприняли разные контрмеры. Например сейчас учитывается время размещения ссылки. Поэтому скажем покупать ссылки меньше чем на месяц просто бессмысленно - поисковик их просто не учтет. Оптимально - это два, а лучше три месяца. Тогда включится немного другой алгоритм и рейтинг «не просядет» при очередном обновлении.

Но главное в этой игре то, что оптимизаторы понимают, что какой-бы там ни был алгоритм, количество ссылок является основополагающим фактором для поисковика. Поэтому не стоит удивляться, когда сайты с нулевым рейтингом вполне котируются и продаются. Да, цены на них конечно совсем мизерные, но в течение двух-трех месяцев тот же Яндекс будет считать размещенные на них ссылки «родными» и многократно увеличит ТИЦ.

После этого включается цепочка: чем выше рейтинг, тем выше сайт в поисковой выдаче, больше трафик на сайт и т.д.

То есть мы видим, что при грамотном создании сайта и его продвижении, в основе которой будет лежать массовая покупка ссылок, можно добиться довольно-таки неплохих результатов.

Но давайте рассмотрим ситуацию со стороны Яндекса.

Когда Интернет был маленьким, Яндекс в основу выдачи закладывал именно тематическую составляющую. То есть анализировался текст и определялось его максимальное соответствие. Со временем, сайтов стало много и появились сателиты, которые просто копировали тексты с нормальных сайтов. В этом случае опираться только на текст было уже не совсем верно.

Тогда-то какой-то умный, но не дальновидный программист предложил ввести некий показатель, который позволит отсортировать результаты поиска.

Технически выборка из базы данных осуществляется по разным критериям/фильтрам. После этого выборку следует отсортировать. Но сортировка возможна сразу по нескольким полям. Например в поле N1 содержится показатель текстового соответствия. Но у многих сайтов значение N1 может совпасть. Тогда указывают, что после N1 нужно сортировать по N2, который тоже является каким-то фактором. И так далее. 

Одним из факторов, по которому осуществляется сортировка, и стал ИЦ. Для того, чтобы отделить мух от котлет придумали даже несколько ИЦ. Нам точно известно о ВИЦ (взвешенный) и ТИЦ (тематический). Что такое ВИЦ никто точно не знает, поскольку он является закрытым, а ТИЦ считается, что указывает на количество близких по тематике ссылающихся сайтов.

Проблема ТИЦ в том, что его влияние на сортировку довольно велико. То есть сайт с большим ТИЦ скорее всего окажется выше аналогичного, но с меньшим. С тематичностью ТИЦ'а тоже все не так просто. Если сайт прошел модерацию в Яндекс-каталог, то действительно его можно тематически оценить. Причем по той простой причине, что оценку осуществляет человек - модератор. Но, после того, как сайтов стало слишком много, а Яндекс решил заработать на своем каталоге, тематичность должна определяться на основе каких-то очень хитрых алгоритмов. Понятно, что программа никогда с этим качественно не справится, а с появлением блогов, где люди пишут о чем угодно, идея автоматического определения тематики сайта вообще переходит в разряд утопичных.

В Яндексе, конечно же поняли в чем дело, но ничего реального по сей день предложить не могут.

Стоит ли говорить, что по качеству поиска Гугл давно опередил Яндекс и имеет гораздо больше шансов усилить свои позиции. И секрет здесь в одной очень простой вещи - в гугле PR не является таким важным фактором в сортировке, как ИЦ в Яндексе.

Как я уже сказал, проблемы накрутить количество ссылок на сайт, сейчас не является чем-то сложным. Но ТИЦ линеен и ТИЦ=200 это явно меньше ТИЦ=300. Однако PR при таком же количестве ссылок может оказаться примерно в одном значении.

PR, в отличие от ТИЦ вычисляется по логарифмической шкале. Например разница между PR=0 и PR=1 всего 10 ссылок. Между PR=1 и PR=2 уже 100 ссылок, PR=3 и PR=4 требует 1000 ссылок и т.д. Это, конечно же очень примерная шкала - просто чтобы продемонстрировать тот факт, что PR более «растянут», чем ТИЦ и его довольно сложно использовать как «пузомерку». 

Совершенно естественно, что в Гугле точно также ощутили влияние сателитов и ГС и предприняли свои контрмеры. Разница с Янексом в том, что в Гугле довольно быстро осознали, что рейтинг страниц невозможно вычислить полностью автоматически. Тот PR, который публичный, отражает совсем не тот, что используется при реальной сортировке. Это скорее субъективный общественный рейтинг, не имеющий никакой ценности внутри поисковика.

То что это именно так, указывает то, что в результатах поиска более высокие позиции могут занимать не только сайты с большим PR. То есть можно сказать, что PR для Гугла имеет гораздо меньший фактор, чем ТИЦ для Яндекса.

То что PR порой может прыгать и выдавать откровенно «левые» значения, известно многим. Например у меня был сайт (из трех страниц-заглушек) с ТИЦ=0 и PR=5. 

Можно сделать вывод, что Гугл уже не ориентируется (как основу) на PR в поисковой выдаче. Вместо этого используются алгоритмы, отслеживающие поведение пользователей на страницах и по этим критериям определяют их качество.

Чтобы было понятно, давайте рассмотрим как мы ведем себя, когда что-либо ищем. Набираем поисковую фразу, получаем десяток страниц. Часть страницы сразу же отображется под заголовками и мы можем произвести предварительное оценивание. Первый клик и есть наш +1 балл в копилку выбранного сайта. Попав на него мы осматриваем его и если он нам явно не подходит, то закрываем или быстро куда-то уходим. То есть время нахождения может являться дополнительным критерием. Скажем время меньше 10 секунд -1 балл, больше 30 секунд +1 балл, больше минуты +3 балла.

Естественно возникает вопрос: каким таким образом Гугл может отследить все наши перемещения? Ответ прост: с помощью своих дополнительных служб. В первую очередь это Google Analytics. 

Вы никогда не задумывались, почему код аналитика не имеет картинки счетчика? Это js-скрипт, который просто передает информацию на сервер Гугла и вебмастер получает наиболее полную статистику, которая только возможна. Теперь, предположим (скорее всего так и есть), что в гугле используется единая схема идентификации пользователей. То есть ваш переход с поисковика на сайт с установленным аналитиксом будет однозначно вас идентифицировать. А если это так, что переходы между сайтами и все ваше поведение автоматически заносятся в единую базу данных.

Поэтому аналитикс и расчитан на то, чтобы как можно быстрей отработать и избежать лишнего «бана» браузеров в виде блокировщика рекламы и т.п. Задача Гугла состоит в том, чтобы собрать как можно больше информации о пользователе и все рюшечки в виде картинок его просто не интересуют.

Дополнительную информацию Гугл может получить от своей контекстной рекламы, тулбара, купленного feedburner и в конце-концов через свой браузер Chrome. 

В итоге вся эта информация анализируется и подставляется в некий внутренний рейтинг, который и определяет сортировку результатов выдачи.

С одной стороны это кажется немного жутковатым, но с другой именно этими факторами можно объяснить качество поиска. Нравится это кому-то или нет, но Гугл по сути организовал скрытое голосование. Если какой-то ГС вдруг пробъется в вершину рейтинга, то по поведению посетителей можно будет быстро отследить, что это за ресурс.

Получается, что покупать ссылки под Гугл не так выгодно, как просто потратить время и деньги на «консервативную» раскрутку: публикация качественных уникальных материалов с целью получения естественных ссылок.

С Яндексом совсем другая ситуация.

Своего счетчика у него нет. Следовательно реализовать анализ поведения можно будет только с помощью сторонних средств. Но с учетом того, что Яндекс озабочен прежде всего своей коммертизацией, то вероятность того, что у него будет увеличиваться аудитория крайне мала (кому он нужен с чужим счетчиком?).

Тот же Яндекс-каталог, который мог бы стать аналогом dmoz, работает только на платной основе и, похоже уже никакого влияния не имеет, потому что ценность сайта просто не может определяться наличием его в ЯКе.

Аналогичная ситуация с Яндекс-Директ. Ужесточение правил, закрытая и невнятная политика, заставляют вебмастеров уходить в другие системы.

С алгоритмами рейтингов у Яндекса также явная проблема. Взять для примера рейтинг блогов. Когда мы видим в его главе совершенно «убитый» сайт, с трямя rss-подписчиками, с десятком хостов в день, а в конце нормальные блоги с сотнями и даже тысячами rss-подписчиков, то совершенно очевидно, что такой рейтинг полное говно. Да и что вообще можно говорить, когда десяток ЖЖ-флешмобистов способны прорваться на вершину такого «рейтинга»?..

Что же касается ТИЦ, то Яндекс сам загнал себя в угол. С одной стороны убрать они его не могут, потому что сразу перестанут быть нужны вебмастерам, поторые не простят потери такой «пузомерки». Но можно попробовать убрать из публичного отображения значения ТИЦ. Таким образом будет более сложно оценить рейтинг сайта, что сделает продажу ссылок более рискованным, а то и вообще бессмысленным.

Для Яндекса это может оказаться даже более выгодным вариантом, потому что вебмастера перейдут на «традиционные» методы раскрутки: баннеры и контекстную рекламу. Для последнего уже есть Яндекс-Директ, так что ничего и изобретать не придется.

С точки зрения вебмастеров конечно же прекратится халява в виде Сапы, МайнЛинка и т.п. ГС перестанут быть нужны и со временем просто исчезнут. Вебмастера будут более серьезно относиться к своим блогам и сайтам, а те, кто решатся иметь свой Интернет-бизнес, будут расчитывать прежде всего на свои знания и умения. В общем как в реальной жизни.  

ps Насчет алгоритмов, я естественно не в курсе как оно на самом деле. Что у Яндекса, что у Гугла. Это я всё придумал.

pps Если в комментарии в поле «сайт» вы укажете свой сео- или аналогичный сайт, то попадете в вечный бан без предупреждений.

Источник: http://maxsite.org/myisli-vsluh-ili-pochemu-google-luchshe-yandeksa

Комментариев: 3

  1. 2008-10-25 в 21:01:35 | isle (анонимно)

    "в гугле PR не является таким важным фактором в сортировке, как ИЦ в Яндексе."

    что за бред? откуда взято? я еще месяца 2-3 где-то назад начал пирить стихи _http://isle.ex6.ru/. Ничего еще толком не делал, никах ТИЦ и ПР не было... Сайт уже стоял в первой строчке во всех поисковиках по некоторым запросам, например, "поэзы" (он и сейчас там укрепился - в первой строчке). Как это можно объяснить? При чем сейчас у стихов ТИЦ=20 (ИЦ вроде тоже - ??? - давно не проверял, не знаю) и мой сайт обошел все остальные, показатели которых гораздо выше... С Гуглом обратное... Думается, рейтинг (ТИЦ, ПР), может, и влияет, но не так сильно и только на те сайты, что в каталоге (ЯК или Дмоз).

    Кстати, везде вижу "источник"... ??? это спам-блог, что ли????

  2. 2008-10-25 в 22:27:19 | Аноним (анонимно)

    "То что PR порой может прыгать и выдавать откровенно «левые» значения, известно многим."

    Бред... - только для ГС после прогонов. После нормального обмена такого нет.

    "Можно сделать вывод, что Гугл уже не ориентируется (как основу) на PR в поисковой выдаче."

    Бред... по каким именно запросам? У моих стихов ПР=4, и они сейчас на сто- какой-то там странице по многим запросам.

    "Это я всё придумал"

    Бред, если интересует принципиально - дам кучу ссылок, где подобное написано... Или Вы под разными никами и фамилиями все это (данную статью) проспамили? Хотя могут и недобросовестные спамеры просто украсть статью...

    "время нахождения может являться дополнительным критерием."

    Бред, имхо... - пугают вебмастеров, чтобы спамили меньше и писали лучше... типа: делайте качественные топики, чтобы Вас чаще читали, а мы Вам взамен - ТЫЦем да ПиаРом угостим... Я на работе и у знакомых, короче, везде, гме только смог не выключал компы и просил, чтоб не выключали, чтоб поднять так свой сайт в рейтинге... Дома комп вообще не выключается - крайне редко, в инете всегда и всегда открыты мои сайты... почему я еще не в топах??? Эти правила читал в Гугле... хе-хе...

    "переходы между сайтами и все ваше поведение автоматически заносятся в единую базу данных"

    Так работают абсолютно любые счетчики... При чем тут гугл, чем он среди остальных (например, ЛИ) выделяется?

    "Задача Гугла состоит в том, чтобы собрать как можно больше информации о пользователе и все рюшечки в виде картинок его просто не интересуют"

    Прикол в том, что картинки с прямой ссылкой устанавливаются для самораскрутки... хе-хе... Нормальные счетчики (честные) не нуждаются в самопиаре, о них и так все знают и ПР у них у всех искусственно или как-то еще поднят, ТИЦ тоже... А все говно-счетчики ставят картинкой и прямой ссылкой, ведь не все крутые вебмастера и не все знают про ноуиндекс и ноуфоллоу - некоторые блоги пишут для себя и им всякие там ТИЦы да ПиаРы по-ровну... ;)

    "Когда мы видим в его главе совершенно «убитый» сайт, с трямя rss-подписчиками, с десятком хостов в день, а в конце нормальные блоги с сотнями и даже тысячами rss-подписчиков, то совершенно очевидно, что такой рейтинг полное говно."

    Согласен, но не полностью... иначе б Ваш сайт, да и мои тоже никто б никогда б не посещал. Понятие "говно" и "хороший" весьма и весьма резиновые... Сайт с 5-10 научными статьями и с тремя подписчиками может быть действительно гораздо полезен, чем новостной сайт/блог с тысячью, где очень много рекламы, "девок" и прочего...

    "Что же касается ТИЦ, то Яндекс сам загнал себя в угол"

    Интересно как??? самопиар, имхо... считаю бредом. ну, допустим, закроют ТИЦ и сделают его внутренним показателем, как, например, беки, ну и что? кто пострадает-то??? Ну, допустим, Вы, еще сотня-другая из нескольких десятков миллионов и 2-3-5 полудохлых бирж. Биржи, как и счетчики сделаны для денег, а не людей, для людей есть ЯК, ДМОЗ и еще несколько подобных каталогов. Кто пострадает??? мир??? или всякие там Васи Пупкины, которые маются: "как бы нарубить бабла", создав свои биржи или ГС?

    Инета вообще не было раньше... 10 лет назад даже крутые фирмы себе не могли его позволить... помнится, мобил даже не было, а пейджер был показателем "крутости" и пределом мечтаний...

    Во бред какой... самопиар, имхо...

  3. 2008-10-25 в 22:33:40 | isle (анонимно)

    "ГС перестанут быть нужны и со временем просто исчезнут. Вебмастера будут более серьезно относиться к своим блогам и сайтам, а те, кто решатся иметь свой Интернет-бизнес, будут расчитывать прежде всего на свои знания и умения. В общем как в реальной жизни."

    Ну правильно, так быть и должно... нечего срать, простите, в чежом огороде... Инет разрабатывался для военных, затем бизнесса, потом учебы (библиотеки) и науки, а сейчас для дураков и халявщиков... хе-хе... Я за качественную сеть, а Вы?

    "Если в комментарии в поле «сайт» вы укажете свой сео- или аналогичный сайт, то попадете в вечный бан без предупреждений."

    Досадно, конечно, админ, а то я свой сео-блог _http://isle-blog.ru/ продвигаю как домашнюю страничку... Вы меня без дома оставляете... ну... баньте, раз так - одним читателем меньше будет... :)

Оставьте комментарий!

Не регистрировать/аноним

Используйте нормальные имена. Ваш комментарий будет опубликован после проверки.

Если вы уже зарегистрированы как комментатор или хотите зарегистрироваться, укажите пароль и свой действующий email.
(При регистрации на указанный адрес придет письмо с кодом активации и ссылкой на ваш персональный аккаунт, где вы сможете изменить свои данные, включая адрес сайта, ник, описание, контакты и т.д.)



(обязательно)