Книга Про GOOGLE, страница 5. Автор книги Анна Кроули Реддинг

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Про GOOGLE»

Cтраница 5

У Ларри и Сергея также были два оплачиваемых ассистента: Скотт Хассан и Алан Стеремберг. И Скотт, и Алан учились в Стэнфорде и искали возможность заработать немного денег и поработать на крутом проекте. Когда Алан не был занят помощью Ларри и Сергею, он занимался своим собственным проектом, Weather Underground. Впоследствии он станет одним из самых популярных сайтов с прогнозами погоды благодаря его точности и детализации. А Алан станет президентом Weather Underground.

Скотт Хассан получил работу ассистента после встречи с Сергеем на игре по алтимат фрисби в Стэнфорде. Он был талантливым программистом и столь же одаренным по части пранков. Хассан в дальнейшем стал пионером робототехники и сегодня разрабатывает робота, в котором на катящемся теле располагается голова в виде телевизора с плоским экраном. Вместо того чтобы разговаривать с роботом, ты можешь общаться по видеочату с его владельцем в режиме реального времени, прямо как по FaceTime. Возможно, в будущем вместо того, чтобы идти в школу, можно будет просто отправить своего робота! Инновация Хассана зовется The Beam [4].

Глава 3. Давно забытый кошмар: поиск до изобретения Google

Сегодня, если ты наберешь «В чем значимость Уильяма Шекспира?» В Google, ты получишь около 16 700 000 результатов всего за 0,63 секунды. И все эти результаты упорядочены по значимости. Не так уж и сложно, не правда ли?

Не правда!

Приготовься. В этой поездке на машине времени будет трясти.

До Google люди жили в мире, где результаты поиска были бессмысленными. Вот ты входишь в поисковую систему. Вводишь какое-нибудь простое ключевое слово, например, «Шекспир», так как поисковая система не может обработать разговорный текст.

Возможно, ты хотел узнать, «где родился Шекспир?». Но все, что ты смог напечатать, – фамилию Уильяма.

Разговорный текст – это фраза или предложение, которое звучит так же, как бы ты его произнес. Это неформальное и естественное выражение твоих мыслей или вопросов.

Ты нажимаешь «ввод» и ждешь, пока страницы за страницами результатов загружаются без какого-либо порядка. Фактически то, что ты ищешь, может находится в самом последнем результате поиска – или где-то в середине. Мало того, спустя целый час поиска ты скорее всего с гневом осознаешь, что нужно было ввести другое ключевое слово (и повторить все заново). Ты пытаешься закричать, но сил нет даже на шепот.

В чем проблема? Поиск в Интернете основывался на ключевых словах. Поэтому, если ты искал информацию о лошадях, поиск выдавал тебе каждый сайт, на котором упоминалось слово «лошадь». И тебе приходилось сидеть и загружать каждый результат в надежде наткнуться на нужную информацию.

Это было похоже на поход в библиотеку с просьбой рассказать о лошадях. Библиотекарь берет каждую книгу, журнал и брошюру, в которых есть по крайней мере одно слово «лошадь». Затем он сбрасывает их в беспорядочно перемешанные кучи, в которых тебе предстоит рыться, пока ты наконец не найдешь то, что искал. Таким был поиск до изобретения Google. Не многим хватает мужества вспоминать о тех временах. Нам был необходим способ как-то организовывать эту информацию.

PageRank [5]

Математический мозг Сергея Брина был идеальным котелком для варки идей алгоритма, который бы анализировал ссылки и ранжировал веб-страницы. Это было похоже на фирменный рецепт блюда. Ларри и Сергей назвали этот особый соус PageRank.

Слово PageRank звучит знакомо? Ты угадал! Ларри и Сергей назвали его в честь Ларри, используя его фамилию, Пейдж.

Представь, что ты опубликовал веб-страницу, на которой ты восторгаешься фильмом «Звездные войны: Пробуждение силы» (что, кстати говоря, по праву). Как алгоритм сможет отличить твой сайт от, например, StarWars.com? Какой сайт уместнее? Какой авторитетнее? Какой лучше освещает тему? Ответ кроется в обратных ссылках. Со столь же огромной, как твоя любовь к кинокартине, вероятностью на твой фан-сайт все-таки ссылается не так много людей, как на StarWars.com. В конце концов, StarWars.com может похвастаться сенсациями, играми, видео, закулисными кадрами, анонсами и т. д. Между тем на твоем фан-сайте может быть размещен лишь один пост о том, какое впечатление на тебя произвел этот фильм. PageRank может определить, какой сайт важнее, исходя из количества входящих ссылок. А теперь настоящий вынос мозга. Важно не то, сколько ссылок ведут на твой сайт, а то, насколько важны сайты со ссылками на твой… что определяется количеством входящих ссылок на эти сайты. Затем, когда определенной странице присвоен рейтинг PageRank, Сергей также нашел способ проанализировать такие факторы, как ключевые слова, капитализация, размер шрифта, расстояние между словами на странице и многое другое. Эти ориентиры называются «сигналами». Анализ всех этих сигналов помог Сергею разработать алгоритм, который вырисовал довольно четкую картину релевантности веб-страницы.

Как сказал Ларри интервьюеру: «Мы преобразуем всю сеть в большое уравнение с несколькими сотнями миллионов переменных, которыми выступает PageRank всех веб-страниц; и миллиардами свободных членов, в качестве которых выступают ссылки». Другими словами, сеть была просто гигантской, сложной математической задачей. Той, которую решили Ларри и Сергей.

Когда изобретатели создают что-то новое, они подают патент на свое изобретение. Эта документация защищает изобретение, чтобы другие не могли его скопировать. Поскольку PageRank был создан студентами Стэнфорда на кампусе, патентом на PageRank владеет Стэнфордский университет. Стэнфорд лицензировал этот патент исключительно для Google в обмен на акции в компании. Когда университет продал эти 1,8 миллиона акций Google в 2005 году, они заработали 336 миллионов долларов. Неплохо! (Думаю, это компенсирует недостающие компьютеры.) С патентом можно ознакомиться здесь: https://www.google.com/patents/US6285999.

В 1996 году, когда Ларри и Сергей запустили BackRub для сканирования в Интернете и создания индекса ссылок, они затем использовали PageRank для организации и ранжирования всех этих веб-данных. Анализируя результаты, они поняли, что их проект был очень похож – ну очень похож – на поисковик, только с точными результатами. Эврика! Они сравнили результаты запроса с результатами самых популярных поисковых систем тех лет. Бесспорно, результаты PageRank оставляли всех остальных далеко позади.

Как и у любого пользователя сети, первый поиск Ларри на BackRub был… его собственное имя.

Ларри и Сергей поняли, что они только что случайно произвели революцию в веб-поиске.


Про GOOGLE

Скриншот первоначальной страницы BackRub из Internet Archive WayBack Machine

Вход
Поиск по сайту
Ищем:
Календарь
Навигация