20 октября 2003г.
Интервью: главный технолог Google Крейг Сильверштейн уверен, что технология поиска будущего превратит научную фантастику в свершившийся факт, но пока лучш
ий выход в том, чтобы схимичить
Бывшие заказчики, в том числе Microsoft и Yahoo, стараются столкнуть Google с вершины лакомого рынка услуг поиска, но вместо того, чтобы отступать, отбиваясь и снижая цены , компания решила пойти в наступление.
Всеми силами стремясь сохранить репутацию новатора, Google расширяет спектр продуктов и готовится к переселению еще в более просторный офис в Кремниевой долине, который раньше занимала компания Silicon Graphics. А число зарубежных отделений Google — после недавнего открытия испанского отдела продаж в Мадриде — увеличилось до 21.
И пока другие ИТ-компании объявляют о сокращении штатов, Google продолжает на бирать специалистов по вычислительной технике (сейчас в компании 60 сотрудников со степенью доктора философии) при помощи таких схем, как конкурс Code Jam. О планах будущих инноваций и предстоящей конкурентной борьбе рассказал ZDNet UK главный технолог Google Крейг Силверштейн.
Продакт-менеджер Google Марисса Мейер недавно сказала, что поиск все еще находится в младенческом возрасте. Как вы думаете, когда он «вырастет»?
Когда поиск вырастет, он будет как в фильме «Star Trek»: вы произносите в воздух: «Компьютер! Что там происходит внизу на планете?», — и компьютер улавливает ваш вопрос, осознает контекст, оценивает, какого рода ответ вы ждете, ищет в гигантской базе данных на не знаю скольких языках, переводит/анализирует/суммирует все результаты и сообщает их вам приятным голосом. Думаю, что такая технология появится лет эдак через 300. При современном состоянии вычислительной техники просто научить компьютер пони мать ваши вопросы, не говоря уже о контексте, в котором они задаются, неразрешимая задача.
Пока лучшее, что мы можем сделать, это схимичить: либо притворившись, что понимаем вопрос, хотя на самом деле не понимаем его, либо задействовав человеческий и нтеллект. Именно так работает механизм PageRank: он пользуется ссылками между веб-страницами, которые выбирают люди, не понимая, почему именно человек решил установить связь между страницами А и В.
Кроме интеллекта, существуют и другие проблемы. Одна из них — множество разнообразных форматов данных, включая нетекстовые. Другая — повышение качества перевода: в честь чего вы должны получать результат худшего качества только потому, что он выражен на незнакомом вам языке?
Некоторые из этих технологий находятся в стадии разработки и еще не готовы к широкому применению. Другие реализуются легко, но проблематичны с точки зрения бизнеса: например, поиск музыкальных файлов.
Голосовой поиск уже не совсем предмет науч ной фантастики, не правда ли? Ведь ваше сотрудничество с BMW лежит именно в этой области?
Распознавание речи все еще остается в основном научной проблемой. Проект BMW весьма перспективный, но там еще очень много работы, как для академической науки, так и для индустрии. Я думаю, что эту конкретную задачу мы решим даже раньше, чем через 300 лет.
Google News и недавно открытый поисковый сайт Froogle для специалистов по е-коммерции пока работают в опытном режиме. Когда испытания завершатся?
Мы продолжаем разрабатывать новые функции — например, в Froogle добавлена возможность сортиров ки по ценам, о чем многие нас просили. И мы продолжаем оценивать отзывы людей о том, что мы делаем правильно, а что — не совсем. Когда результат и отзывы о проекте нас устраивают, мы выводим его из стадии испытаний. Однако мы никогда не спешим; основной сайт Google работал как опытный много лет.
Microsoft публично объявила о своем намерении всерьез заняться поиском после выхода операционной системы Lo nghorn, которая попытается унифицировать средства поиска в локальной сети и в интернете. Чем ответит на это Google? Считаете ли вы Microsoft в долгосрочном плане более серьезной угрозой, чем Yahoo?
Мы рады видеть конкуренцию в сфере поиска. Это означает, что компании уделяют внимание решению проблемы, которую мы считаем очень важной для веба: найти то, что мне надо, во всем разнообразии присутствующей там информации . Чем больше голов будет над этим думать, тем лучше. Конечно, хотелось бы, чтобы все эти головы трудились на Google. Но, в любом случае, мне как пользователю веба выгодно, если конкуренция возникнет и сохранится на почве технологии.
Говорят, что у вас один из крупнейших Linux-кластеров в мире (свыше 10 тыс. серверов). Что вы думаете о недавнем судебном иске SCO и его значении для пользователей Linux в случае положительного решения по нему?
На самом деле рамки претензи й по иску очень узки; мы абсолютно не переживаем по этому поводу. Но этот иск вызвал множество дискуссий, за которыми довольно интересно следить.
Вы придерживаетесь очень экономного подхода к архитектуре своих внутренних систем. Вам удалось распро странить на них общую идею Google?
У нас все дешевое. Чтобы получить требуемую вычислительную мощность, мы используем самые обычные компьютеры — тысяч и таких компьютеров, соединенных между собой, — и каждый компьютер, так как это готовый массовый продукт, обходится очень дешево. Чтобы такая среда хорошо работала, нам пришлось создать собственное ПО: оно должно быть масштабируемым и толерантным к ошибкам, так как из тысячи компьютеров хотя бы один всегда «в отключке», но эти инвестиции принесли нам огромную выгоду.
Ваш процесс кэширования критиковали за предоставление преимуществ платному конт енту некоторых компаний; возникали проблемы и с патентами... Считаете ли вы, что компания должна как-то изменить свою работу, и повлияет ли это на время поиска и на производительность сайта?
Мы уверены в чрезвычайной полезности кэша для сайтов с д инамично меняющимся контентом: пользователь видит, почему мы решили, что данная страница хорошо совпадает с его запросом, даже если ее содержание с момента ее последнего индексирования полностью изменилось. Отдельным веб-мастерам, которым не нравится кэш ирование страниц, мы позволяем очень легко выходить из программы — либо поместив специальные теги на своих веб-страницах, либо воспользовавшись нашей автоматизированной системой. Я думаю, это обеспечивает хорошее равновесие между разными подходами.
Google привлекает специалистов и проводит такие программы, как Code Jam, в то время как другие фирмы все еще ощущают рецессию. Что вы думаете о возможности начала нового подъема отрасли в ближайшее время?
Я не могу говорить за индустрию в целом, но Google продолжает набирать людей в том темпе, в котором нам удается находить хороших специалистов. Нам предстоит еще много работы, а времени на ее выполнение — всего 300 лет!
Эндрю Донохью (Andrew Donoghue),
ZDNet.ru