Как устроены дата-центры Google
Mar. 4th, 2005 03:07 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Некоторые подробности того, как устроены пресловутые
По словам Хольцля, компьютерная инфраструктура Google построена
на тысячах «обычных», относительно дешевых, серверов. Общая стоимость
оборудования составляет несколько миллионов долларов. Это оказалось
выгоднее, чем приобретение меньшего количество дорогих
многопроцессорных машин, которые в общей сложности обошлись бы
в десятки миллионов.
Хитрость в том, чтобы обеспечить бесперебойную и надежную работу
такой системы, построенной на дешевом оборудовании. Кроме того,
информация должна обрабатываться максимально быстро. Здесь инженерам
Google пришлось применить весь свой талант.
В
что хотя бы одна из них будет выходить из строя ежедневно. Поэтому
в Google весь процесс максимально автоматизирован. Для обслуживания
File System, которая оптимизирована для работы с большими блоками
данных по 64 МБ, а также обладает повышенной защитой от сбоев. Вся
информация копируется и хранится в трех местах одновременно, при этом
система способна очень быстро находить реплицированные копии, если
За последний год, по словам Хольцля, компания Google значительно
расширила использование этой системы упрощенной обработки данных
в больших кластерах.
Таким образом, программное обеспечение в
имеют большую роль, чем оборудование. Если система защищена от сбоев,
а система автоматически восстанавливается, то можно устанавливать даже
самые недорогие серверы.
Серверы работают под управлением Linux. За основу был взят
стандартный дистрибутив Red Hat, в котором ядро операционной системы
было модифицировано с учетом нужд Google.
Инженеры компании также разработали специальную систему для
быстрой обработки больших объемом данных и мгновенной выдачи
результатов в ответ на запросы. Весь поисковый индекс разделен на блоки
(shads), которые тоже постоянно реплицируются на случай сбоя. Отдельные
машины предназначены для хранения документов, которые роботы Google
скачивают и индексируют.
Поиск в индексе работает очень быстро благодаря составленному
словарю всех слов, которые встречаются в интернете. То есть словарь
хранится отдельно, а в индекс попадают только символы, соответствующие
определенным словам.
Еще одной важная проблема, которую пришлось решать инженерам
Google, — это такая работа программ, чтобы они могли отправлять запросы
и быстро обрабатывать информацию сразу с тысяч серверов, то есть нужно
было эффективное распараллеливание задач. Для этого программистами
Google разработан специальный «менеджер задач» особого рода под
названием Globa Work Queue. Он разбивает задачи на части и распределяет
нагрузку между серверами.
no subject
Date: 2005-03-04 06:14 am (UTC)no subject
Date: 2005-03-04 08:17 am (UTC)podojdet?
btw,
ty videl pdf s opisaniem kak razvivalsya server zhezhe?
tam mnogo poznavatelnogo
no subject
Date: 2005-03-06 09:30 am (UTC)