Google использует разные типы хранилищ для страниц в индексе
В новом выпуске подкаста Search Off the Record сотрудник Google Гэри Илш рассказал, что поисковик использует разные типы хранилищ для страниц в своём индексе – это зависит от уровня индексирования.
Часть страниц хранится в более дешёвых хранилищах, часть – в более дорогих, которые позволяют быстрее получать к ним доступ.
Объясняя, как Google строит свой поисковый индекс, Илш рассказал, что индексируемый контент хранится в трёх типах хранилищ:
RAM – самый быстрый и самый дорогой вариант;
SSD – очень быстрый, но очень дорогой вариант;
HDD – самый медленный и самый дешёвый вариант.
Самое быстрое хранилище резервируется для тех документов, которые часто показываются в результатах поиска. Так, контент, доступ к которому осуществляется каждую секунду, хранится на RAM или SSD. И это небольшая часть всего индекса Google.
Основная часть индекса хранится на жёстких дисках, поскольку они дешёвые, доступные и легко заменяемые.
Илш начал говорить об этом, начиная примерно с 7-й минуты подкаста.
Напомним, что в предыдущем выпуске Search Off the Record, который стал последним в 2020 году, сотрудники Google подвели итоги уходящего года и поделились своими планами на следующий год.