Поисковики путешествуют во времени: Google знает будущее лучше прошлого
Принцип кажется простым: установил фильтр «до 2020 года» — получи только контент, существовавший до 2020-го. Именно на этом строятся финансовые модели, исторические исследования и судебные экспертизы. Миллиарды решений принимаются на основе «чистых» исторических данных из поиска.
Но исследователи Stanford обнаружили фундаментальную проблему: в 23% случаев поисковые системы показывают контент, созданный ПОСЛЕ указанной даты. При запросах с фильтром «до января 2023» в результаты попадали статьи марта и даже июня 2023 года. Это не баг — это системная особенность индексации.
Причина в том, как поисковики определяют время. Google индексирует не дату создания контента, а дату его обнаружения краулерами. Статья, написанная в 2020-м, но найденная ботом в 2023-м, получает временную метку 2023 года. Добавьте сюда обновления страниц, редизайны сайтов и миграции контента — временная линия превращается в хаос.