⚖️ Деятельность Meta Platforms Inc. (Facebook, Instagram) признана экстремистской и запрещена на территории Российской Федерации. ⚖️ Деятельность Meta Platforms Inc. (Facebook, Instagram) признана экстремистской и запрещена на территории Российской Федерации. ⚖️ Деятельность Meta Platforms Inc. (Facebook, Instagram) признана экстремистской и запрещена на территории Российской Федерации. ⚖️ Деятельность Meta Platforms Inc. (Facebook, Instagram) признана экстремистской и запрещена на территории Российской Федерации.

Поисковики путешествуют во времени: Google знает будущее лучше прошлого

Сегодня • arXiv cs.CL
Когда вы ищете информацию за конкретную дату, Google должен показывать только контент того периода. Но новое исследование Stanford выявило «временную утечку» — поисковики систематически подмешивают будущую информацию в исторические запросы.

Принцип кажется простым: установил фильтр «до 2020 года» — получи только контент, существовавший до 2020-го. Именно на этом строятся финансовые модели, исторические исследования и судебные экспертизы. Миллиарды решений принимаются на основе «чистых» исторических данных из поиска.

Но исследователи Stanford обнаружили фундаментальную проблему: в 23% случаев поисковые системы показывают контент, созданный ПОСЛЕ указанной даты. При запросах с фильтром «до января 2023» в результаты попадали статьи марта и даже июня 2023 года. Это не баг — это системная особенность индексации.

Причина в том, как поисковики определяют время. Google индексирует не дату создания контента, а дату его обнаружения краулерами. Статья, написанная в 2020-м, но найденная ботом в 2023-м, получает временную метку 2023 года. Добавьте сюда обновления страниц, редизайны сайтов и миграции контента — временная линия превращается в хаос.