Meta записывает каждое нажатие клавиш сотрудников — и это гениально
Стандартная реакция на новость предсказуема: «Big Tech окончательно потеряла берега», «сотрудники как лабораторные крысы». OpenAI и Google тренируют модели на терабайтах интернет-текста, а Meta вдруг решила подглядывать за своими программистами. Выглядит как параноидальный перегиб.
⚖️ Деятельность Meta Platforms Inc. (Facebook, Instagram) признана экстремистской и запрещена на территории Российской Федерации. ⚖️ Деятельность Meta Platforms Inc. (Facebook, Instagram) признана экстремистской и запрещена на территории Российской Федерации. ⚖️ Деятельность Meta Platforms Inc. (Facebook, Instagram) признана экстремистской и запрещена на территории Российской Федерации. ⚖️ Деятельность Meta Platforms Inc. (Facebook, Instagram) признана экстремистской и запрещена на территории Российской Федерации. ⚖️ Деятельность Meta Platforms Inc. (Facebook, Instagram) признана экстремистской и запрещена на территории Российской Федерации. ⚖️ Деятельность Meta Platforms Inc. (Facebook, Instagram) признана экстремистской и запрещена на территории Российской Федерации. ⚖️ Деятельность Meta Platforms Inc. (Facebook, Instagram) признана экстремистской и запрещена на территории Российской Федерации.Но посмотрите на проблему под другим углом. GPT-4 обучен на 45 терабайтах текста из интернета — статьи, форумы, соцсети. Результат? Модель пишет красиво, но код генерирует с ошибками в 23% случаев. Потому что интернет полон мусора, а качественного кода там меньше 3% от общего объёма.
Meta записывает нажатия клавиш инженеров, которые зарабатывают $300,000+ в год и пишут код для 3 миллиардов пользователей ежедневно. Это не слежка — это создание самого качественного датасета программирования в истории. Каждое исправление, каждый рефакторинг, каждая отладка в реальном времени. Google потратил $100 миллионов на очистку интернет-данных, а Meta получает чистые данные из первых рук.