DIAL от Stanford: Почему разделение мысли и действия убивает настоящий интеллект
DIAL (Decoupling Intent and Action via Latent World Modeling) работает элегантно: одна нейросеть планирует действия в абстрактном пространстве, другая переводит планы в конкретные команды моторов. Результаты впечатляют — роботы лучше справляются с новыми задачами, требуя на 40% меньше данных для обучения.
Но здесь кроется парадокс. Embodied cognition — ведущая теория в когнитивистике — утверждает: мышление неотделимо от физического опыта. Мы понимаем 'тяжесть' через мышцы, 'расстояние' через движение. DIAL разрывает эту связь, создавая 'бестелесный' интеллект, который планирует в отрыве от физической реальности.
Тесты показывают проблему: DIAL отлично работает в предсказуемых средах, но ломается при неожиданностях. Когда робот планирует 'взять чашку', но она оказывается горячей, система не может мгновенно скорректировать план — слишком много слоёв абстракции между намерением и ощущением.