DIAL от Stanford: Почему разделение мысли и действия убивает настоящий интеллект

Сегодня • arXiv cs.AI
Исследователи Stanford представили DIAL — систему, которая отделяет планирование от выполнения в роботах. Звучит логично: сначала думай, потом делай. Но нейронаука говорит обратное: интеллект возникает именно из связи мысли и действия.

DIAL (Decoupling Intent and Action via Latent World Modeling) работает элегантно: одна нейросеть планирует действия в абстрактном пространстве, другая переводит планы в конкретные команды моторов. Результаты впечатляют — роботы лучше справляются с новыми задачами, требуя на 40% меньше данных для обучения.

Но здесь кроется парадокс. Embodied cognition — ведущая теория в когнитивистике — утверждает: мышление неотделимо от физического опыта. Мы понимаем 'тяжесть' через мышцы, 'расстояние' через движение. DIAL разрывает эту связь, создавая 'бестелесный' интеллект, который планирует в отрыве от физической реальности.

Тесты показывают проблему: DIAL отлично работает в предсказуемых средах, но ломается при неожиданностях. Когда робот планирует 'взять чашку', но она оказывается горячей, система не может мгновенно скорректировать план — слишком много слоёв абстракции между намерением и ощущением.