Языки программирования для кода: почему таксономия убивает инновации

Сегодня • arXiv cs.CL
Учёные создали подробную классификацию языков программирования для автоматической генерации кода. Но пока все спорят о Python против Rust, реальная проблема скрывается в самом подходе к категоризации.

Исследователи представили детальную таксономию языков программирования, оптимальных для автогенерации кода ИИ-системами. Общепринятая мудрость гласит: правильный выбор языка определяет качество сгенерированного кода. Поэтому нужна чёткая классификация — какой язык для каких задач лучше подходит.

Но данные исследования показывают обратное. Из 47 проанализированных языков программирования, топ-3 по качеству автогенерации (Python, JavaScript, Java) покрывают лишь 23% реальных production-сценариев. Остальные 77% требуют гибридных подходов, которые не вписываются ни в одну категорию таксономии.

Проблема глубже: пока мы классифицируем инструменты, ИИ-системы учатся обходить ограничения языков через мета-программирование. GPT-4 генерирует код на условном 'псевдо-языке', который затем транспилируется в нужный синтаксис. Таксономия описывает вчерашний день, когда язык был ограничением, а не абстракцией.