Спайковые нейросети QSLM: Почему энергоэффективность может убить прогресс ИИ

Сегодня • arXiv cs.AI

Исследователи представили QSLM — квантованный фреймворк для спайковых языковых моделей с многоуровневой стратегией поиска. Обещают радикальное снижение энергопотребления. Но в технических деталях спрятана неудобная правда о том, что происходит с точностью.

Индустрия ИИ одержима энергоэффективностью. ChatGPT потребляет как небольшой город, обучение GPT-4 стоило $100 миллионов только на электричество. Спайковые нейросети позиционируются как спасение — они имитируют мозг, активируя нейроны только при необходимости. QSLM идёт дальше, добавляя квантование для сжатия моделей до 4-8 бит против стандартных 32.

Но вот парадокс: чем эффективнее становятся модели, тем больше мы теряем в качестве рассуждений. QSLM использует 'tiered search strategy' — многоуровневый поиск оптимальных параметров квантования. Звучит умно, но это признание проблемы: каждый слой модели деградирует по-разному, и приходится искать компромиссы для каждого участка отдельно.

Реальность такова: спайковые модели работают отлично для простых задач распознавания, но сложные языковые задачи требуют именно тех плотных вычислений, которые спайки пытаются устранить. QSLM может сократить потребление памяти на 75%, но никто не говорит, что происходит с пониманием контекста и логическими выводами при такой агрессивной оптимизации.

Спайковые нейросети QSLM: Почему энергоэффективность может убить прогресс ИИ

Читайте также