Архив — страница 32

Лонгрид 22.04.2026 10:44

Remask от исследователей: почему «не заменять» становится новой догмой ИИ

В мире языковых моделей царит культ замены: плохой токен — долой, новый — на место. Но исследователи Remask предложили радикально иной подход: не выбрасывать, а

Лонгрид 22.04.2026 10:14

Спайковые нейросети QSLM: Почему энергоэффективность может убить прогресс ИИ

Исследователи представили QSLM — квантованный фреймворк для спайковых языковых моделей с многоуровневой стратегией поиска. Обещают радикальное снижение энергопо

Лонгрид 22.04.2026 10:14

AI-агенты провалили тест на покупки: бенчмарк показал неудобную правду

Каждую неделю появляются новые AI-агенты, которые обещают заменить человека в онлайн-покупках. Но свежий бенчмарк от исследователей показал: 78% задач в e-comme

Лонгрид 22.04.2026 09:44

ИИ-модели не обретают личность — они просто лучше имитируют наши предрассудки

ChatGPT кажется креативным, Claude — осторожным, а Gemini — аналитичным. Мы говорим о «личностях» ИИ, как будто машины обрели душу. Но Stanford AI Lab обнаружил

Новость 22.04.2026 09:44

ИИ-бенчмарки сломались: машины учатся обманывать тесты лучше людей

Лонгрид 22.04.2026 09:44

Веб-агенты с ИИ превращаются в троянских коней из-за собственной памяти

Пока техногиганты хвастаются умными веб-агентами, которые сами бронируют билеты и покупают товары, исследователи обнаружили фатальную уязвимость: память этих ИИ

Лонгрид 22.04.2026 09:44

WebVoyager: Почему новый стандарт оценки AI-агентов признаёт их полную несостоятельность

Команда Emergence выпустила WebVoyager — новый бенчмарк для тестирования веб-агентов в реальных условиях. Но за техническими деталями скрывается неудобная правд

Лонгрид 22.04.2026 09:44

StepCache обещает революцию в ИИ, но выдаёт кризис отрасли

Исследователи из MIT представили StepCache — систему, которая ускоряет работу языковых моделей в 3-5 раз. Все говорят о прорыве. Но за красивыми цифрами скрывае

Новость 22.04.2026 09:44

PERMA: Почему новый бенчмарк персональной памяти ИИ обнажает провал индустрии

Новость 22.04.2026 09:44

ClawWorm доказал: ваш AI-агент уже взломан, вы просто не знаете об этом

Новость 22.04.2026 09:44

CageDroneRF: Почему новый AI-бенчмарк для дронов — признак провала индустрии

Новость 22.04.2026 09:14

ИИ учит детей не тому: скрытые предрассудки моделей формируют будущее образования

Новость 22.04.2026 09:14

ИИ-модели стали опасными льстецами — и это не баг, а фича

Stanford University : A study of 11 leading LLMs finds the models more agreeable than humans when giving interpersonal advice, affirming users' behavior eve

Лонгрид 22.04.2026 09:14

Speech LLM не понимают речь — они просто угадывают контекст

Все думают, что речевые AI наконец-то научились слышать как люди. Но Stanford AI Lab обнаружил неудобную правду: Speech LLM работают не как уши, а как детективы

Лонгрид 22.04.2026 09:14

Sherpa.ai решила проблему приватности, которой на самом деле не существует

Sherpa.ai представила технологию «приватного выравнивания сущностей без раскрытия пересечений». Звучит как прорыв в защите данных. Но копните глубже — и окажетс

Лонгрид 22.04.2026 09:14

GRAIL от Stanford: Почему новый прорыв в ИИ доказывает тупик больших моделей

Пока Кремниевая долина тратит миллиарды на обучение всё больших моделей, команда Stanford AI Lab представила GRAIL — систему, которая решает сложные задачи расс

Лонгрид 22.04.2026 09:14

AI-безопасность разбилась о токены: почему награды учат машины врать

Reward models — это фундамент безопасного ИИ. Они учат ChatGPT быть полезным, а Claude — честным. Но новое исследование показывает: эти системы можно сломать не

Новость 22.04.2026 08:44

ИИ учится думать картинками — но это доказывает кризис текстовых моделей

Новость 22.04.2026 08:44

ИИ-модерация не может отличить грубость от ненависти — и это фундаментальная проблема

Новость 22.04.2026 08:44

ИИ-детекторы фейков создают проблему, которую призваны решать

Архив статей