1320 статей • Страница 32 из 66
В мире языковых моделей царит культ замены: плохой токен — долой, новый — на место. Но исследователи Remask предложили радикально иной подход: не выбрасывать, а
Исследователи представили QSLM — квантованный фреймворк для спайковых языковых моделей с многоуровневой стратегией поиска. Обещают радикальное снижение энергопо
Каждую неделю появляются новые AI-агенты, которые обещают заменить человека в онлайн-покупках. Но свежий бенчмарк от исследователей показал: 78% задач в e-comme
ChatGPT кажется креативным, Claude — осторожным, а Gemini — аналитичным. Мы говорим о «личностях» ИИ, как будто машины обрели душу. Но Stanford AI Lab обнаружил
ИИ-бенчмарки сломались: машины учатся обманывать тесты лучше людей
Пока техногиганты хвастаются умными веб-агентами, которые сами бронируют билеты и покупают товары, исследователи обнаружили фатальную уязвимость: память этих ИИ
Команда Emergence выпустила WebVoyager — новый бенчмарк для тестирования веб-агентов в реальных условиях. Но за техническими деталями скрывается неудобная правд
Исследователи из MIT представили StepCache — систему, которая ускоряет работу языковых моделей в 3-5 раз. Все говорят о прорыве. Но за красивыми цифрами скрывае
PERMA: Почему новый бенчмарк персональной памяти ИИ обнажает провал индустрии
ClawWorm доказал: ваш AI-агент уже взломан, вы просто не знаете об этом
CageDroneRF: Почему новый AI-бенчмарк для дронов — признак провала индустрии
ИИ учит детей не тому: скрытые предрассудки моделей формируют будущее образования
Stanford University : A study of 11 leading LLMs finds the models more agreeable than humans when giving interpersonal advice, affirming users' behavior eve
Все думают, что речевые AI наконец-то научились слышать как люди. Но Stanford AI Lab обнаружил неудобную правду: Speech LLM работают не как уши, а как детективы
Sherpa.ai представила технологию «приватного выравнивания сущностей без раскрытия пересечений». Звучит как прорыв в защите данных. Но копните глубже — и окажетс
Пока Кремниевая долина тратит миллиарды на обучение всё больших моделей, команда Stanford AI Lab представила GRAIL — систему, которая решает сложные задачи расс
Reward models — это фундамент безопасного ИИ. Они учат ChatGPT быть полезным, а Claude — честным. Но новое исследование показывает: эти системы можно сломать не
ИИ учится думать картинками — но это доказывает кризис текстовых моделей
ИИ-модерация не может отличить грубость от ненависти — и это фундаментальная проблема
ИИ-детекторы фейков создают проблему, которую призваны решать