OpenAI представила GPT-5 с мультимодальными возможностями

OpenAI официально представила GPT-5 — новейшую версию своей флагманской языковой модели, которая получила значительно расширенные мультимодальные возможности. Модель способна одновременно обрабатывать текст, изображения, аудио и видео, генерируя контент в любом из этих форматов. По данным компании, GPT-5 демонстрирует улучшение производительности на 40% в сравнении с предыдущей версией при решении комплексных задач, требующих анализа нескольких типов данных одновременно. Особое внимание разработчики уделили снижению количества галлюцинаций — новая модель ошибается на 60% реже при работе с фактической информацией. Контекстное окно увеличено до 1 миллиона токенов, что позволяет анализировать целые книги или многочасовые видеоматериалы за один запрос.

Ключевым нововведением стала возможность «сквозного» понимания контента: GPT-5 может, например, просмотреть видеоролик, проанализировать речь и визуальный ряд, а затем создать подробный отчёт с временными метками и иллюстрациями. Модель также получила улучшенные возможности рассуждений — она способна самостоятельно разбивать сложные задачи на подзадачи и проверять свои выводы. OpenAI внедрила новую систему безопасности Constitutional AI второго поколения, которая позволяет модели объяснять причины отказа от выполнения потенциально вредных запросов. Доступ к GPT-5 будет поэтапным: сначала для корпоративных клиентов по подписке ChatGPT Enterprise стоимостью от $500 в месяц, затем для индивидуальных пользователей Plus и бесплатной версии с ограничениями.

Появление GPT-5 может существенно изменить конкурентный ландшафт AI-индустрии, но не в очевидном направлении. Пока все внимание сосредоточено на технологических прорывах, реальная трансформация произойдёт в экономике разработки AI-приложений. Мультимодальность в одной модели устраняет необходимость интеграции множества специализированных сервисов, резко снижая техническую сложность и стоимость создания продуктов. Это может демократизировать доступ к созданию AI-решений для малого бизнеса и стартапов, которые ранее не могли позволить себе команды ML-инженеров. Одновременно это создаёт риск усиления монополизации рынка вокруг нескольких крупных поставщиков фундаментальных моделей, что уже вызывает обеспокоенность регуляторов в ЕС и США.

OpenAI представила GPT-5 с мультимодальными возможностями

Читайте также