OpenAI анонсировала GPT-4o: базовые функции продвинутой модели станут бесплатными

Компьютеры делают очередной шаг к тому, чтобы разговаривать с нами по-человечески. Новая модель от OpenAI, GPT-4o, обещает не просто отвечать, а вести почти естественный диалог. И что самое приятное — ее ключевые функции станут доступны всем желающим абсолютно бесплатно.

Главные новинки: модель научилась лучше понимать интонации и контекст, а скорость ее ответов теперь сравнима с нашей реакцией в живом разговоре.

Итак, встречаем GPT-4o. Буква «o» здесь означает omni, то есть «всеобъемлющий». И это не просто красивое слово. Разработчики постарались создать модель, которая воспринимает мир комплексно: через текст, изображения и звук. Она должна стать вашим универсальным цифровым собеседником.

Что умеет новая модель: разговор без пауз

Создатели GPT-4o заявляют, что это серьезный шаг к по-настоящему естественному общению с машиной. Представьте: вы задаете вопрос голосом, а в ответ не получаете тягостной паузы, во время которой успеваете усомниться в связи. Модель обрабатывает аудио, видео и текст в реальном времени, стараясь понять не только слова, но и контекст. Ее голосовой режим стал куда плавнее и отзывчивее.

OpenAI анонсировала GPT-4o: базовые функции продвинутой модели станут бесплатными

Цифры впечатляют: время реакции на голосовой запрос — около 232 миллисекунд. Это почти как у человека в непринужденной беседе. По сравнению с предыдущей версией, GPT-4o лучше справляется с неидеальным произношением и акцентами, что делает ее, например, отличным карманным переводчиком. И да, разработчики смогут встроить эти возможности в свои приложения через специальный интерфейс (API). Мир тихо говорит «спасибо».

Самое сладкое: основные функции будут бесплатными

Вот это действительно важная новость. Все ключевые возможности GPT-4o — работа с текстом, изображениями, голосовой диалог — станут доступны обычным пользователям без подписки. Бесплатно. Конечно, у платных подписчиков будет преимущество в виде большего лимита запросов (примерно в пять раз). Но сам факт, что мощный инструмент общения с ИИ становится общедоступным, меняет правила игры. Не правда ли?