OpenAI анонсировала GPT-4o: базовые функции продвинутой модели станут бесплатными
Итак, встречаем GPT-4o. Буква «o» здесь означает omni, то есть «всеобъемлющий». И это не просто красивое слово. Разработчики постарались создать модель, которая воспринимает мир комплексно: через текст, изображения и звук. Она должна стать вашим универсальным цифровым собеседником.
Что умеет новая модель: разговор без пауз
Создатели GPT-4o заявляют, что это серьезный шаг к по-настоящему естественному общению с машиной. Представьте: вы задаете вопрос голосом, а в ответ не получаете тягостной паузы, во время которой успеваете усомниться в связи. Модель обрабатывает аудио, видео и текст в реальном времени, стараясь понять не только слова, но и контекст. Ее голосовой режим стал куда плавнее и отзывчивее.
Цифры впечатляют: время реакции на голосовой запрос — около 232 миллисекунд. Это почти как у человека в непринужденной беседе. По сравнению с предыдущей версией, GPT-4o лучше справляется с неидеальным произношением и акцентами, что делает ее, например, отличным карманным переводчиком. И да, разработчики смогут встроить эти возможности в свои приложения через специальный интерфейс (API). Мир тихо говорит «спасибо».
Самое сладкое: основные функции будут бесплатными
Вот это действительно важная новость. Все ключевые возможности GPT-4o — работа с текстом, изображениями, голосовой диалог — станут доступны обычным пользователям без подписки. Бесплатно. Конечно, у платных подписчиков будет преимущество в виде большего лимита запросов (примерно в пять раз). Но сам факт, что мощный инструмент общения с ИИ становится общедоступным, меняет правила игры. Не правда ли?