MapMakers - OpenAI представила новую версию нейросети GPT-4o от 14.05.2024

Новости

OpenAI представила новую версию нейросети GPT-4o

OpenAI представила новую версию генеративного искусственного интеллекта GPT-4o, которая ляжет в основу чат-бота ChatGPT. Буква «о» означает сокращение от слова «omni» («всесторонний»).

GPT-4o работает с аудио, изображениями и текстом. По словам разработчиков, новая версия модели реагирует на голос в среднем за 320 миллисекунд, что сравнимо с реакцией в разговоре.

Новая версия соответствует производительности GPT-4 Turbo, но «лучше воспринимает изображение и аудио по сравнению с существующими моделями», отмечает OpenAI.

«До GPT-4o вы могли использовать голосовой режим для общения с ChatGPT со средней задержкой 2,8 секунды (GPT-3.5) и 5,4 секунды (GPT-4). Голосовой режим в этих версиях состоит из трех отдельных моделей: одна простая модель транскрибирует аудио в текст, GPT-3.5 или GPT-4 выводит текст, а третья простая модель преобразовывает этот текст обратно в аудио», — пояснили в компании.

В результате GPT-4 теряет большое количество информации и не может воспроизводить смех, пение или выражать эмоции. «В случае с GPT-4o мы обучили единую новую модель сквозному анализу текста, изображения и аудио, что означает, что все входные и выходные данные обрабатываются одной и той же нейронной сетью», — рассказали разработчики. Модель доступна более чем на 50 языках, в том числе на русском.

GPT-4o доступен для пользователей с 13 мая. Однако доступ к голосовым функциям в ближайшие недели появится только у «небольшой группы доверенных партнеров», а в июне — у платных подписчиков.

В конце ноября 2022 года компания OpenAI, одним из основателей которой был Илон Маск, представила универсальный чат-бот ChatGPT.

ChatGPT — это чат-бот, который способен вести диалог, искать ошибки в коде, сочинять стихи, писать сценарии и даже спорить. Нейросеть, на основе которой работает бот, может, помимо прочего, выдавать базовый программный код, генерировать финансовый анализ, резюме технических статей или научных концепций, прогнозы, персональные советы и дает этичные ответы на любые вопросы. Кроме того, она запоминает детали диалога с пользователем и избегает спорных тем. Наконец, ответы чат-бота можно корректировать с помощью наводящих вопросов.

ChatGPT создавали на суперкомпьютере Azure AI на основе языковой модели GPT-3,5 от OpenAI. Чат-бот обучали с помощью массива текстов из интернета и системы обучения с подкреплением на основе обратной связи с человеком — Reinforcement Learning from Human Feedback. Затем нейросеть переобучали несколько раз, используя ее собственные ответы, чтобы сделать их более точными и корректными. Разработчики заявили, что они стремились сделать ИИ простым в использовании, корректным и «человечным».

ChatGPT работает как чат в диалоговом окне. Нейросетью можно пользоваться бесплатно, для этого нужно только зарегистрироваться на сайте OpenAI. Однако пройти верификацию по российскому номеру телефона не получится. Также сайт заблокировал доступ к чат-боту с российских IP-адресов. Кроме того, разработчики предлагают платную подписку ChatGPT Plus, которая гарантирует бесперебойную работу чат-бота даже в часы загруженности. Она стоит $20 в месяц.

В марте 2023 года OpenAI представила новую модель GPT-4. ChatGPT также обновили, добавив фильтры новой модели, которая позиционируется как более точная и этичная. Также чат-бот начал отвечать на запросы в виде не только текста, но и картинок.