OpenAI представила новую версию нейросети GPT-4o
OpenAI представила новую версию генеративного искусственного интеллекта GPT-4o, которая ляжет в основу чат-бота ChatGPT. Буква «о» означает сокращение от слова «omni» («всесторонний»).
GPT-4o работает с аудио, изображениями и текстом. По словам разработчиков, новая версия модели реагирует на голос в среднем за 320 миллисекунд, что сравнимо с реакцией в разговоре.
Новая версия соответствует производительности GPT-4 Turbo, но «лучше воспринимает изображение и аудио по сравнению с существующими моделями», отмечает OpenAI.
«До GPT-4o вы могли использовать голосовой режим для общения с ChatGPT со средней задержкой 2,8 секунды (GPT-3.5) и 5,4 секунды (GPT-4). Голосовой режим в этих версиях состоит из трех отдельных моделей: одна простая модель транскрибирует аудио в текст, GPT-3.5 или GPT-4 выводит текст, а третья простая модель преобразовывает этот текст обратно в аудио», — пояснили в компании.
В результате GPT-4 теряет большое количество информации и не может воспроизводить смех, пение или выражать эмоции. «В случае с GPT-4o мы обучили единую новую модель сквозному анализу текста, изображения и аудио, что означает, что все входные и выходные данные обрабатываются одной и той же нейронной сетью», — рассказали разработчики. Модель доступна более чем на 50 языках, в том числе на русском.
GPT-4o доступен для пользователей с 13 мая. Однако доступ к голосовым функциям в ближайшие недели появится только у «небольшой группы доверенных партнеров», а в июне — у платных подписчиков.
В конце ноября 2022 года компания OpenAI, одним из основателей которой был Илон Маск, представила универсальный чат-бот ChatGPT.
ChatGPT — это чат-бот, который способен вести диалог, искать ошибки в коде, сочинять стихи, писать сценарии и даже спорить. Нейросеть, на основе которой работает бот, может, помимо прочего, выдавать базовый программный код, генерировать финансовый анализ, резюме технических статей или научных концепций, прогнозы, персональные советы и дает этичные ответы на любые вопросы. Кроме того, она запоминает детали диалога с пользователем и избегает спорных тем. Наконец, ответы чат-бота можно корректировать с помощью наводящих вопросов.
ChatGPT создавали на суперкомпьютере Azure AI на основе языковой модели GPT-3,5 от OpenAI. Чат-бот обучали с помощью массива текстов из интернета и системы обучения с подкреплением на основе обратной связи с человеком — Reinforcement Learning from Human Feedback. Затем нейросеть переобучали несколько раз, используя ее собственные ответы, чтобы сделать их более точными и корректными. Разработчики заявили, что они стремились сделать ИИ простым в использовании, корректным и «человечным».
ChatGPT работает как чат в диалоговом окне. Нейросетью можно пользоваться бесплатно, для этого нужно только зарегистрироваться на сайте OpenAI. Однако пройти верификацию по российскому номеру телефона не получится. Также сайт заблокировал доступ к чат-боту с российских IP-адресов. Кроме того, разработчики предлагают платную подписку ChatGPT Plus, которая гарантирует бесперебойную работу чат-бота даже в часы загруженности. Она стоит $20 в месяц.
В марте 2023 года OpenAI представила новую модель GPT-4. ChatGPT также обновили, добавив фильтры новой модели, которая позиционируется как более точная и этичная. Также чат-бот начал отвечать на запросы в виде не только текста, но и картинок.