Приложение ChatGPT будет обладать способностью вести разговор с людьми и распознавать изображения. Об этом сообщает Bizmedia.kz.
OpenAI обещает голосовую функцию и распознавание изображений для приложения ChatGPT
Новейшее обновление от OpenAI, как передает Евроньюс, преобразует приложение ChatGPT в многофункциональный инструмент, способный не только общаться с пользователем на уровне человека, но и анализировать изображения. Эта функциональность будет доступна в версиях приложения для iOS и Android.
Инновационная функция преобразования текста в речь, созданная OpenAI, позволит пользователям выбирать из пяти разнообразных голосов. Также будет встроена система распознавания речи Whisper AI, которая транскрибирует аудио данные в текстовый формат.
Голоса, получившие названия Juniper, Sky, Cove, Ember и Breeze, и представляющие собой комбинацию мужских и женских тонов с американским акцентом, можно использовать в любых сценариях — от рассказывания ночной сказки до урегулирования споров за обедом.
Сэм Альтман, глава OpenAI, подчеркивал требования к регулированию ИИ из-за его возможной угрозы для человечества, но, несмотря на эти предостережения, его компания продолжает развивать технологии.
Следующий шаг в развитии ChatGPT – возможность для пользователей представлять изображения на анализ ИИ. OpenAI утверждает, что модель была протестирована во «всех областях, от экстремизма до научного знания», чтобы гарантировать ее ответственное использование.