Amazon Web Services представи нов генеративен AI модел – Nova Sonic, способен да обработва глас и да генерира естествено звучаща реч. От най-голямата компания в света по оборот сред продаващите стоки и услуги чрез интернет твърдят, че Sonic се представя наравно с водещите гласови модели на OpenAI и Google при тестове за скорост, разпознаване на реч и качество на разговорите.
Nova Sonic е отговорът на Amazon Web Services на по-новите AI гласови модели, като този, който захранва гласовия режим на ChatGPT, и които звучат по-естествено в разговор, за разлика от по-ограничените ранни версии на Alexa. Последните технологични пробиви направиха по-старите модели и асистенти като Alexa и Siri да изглеждат забележимо остарели при сравнение.
Nova Sonic е достъпен чрез Bedrock – платформата на Amazon за разработка на AI приложения за бизнеса – посредством нов двупосочен стрийминг API. В прессъобщение AWS нарече Nova Sonic „най-рентабилния“ AI гласов модел на пазара – с около 80% по-евтин от GPT-4o на OpenAI.
В сравнение с конкурентни AI гласови модели, Nova Sonic се отличава в насочването на потребителските заявки към различни API. Тази способност позволява на модела да „знае“ кога да извлече информация в реално време от интернет, да обработи данни от частен източник или да извърши действие в друго приложение – използвайки подходящия инструмент.

Nova Sonic е част от по-широката стратегия на AWS за изграждане на AGI (изкуствен общ интелект), който компанията определя като „AI системи, които могат да вършат всичко, което човек може да прави на компютър.“ В бъдеще Amazon планира да пусне още AI модели, способни да разбират различни модалности – образ, видео, глас.
Само преди седмица Amazon представи предварителна версия на Nova Act -AI модел, използващ браузър, който вероятно стои зад някои функции на Alexa+ и опцията „Buy for Me“.
Четете още : Amazon създава екип за разработка на AI агенти.
Източник: Banker.bg