Най-накрая OpenAI пусна GPT-5. Новата система премахва разграничението между водещите модели на компанията и серията за разсъждение „o“, като автоматично насочва потребителските заявки към бърз модел без разсъждение или по-бавна версия за разсъждение.
GPT-5 вече е достъпен за всички чрез уеб интерфейса на ChatGPT, въпреки че потребителите, които не плащат, може да се наложи да изчакат няколко дни, за да получат пълен достъп до новите възможности.
Изкушаващо е да се сравни GPT-5 с неговия предшественик, GPT-4, но по-показателното съпоставяне е с o1, първият модел за разсъждение на OpenAI, който беше пуснат миналата година, пише MIT Technology Review.
За разлика от GPT-5, o1 първоначално беше достъпен само за абонати на Plus и Team. Тези потребители получиха достъп до напълно нов вид езиков модел – такъв, който „разсъждава“ чрез отговорите си, като генерира допълнителен текст, преди да предостави окончателен отговор, което му позволява да решава много по-трудни проблеми от неговите аналози без разсъждение.
Докато o1 беше голям технологичен напредък, GPT-5 е, преди всичко, усъвършенстван продукт. По време на брифинг за пресата, Сам Олтман сравни GPT-5 с Retina дисплеите на Apple и това е подходяща аналогия, макар и може би не по начина, по който той е възнамерявал. Подобно на безпрецедентно ясния екран, GPT-5 ще осигури по-приятно и безпроблемно потребителско изживяване. Това не е нищо, но е далеч от трансформиращото бъдеще на изкуствения интелект, за което Олтман прекара голяма част от последната година, рекламирайки го.
На брифинга Олтман нарече GPT-5 „значителна стъпка по пътя към AGI“ и може би е прав – но дори да е така, това е много малка стъпка.
Вижте демонстрацията на възможностите на модела, която OpenAI показа пред MIT Technology Review преди пускането му. Ян Дюбоа, ръководител на процесите след обучение в OpenAI, помоли GPT-5 да проектира уеб приложение, което да помогне на партньорката му да научи френски, за да може да общува по-лесно с неговото семейство. Моделът свърши възхитителна работа, следвайки инструкциите му, и създаде привлекателно и лесно за ползване приложение. Но когато го даде на GPT-4o с почти идентично подканяне, то създаде приложение с абсолютно същата функционалност. Единствената разлика е, че не беше толкова естетически приятно.
Някои от другите подобрения в потребителското изживяване са по-съществени. Това, че моделът, а не потребителят, избира дали да прилага разсъждения към всяка заявка, премахва основен проблем, особено за потребители, които не следят отблизо напредъка на големите езикови модели (LLM).
Според Олтман GPT-5 разсъждава много по-бързо от моделите от серията „o“. Фактът, че OpenAI го пуска за неплащащи потребители, предполага, че е и по-евтино за компанията да го управлява. Евтиното и бързо управление на мощни модели е сериозен проблем и решаването му е ключово за намаляване на въздействието на изкуствения интелект върху околната среда.
OpenAI също така предприе стъпки за намаляване на халюцинациите, които са постоянно главоболие. Оценките на OpenAI показват, че моделите GPT-5 са значително по-малко склонни да правят неверни твърдения от своите предшественици, o3 и GPT-4o. Ако този напредък издържи проверката, той би могъл да помогне за проправянето на пътя за по-надеждни и достоверни агенти.
Халюцинациите могат да причинят реални проблеми с безопасността“, казва Доун Сонг, професор по компютърни науки в Калифорнийския университет в Бъркли.
Например, агент, който халюцинира софтуерни пакети, може да изтегли злонамерен код на устройството на потребителя.
GPT-5 е постигнал най-високото ниво на програмиране в няколко бенчмарка, включително теста за агентски способности и оценките за кодиране SWE-Bench и Aider Polyglot. Но според Клементин Фурие, изследовател на изкуствен интелект в компанията HuggingFace, тези оценки наближават насищане, което означава, че настоящите модели са постигнали близо максималната производителност.
Това е все едно да гледате гимназист, който се справя със задачи от средните класове“, казва тя. „Ако гимназистът се провали, това ви казва нещо, но ако успее, не ви казва много.“
Фурие казва, че ще бъде впечатлена, ако системата постигне резултат от 80 или 85% в SWE-Bench, но засега успява само със 74.9%.
В крайна сметка, основното послание на OpenAI е, че GPT-5 се усеща по-добре за използване.
Вибрациите на този модел са наистина добри и мисля, че хората наистина ще го усетят, особено обикновените хора, които не са прекарвали времето си в размисъл за моделите“, каза Ник Търли, ръководител на ChatGPT.
Самите вибрации обаче няма да доведат до автоматизираното бъдеще, което Олтман обеща. Разсъжденията се усещаха като голяма стъпка напред по пътя към AGI (изкуствен общ интелект). Все още чакаме следващата.
Източник: Economic.bg