1.8 C
София
понеделник, 07 апр. 2025

DeepSeek представи нова AI методология, която надминава съществуващите модели

Най-четени

Още от същото

Китайският стартъп в областта на изкуствения интелект DeepSeek представи нов метод за подобряване на способността за разсъждение на големите езикови модели (LLMs), като според съобщенията той надминава съществуващите подходи.

Стартъпът разработи двоен подход, който комбинира генеративно моделиране на награди (GRM) и самостоятелно критично обучение, в сътрудничество с изследователи от Университета Синхуа.

Този двоен метод е създаден с цел да позволи на LLM моделите да дават по-точни и по-бързи отговори на общи въпроси, според публикуваната в петък научна статия.

Изследователите заявиха, че създадените модели DeepSeek-GRM надминават съществуващите техники, постигайки „конкурентни резултати“ спрямо утвърдени публични модели. Моделирането на награди е процес, използван за съобразяване на поведението на езиковите модели с човешките предпочитания.

DeepSeek актуализира AI модела си V3 и предизвиква OpenAI

DeepSeek планира да направи своите GRM модели отворен код, споделиха от компанията, макар че не дадоха конкретна дата.

Статията, публикувана в онлайн научното хранилище arXiv, излиза на фона на нарастващ интерес към бъдещите разработки на компанията, след като глобално внимание привлякоха основният ѝ модел V3 и моделът за разсъждение R1.

Четете още : DeepSeek актуализира AI модела си V3 и предизвиква OpenAI.

Източник: Banker.bg

spot_img

Последни публикации