Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİKÇinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.


BiG.Az
Telegramda izləyin
Maraqlı   Baxılıb: 962   Tarix: 28 dekabr 2024  

Şikayətiniz varsa Whatsapp: 077 7125666

Facebookda Paylaş

Oxşar xəbərlər

.

Oturaq həyat tərzi keçirənlər necə qidalanmalıdır? - Dəyərli məsləhətlər

Azərbaycan Respublikası Qida Təhlükəsizliyi Agentliyinin (AQTA) "AQTA maarifləndirir" rubrikası davam edir. agentliyə istinadən xəbər verir ki, rubrika çərçivəsində AQTA və Qida Təhlükəsizliyi İnstitutunun (AQTİ) mütəxəssisləri tərəfindən hazırlanan maarifləndirici materiallar, sağlam qidalanm

11.09.2021 659
.

"Atam anama deyirdi ki, mənə raxit övlad lazım deyil, at onu uşaqlar evinə" - 21 yaşlı "rezin qız"

Hal-hazırda 21 yaşım var, doğuşdan 5 yaşına kimi mən nə danışmışam, nə də yerimişəm. Allah bu rezinliyi oyuncağım olaraq vermişdi mənə. Anormal olsam da, əyilib-büzülürdüm, ayağımı başıma, başımı ayağıma qoymasaydım qala bilmirdim, çox sıxılırdım". Bunu -a anadangəlmə qeyri-adi istedada malik, "rezi

12.09.2021 5476
.

Rusiyada məktəb dərsliyində porno sayta istinad tapılıb – FOTO

Rusiyada orta məktəb dərsliyində porno saytına aparan istinad tapılıb. -a istinadən xəbər verir ki, yayılan məlumatlara görə, neqativ hal altıncı sinif ingilis dili üzrə test tapşırıqları toplusunda üzə çıxarılıb. Həmçinin, eyni səhifədə porno aktrisasının vizit kartı da əks olunub. Müvafiq qurumları

14.09.2021 2022
.

On ildən sonra övladı doğuldu, tearda baş verənlər ölümünə səbəb oldu - Arzusu ürəyində qalan Xalq artistimiz

BİG.AZ -a istinadən Xalq artisti İlham Əsgərov haqqında maraqlı faktları təqdim edir. İlham Təvəkkül oğlu Əsgərov 16 iyul 1958-ci ildə Masallı rayonunun Xançobançı kəndində anadan olub. Hələ uşaqlıq illərindən teatra həvəs göstərib. Məktəb illərində ilk dəfə səhnəyə 9-cu sinifdə çıxıb. O, Abbas Səhəti

11.09.2021 2055
.

Ovuclarınızı birləşdirin: Sevgi haqqında nələr öyrənəcəksiniz?

Ovuclarınızın içindəki sevgi xətti xarakteriniz haqqında çox şey deyir. -a istinadən məlumat verir ki, bir insanın əlləri o insan haqqında çox şey deyə bilər. Bu, uzun müddətdir ki, xarakter təhlili aparan insanlar üçün təsirli bir üsuldur. Əgər bu sizə də maraqlıdırsa, o zaman ovuclarınızı birləşdirin

16.09.2021 1627
.

Gecə paltarı ilə yatmayın - SƏBƏB

Gözəl, sağlam və rahat bir yuxu üçün yatarkən gecə paltarı geyinməyin. Hətta qışda belə. Bəs niyə gecə paltarı ilə yatmamalıyıq?. -a istinadən məlumat verir ki, insanların təxminən 40 faizi yatarkən gecə paltarı geyinirlər. Xüsusilə qış aylarında qalın "pijamalar" da yatmaqla daha rahat olacaqların

16.09.2021 3554
.

Duz istifadəsi zamanı diqqətli olun, yoxsa...

Sağlam və düzgün qidalanma zamanı gündəlik qəbul edilən duzun miqdarına diqqət yetirilməlidir. Gündəlik duzun normal qəbulu üçün aşağıdakılara diqqət yerirmək lazımdır:. * Duz qəbulu və arterial təzyiq arasında bir yaxınlıq var. Belə ki, çox duz qəbulu artıq mayenin qəbuluna və təzyiqin yüksəlməsin

18.09.2021 882
.

Hamilə olduğunu bilmirdi, hamamdan çıxanda qəfil doğuş etdi - FOTO

Yeni Zelandiyanın 9 ay hamiləliyindən xəbərsiz olan 41 yaşlı sakini Karla Akuhata gözlənimədən yataq otağında uşaq dünyaya gətirib. BİG.AZ xəbər verir ki, bu barədə "The New Zealand Herald" yazır. Belə ki, bir həftə öncə anasının evində olan Akuhata qarın nahiyəsində kəskin ağrı hiss edib

14.09.2021 2001
.

Üz dərisini ağardan unikal vasitə

Təbii inqredientlərdən və vitaminlərdən ibarət effektiv Biocosu ağardıcı krem. Serum ilə birlikdə!. Həyatın müxtəlif mərhələlərində dəridə az və ya çox intensivlikdə piqmentasiya əmələ gələ bilər. Bu, irsiyyət, yaş, hamiləlik, aşılayıcı dərman və ya gözəllik salonlarında icra edilən bəzi müalicələr səbəbində

13.09.2021 741
.

TOP MP3