Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİKÇinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.


BiG.Az
Telegramda izləyin
Maraqlı   Baxılıb: 985   Tarix: 28 dekabr 2024  

Şikayətiniz varsa Whatsapp: 077 7125666

Facebookda Paylaş

Oxşar xəbərlər

.

Doğum evində skandal: 20 il sonra məlum oldu ki...

İspaniyada 20 il əvvəl iki qız uşağının səhv ailələrə verildiyi açıqlanıb. Rəsmi dairələrin məlumatına görə, hadisə Rioxa bölgəsində baş verib. Açıqlamaya görə, hadisə tibb işçilərinin diqqətsizliyi səbəbilə baş verib. Bildirilir ki, uşaqlar 5 saat fərqlə dünyaya gəlib. Onlar zəif olduğu üçün xüsus

12.09.2021 2121
.

"Daha ağıllı və daha yaradıcı düşünməyə vadar edir" - Alimlər çayın faydasını araşdırdı...

Pekin Universitetinin alimləri bir fincan çay içməyin yaradıcı düşüncəni inkişaf etdirdiyini aşkar ediblər. Araşdırma nəticəsində mütəxəssislər çayın bioloji komponentlərinin deyil, çay içmək prosesinin özünün insanları "daha ağıllı və daha yaradıcı" olduqlarını düşünməyə sövq etdiyi qənaətin

12.09.2021 1068
.

Borşa da abidə qoyulacaq

Kiyev şəhər rəhbərliyi borşa qoyulacaq abidənin anonsunu verib. -a istinadən xəbər verir ki, abidənin qastroturizmin populyarlaşdırılması baxımından əhəmiyyətli olacağı bildirilib. Müvafiq təşəbbüsü aşpaz Yevgeni Klopotenko irəli sürüb. O, Ukraynada duzlu xiyara, qarpıza, dondurmaya və bu kimi qida vasitələrin

10.09.2021 1189
.

Cənazə mərasiminə açıq geyimdə getdi - Cəsədə yaxınlaşıb... / FOTO

Sosial mediada yayılan görüntülər müzakirələrə yol açıb. Reddit portalında paylaşılan məlumata görə, qız babasının cənazə mərasiminə açıq geyimdə qatılıb. Qohumların etirazlarına baxmayaraq, qız paltarını dəyişməyib. O cəsədə yaxınlaşıb və bildirib ki, babası sağ olub onu bu göyümdə görsəydi etiraz etməzdi

12.09.2021 2549
.

İtkin düşən 10 yaşlı qız pedofilin evində tapıdı - VİDEO

Rusiyanın Sankt-Peterburq şəhərində polis on yaşlı qızı pedofildən xilas edib. -a istinadən xəbər verir ki, məlumata görə, sentyabrın 9 -da axşam saatlarında məktəbli qızın atası Leninqrad vilayətinin polisə müraciət edərək, qızının dərsdən sonra evə qayıtmadığını bildirib. Polis itkin düşən məktəblini

13.09.2021 2197
.

Bu köpəkbalığı donuza oxşayır - FOTO

İtaliyanın Elba adasında üzdən donuza bənzəyən qeyri-adi köpəkbalığı tutulub. BİG.AZ xəbər verir ki, bu barədə "Daily Mirror" yazır. "Donuz-kopəkbalığı" kimi tanınan və nəsli kəsilmək üzrə olan bu balıq Qımızı Kitaba salınıb. Yerli okeanariumun əməkdaşı Yuri Tibertonun sözlərinə görə

10.09.2021 1424
.

Ovuclarınızı birləşdirin: Sevgi haqqında nələr öyrənəcəksiniz?

Ovuclarınızın içindəki sevgi xətti xarakteriniz haqqında çox şey deyir. -a istinadən məlumat verir ki, bir insanın əlləri o insan haqqında çox şey deyə bilər. Bu, uzun müddətdir ki, xarakter təhlili aparan insanlar üçün təsirli bir üsuldur. Əgər bu sizə də maraqlıdırsa, o zaman ovuclarınızı birləşdirin

16.09.2021 1627
.

Doaqlarınızın quruluğundan bezmisiniz? - ÇARƏ BURADA

MƏHSUL HAQQINDA. Faydaları:. - Dodaqların həcmini artırır, kontur xətlərini ortaya çıxarir. - Dodaqlardakı qırışıqlari azaldır. - Zədələnmiş, çatlamış dodaq toxumasını bərpa edir. - Dodaqları nəmləndirir və onlara yumuşaqliq bəxş edir. - Günəş şualarina qarşı qoruma təmin edən dodaq baxım məhsuludur

14.09.2021 364
.

Pis əhvalın koronavirusla əlaqəsi açıqlandı

Pis əhval-ruhiyyə səbəbindən COVID-19-a yoluxmaq mümkündür. -a istinadən xəbər verir ki, bu barədə rusiyalı infeksionist Svetlana Malinovskaya koronavirusun gözlənilməz səbəbləri barədə danışarkən bildirib. Həkimin sözlərinə görə, insanın psixoloji vəziyyətinin immun sistemə böyük təsiri var. "Qorxu

13.09.2021 1024
.

TOP MP3