Çindən süni intellekt sahəsində sensasion YENİLİK
Çinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.
Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.
DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.
Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.
DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.
BiG.Az
Telegramda izləyin
Maraqlı Baxılıb: 933 Tarix: 28 dekabr 2024
Şikayətiniz varsa Whatsapp: 077 7125666
Facebookda Paylaş
Bu şəxslərə soğan yemək olmaz
Soğan sağlamlıq problemlərinin siyahısını genişləndirə bilər. Diyetoloq, Kanada Diyetoloqlar Birliyinin üzvü Nataliya Nefedova bu barədə danışıb. O bildirib ki, soğan xüsusilə mədə-bağırsaq traktının işinin pozulmasına səbəb ola bilər. N.Nefedova "Sputnik" radiosuna verdiyi müsahibədə qey
12.09.2021 2801 Peyvənd olunana pulsuz dönər təklifi
Almaniyada türk əsilli iş adamı insanaları koronavirus əleyhinə vaksinasiyaya təşviq etmək məqsədilə maraqlı təşəbbüs göstərib. -a istinadən xəbər verir ki, Berlindəki "Kaplan Dönər"in sahibi Rəmzi Kaplan peyvənd olunan hər kəsə ona aid restoran və kafelər şəbəkəsində pulsuz dönər ikram ediləcəyin
16.09.2021 1185 Zooloqlar inəklərə görün nəyi öyrətdilər
Alimlər inək fermalarından çıxan tullantıların ətraf mühitə təsirini azaltmağın yolunu tapıblar. -a istinadən xəbər verir ki, məlum olduğu kimi, inəklər hər gün çox miqdarda peyin və sidik xaric edir. Buna görə də fermerlər gündəlik olaraq böyük təsərrüfatlarda tullantıların sanitariya problemi yaratmamas
15.09.2021 960 Cəmi 2 kilo kökəldiyi üçün işini itirdi - FOTOLAR
"Emirates Airline" şirkətində 3 ilə yaxın stüardessa işləyən Duyqu Karaman cəmi 2 kilo kökəldiyi üçün işdən çıxmalı olub. BİG.AZ xəbər verir ki, bu barədə "Mirror" yazır. Belə ki, iş yoldaşlarından biri onun çox "iri" olduğunu bildirərək rəhbərliyə şikayət edib. Şikayətdə
11.09.2021 2925 On ildən sonra övladı doğuldu, tearda baş verənlər ölümünə səbəb oldu - Arzusu ürəyində qalan Xalq artistimiz
BİG.AZ -a istinadən Xalq artisti İlham Əsgərov haqqında maraqlı faktları təqdim edir. İlham Təvəkkül oğlu Əsgərov 16 iyul 1958-ci ildə Masallı rayonunun Xançobançı kəndində anadan olub. Hələ uşaqlıq illərindən teatra həvəs göstərib. Məktəb illərində ilk dəfə səhnəyə 9-cu sinifdə çıxıb. O, Abbas Səhəti
11.09.2021 2055 56 yaşında moda dünyasını silkələyən qadın kimdir? - FOTO
Markaların reklam kampaniyalarında baxanda elə təəssürat yaranır ki, yaşlı qadınlar bazardan kənarlaşdırılıb və bu dünyada onlara yer yoxdur. Uzun illər həqiqətən belə idi, dəb dünyasında yaş kriteriyaları və gənclik kultu hökm sürürdü. Sosial şəbəkələrin yaranması ilə xoşbəxtlikdən standartlar dəyişməy
15.09.2021 2086 DƏHŞƏTLİ HADİSƏ: hamburgerdən insan barmağı çıxdı
Bolivyanın Santa Cruz de la Sierra şəhərində Estefany Benitezin adlı şəxsin yediyi hamburgerin içindən insan barmağı çıxıb. Bildirilib ki, o, dərhal istehsalçıya şikayət edib. Amma onunla heç kim maraqlanmayıb. Hadisə ilə bağlı öncə "Facebook"da, sonra beynəlxalq mətbuata açıqlayan gənc başın
15.09.2021 1292 Rusiyada məktəb dərsliyində porno sayta istinad tapılıb – FOTO
Rusiyada orta məktəb dərsliyində porno saytına aparan istinad tapılıb. -a istinadən xəbər verir ki, yayılan məlumatlara görə, neqativ hal altıncı sinif ingilis dili üzrə test tapşırıqları toplusunda üzə çıxarılıb. Həmçinin, eyni səhifədə porno aktrisasının vizit kartı da əks olunub. Müvafiq qurumları
14.09.2021 2022 Körpüyə görün hansı ad verildi - FOTOLAR
ABŞ-ın Oreqon ştatının Portland şəhərində piyada körpülərindən birinə "Simpsonlar" ("The Simpsons") cizgi filminin personajının adı verilib. xəbər verir ki, bu barədə yazır. Belə ki, həmin körpü "Simpsonlar" cizgi filmindəki Ned Flanders personajının şərəfnə adlandırılıb
15.09.2021 1164