Çindən süni intellekt sahəsində sensasion YENİLİK
Çinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.
Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.
DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.
Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.
DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.
BiG.Az
Telegramda izləyin
Maraqlı Baxılıb: 922 Tarix: 28 dekabr 2024
Şikayətiniz varsa Whatsapp: 077 7125666
Facebookda Paylaş
Pitbul küçədə səkkiz yaşlı uşağa hücum etdi - VİDEO
Türkiyənin Çorum şəhərində səkkiz yaşlı oğlan pitbul cinsli itin hücumuna məruz qalıb. -a istinadən xəbər verir ki, insident ərazidə olan təhlükəsizlik kameraları tərəfindən qeydə alınıb. Yeniyetmə oğlan ətrafdakı insanların köməyi ilə itin hücumundan xilas edilsə də, onun müxtəlif xəsarətlər aldığ
14.09.2021 1051 Çox təcili 9 mkr-da Mir Cəlal küçəsində təmirli mənzil satılır!
16 ci mərtəbədə təmirli qanuni 2 otaq əlavə 1uşag otağı var.Qazı,suyu,işığı daimidir.Bağça,məktəb 100 metr məsafədə yerləşir. Evin çıxarışı var. Qiymət 12800man. Əlaqə üçün (055) 8166886. (050) 3127604
13.09.2021 1018 56 yaşında moda dünyasını silkələyən qadın kimdir? - FOTO
Markaların reklam kampaniyalarında baxanda elə təəssürat yaranır ki, yaşlı qadınlar bazardan kənarlaşdırılıb və bu dünyada onlara yer yoxdur. Uzun illər həqiqətən belə idi, dəb dünyasında yaş kriteriyaları və gənclik kultu hökm sürürdü. Sosial şəbəkələrin yaranması ilə xoşbəxtlikdən standartlar dəyişməy
15.09.2021 2086 Gecə paltarı ilə yatmayın - SƏBƏB
Gözəl, sağlam və rahat bir yuxu üçün yatarkən gecə paltarı geyinməyin. Hətta qışda belə. Bəs niyə gecə paltarı ilə yatmamalıyıq?. -a istinadən məlumat verir ki, insanların təxminən 40 faizi yatarkən gecə paltarı geyinirlər. Xüsusilə qış aylarında qalın "pijamalar" da yatmaqla daha rahat olacaqların
16.09.2021 3554 3 milyon dəyərində sendviç hazırlandı - Ən bahalı qidalar
Dünyanın ən bahalı sendviçi hazırlanıb. Axşam.az-a istinadən xəbər verir ki, sendviç almaniyalı rəssam Tim Bengel tərəfindən saf qızıl istifadə olunaraq düzəldilib. Həmin qida 3 milyon dollar dəyərində qiymətləndirilib. Qeyd edək ki, bu ilk belə baha qida məhsulu deyil. Dünyanın ən bahalı yeməklərin
17.09.2021 877 Bakıda dördəm doğulub - VİDEO
Bakıda dördəm doğulub. -ın xəbərinə görə, uşaqlardan 3-ü oğlan 1140 qr., 1350 qr., 1230 qr, biri qızdır 1120 qr. Zaqatala rayon sakinləri olan 30 yaşlı Ülviyyə Sofiyeva və 32 yaşlı Huseynbala Sofiyevin ailəsində dünyaya gələn uşaqlar onların ilk övladlarıdır. Qeysəriyyə əməliyyatı ilə doğulan uşaqları
15.09.2021 942 Bayden Trampı xatırlayan kimi xaç çəkdi - VİDEO
ABŞ prezidenti Co Bayden demokrat qubernaton Qevin Nyusoma dəstək mitinqində özünün Donald Trampla rəqabətini xatırlayıb. -ın -a istinadən məlumatına görə, o bildirib ki, Kaliforniya sakinlərinin qəbul edəcəyi qərar tək ABŞ-a yox, ümumilikdə bütün dünyaya təsir qoyacaq. "Bilirsiniz ki, ötən il seçkilərd
15.09.2021 660 Məşhur şirkətlərdə məvaciblər nə qədərdir?
Bir çoxları "Google", "Facebook", "Amazon", "Uber", "Microsoft", "Intel", IBM kimi tanınmış ABŞ şirkətlərdə çalışmaq arzusundadır. Cari ilin ilk yarısında texnoloji nəhənglər 80 min nəfərdən çox əcnəbi əməkdaşı işə cəlb edib. Bəs görəsən onlar
16.09.2021 817 Aralarındakı uzun məsafəyə maraqlı həll tapan cütlük - FOTO
Uzun məsafə münasibəti yaşayan Liseok və Şindanbi, bu problemə maraqlı həll tapıblar. -a istinadən məlumat verir ki, biri Nyu -Yorkda, digəri Seulda yaşayan koreyalı cütlük, video zəng edərkən eyni vaxtda çəkdikləri şəkilləri bir araya gətirərək maraqlı fotolar əldə ediblər. Bu fotoları "Instagram"
13.09.2021 1580