Meniu Shop

A APĂRUT UN NOU ALGORITM CHINEZ CU CARE GPU-URILE NVIDIA FUNCȚIONEAZĂ CU 800 ORI MAI RAPID ÎN ANUMITE SARCINI

Datorită dezvoltării care se concentrează pe peridinamică, nu mai au nevoie de hardware Nvidia performant, limitațiile artificiale devenind unitile, funcționând și pe produse foarte vechi destul de eficient.
J.o.k.e.r
J.o.k.e.r
A apărut un nou algoritm chinez cu care GPU-urile Nvidia funcționează cu 800 ori mai rapid în anumite sarcini

O echipă de cercetători a produs în ultimele luni o descoperire majoră în domeniul peridinamicii, dezvoltând un nou algoritm care crește dramatic performanța GPU prin utilizarea mult mai eficientă a puterii de calcul disponibile pentru sarcini de simulare și modelare. Descoperirea a fost făcută de o echipă de la Universitatea Shenzen MSU-BIT, o colaborare între Universitatea de Stat Lomonosov Moscov din Rusia și Institutul de Tehnologie Beijing din China. Noua dezvoltare va fi deosebit de utilă în simulările materialelor la scară largă, care pot fi aplicate într-o gamă largă de domenii, inclusiv aeronautica, sectorul militar, proiectarea inginerească, construcțiile și producția.

În esență, peridinamica poate fi utilizată pentru a permite profesioniștilor să modeleze eficient și relativ precis cât de durabil va fi un material, unde pot apărea fisuri și fracturi în utilizare, și pentru a arăta rezultatele unor impacturi fizice specifice. Astfel de sarcini de calcul necesită o putere de calcul enormă folosind algoritmi clasici seriali și paraleli, ceea ce necesită cantități mari de acceleratoare moderne, în prezent dificil de obținut din cauza restricțiilor de export din SUA, și performanțe limitate ale soluțiilor locale. Prin urmare, cercetătorii și-au concentrat activitatea recentă pe optimizarea algoritmului, utilizând tehnologia CUDA al Nvidia pentru a face calculele mai eficiente și a obține performanțe mai bune pe un GPU mai lent. Algoritmul a fost optimizat pentru utilizarea memoriei, ceea ce este esențial, deoarece disponibilitatea acceleratoarelor cu mai multă memorie, este foarte limitată.

Rezultatul final, sistemul PD-General, oferă rezultate impresionante, cu creșteri de viteză de până la 800 ori în comparație cu algoritmii seriali tradiționali utilizând doar o placă video GeForce RTX 4070, dar și creșteri de viteză semnificative în comparație cu algoritmii paralele bazate pe OpenMP, de până la 100 ori în funcție de sarcină. Acest lucru duce la creșteri uriașe de viteză pentru sarcini complexe, ceea ce este foarte impresionant.

Deschide galerie

Cercetătorii au constatat că pentru simulările la scară largă care implică milioane de particule, sistemul a fost capabil să efectueze 4 000 pași iterativi în doar 5 minute. Pentru simulările la scară largă, dar care rulează deja în două dimensiuni, în care algoritmul s-a concentrat pe probleme de discontinuitate pe o singură axă, acesta a fost capabil să finalizeze un total de 69,85 milioane de iterații în mai puțin de 2 minute - folosind o singură precizie. Acest progres permite cercetătorilor să utilizeze plăci video concepute pentru gameri pentru a rula simulările complexe menționate mai sus, fără a fi neapărat nevoiți să aibă cele mai rapide posibile, ceea ce reprezintă un avantaj enorm în ceea ce privește costurile.

Simulările pot fi utilizate și pentru a modela durabilitatea și rezistența la impacturile fizice ale componentelor aeronavelor sau navelor spațiale, dar pot fi utilizate și în industria construcțiilor pentru a crea clădiri și structuri rezistente la cutremure și la alte impacturi asupra mediului. Inovația ar putea fi utilizată și în fabricarea diferitelor dispozitive, precum și în domeniul militar, unde ar putea fi dezvoltate materiale mai rezistente pentru a face sistemele de apărare să funcționeze mai eficient. Posibilitățile sunt foarte largi.

Nu mai este nevoie neapărat de hardware high-end, care este limitat de sancțiunile SUA, și poate fi mai eficient cu hardware "mai slab", cum ar fi plăcile video pentru gameri, dar dacă acceleratoarele high-end pot fi obținute "pe o cale ocolită", pot aduce accelerări și mai semnificative comparativ cu algoritmii utilizați anterior. Cercetătorii consideră că experiența dobândită în urma acestor optimizări este utilă nu numai în domeniul peridinamicii, ci și în alte calcule științifice, deci este de mare importanță.

Această dezvoltare arată foarte bine ce se întâmplă cu creativitatea umană când este limitată artificial, dar din păcate va afecta va mai mult ca sigur negativ stocurile plăcilor video care este într-o stare penibilă chiar și acum. Sperăm doar că nu va produse o lipsă ca și în 2022 din cauza mineriadei.

Îţi recomand

    Teste

      Articole similare

      Înapoi la început