Výsledkom ich spoločného inžinierskeho úsilia je nová špecifikácia inštrukčnej sady ACE (AI Compute Extensions). Táto technologická vychytávka má jediný cieľ: drasticky zrýchliť beh neurónových sietí a umelej inteligencie priamo na bežných x86 čipoch našich počítačov.
Neznamená to, že by chceli z trhu úplne vytlačiť masívne grafické karty od Nvidie. Novinka má slúžiť ako blesková a energeticky úsporná alternatíva pre menšie lokálne AI modely, aplikácie vyžadujúce okamžitú odozvu bez latencie, alebo pre zariadenia, ktoré samostatný grafický akcelerátor vôbec nemajú.
Architektúra postavená na maticiach
Nová technológia priamo nadväzuje na existujúcu inštrukčnú sadu AVX10. Rozširuje ju však o špecializované hardvérové bloky zamerané na takzvané maticové násobenie, čo je alfa a omega, na ktorej stoja a padajú moderné AI modely.
Doterajšie procesory museli tieto matematické operácie zložito chrliť cez všeobecné vektorové inštrukcie. Súprava ACE však prináša kremíkovú architektúru navrhnutú na mieru priamo pre prácu s maticami. V praxi to prinesie oveľa vyššiu výpočtovú hustotu, radikálne nižšiu spotrebu energie a inteligentnejšie využitie plochy samotného procesora.
Podľa oficiálnej technickej dokumentácie (whitepaperu) dokáže ACE pri rovnakom objeme vstupných dát vykonať až 16-krát viac operácií než dnešné inštrukcie AVX10. Hoci to v reálnom svete automaticky neznamená čisté 16-násobné zrýchlenie aplikácií, ukazuje to gigantický potenciál pre budúce generácie procesorov. Hardvér navyše uľaví aj operačnej pamäti, keďže výrazne znižuje nároky na jej celkovú priepustnosť.
Jeden kód vládne všetkým: Koniec fragmentácie
Pre softvérových vývojárov je kľúčové sformovanie jednotného prostredia. Intel a AMD chcú docieliť, aby celosvetovo populárne frameworky ako PyTorch či TensorFlow využívali jednu spoločnú, štandardizovanú cestu. Programátori tak už nebudú musieť písať iné optimalizácie pre procesory Intel a iné pre čipy AMD. ACE natívne podporuje pestrú paletu dátových formátov využívaných v AI (vrátane INT8, FP4, FP6, FP8, FP16, BF16 či FP32) a po novom implementuje aj formáty z projektu Open Compute Project.
Táto spolupráca nie je žiadny náhodný výstrel do tmy. Obe firmy sa nedávno združili v iniciatíve x86 Ecosystem Advisory Group, kde sa spoločne snažia udržať architektúru x86 na vrchole a zabrániť fragmentácii platformy pred dravým nástupom konkurenčnej architektúry ARM.
Do budúcna tak chystajú aj ďalšie spoločné technológie. Patrí sem napríklad APX, ktoré rozširuje počet registrov v procesore, bezpečnostný štít ChkTag na kontrolu prístupu k pamäti či FRED (Flexible Return and Event Delivery) – mechanizmus, ktorý kompletne modernizuje spôsob, akým procesor spracováva hardvérové prerušenia a výnimky. Pre koncového používateľa to znamená jediné: stabilnejšie, bezpečnejšie a hlavne brutálne rýchlejšie počítače bez ohľadu na to, či vám pod kapotou tiká srdce od Intelu alebo AMD.
Zdroj: x87 EAG,Toms Hardware



