E ndjekur nga thashethemet prej muajsh, arkitektura e re NVIDIA Blackwell është shpallur më në fund nga vetë Jensen Huang dhe do të ndikojë ndjeshëm jo vetëm në tregun e Inteligjencës Artificiale, me çipat më të fuqishëm të ndërtuar ndonjëherë për këtë qëllim, por edhe atë lojë video, në sajë të opsionet e konsumatorit (le të jemi të qartë, thellësisht të ndryshëm në nivel strukturor) që do të lindin prej tij më vonë gjatë muajve.
Tre produkte për të dominuar tregun
Me rastin e GTC 2024, CEO me xhaketën e lëkurës zbuloi krijimet më të fundit të shtëpisë së tij, dy GPU dhe një “superçip” që kombinon një CPU Grace me dy GPU Blackwell në një platformë të vetme.
Ka tre emra që duhen mbajtur parasysh, përkatësisht B100, B200 dhe GB200, me dy të fundit që përfaqësojnë majën e piramidës së performancës së gjeneratës së re të çipave me ngjyrë jeshile.
Blackwell përfaqëson gjendjen e artit për përshpejtuesit e AI dhe i shtyn teknologjitë aktuale të prodhuesit tajvanez të çipave TSMC në kufirin për të arritur bukurinë e 208 miliardë transistorëve. GPU B200, në veçanti, do të jetë në fakt një përshpejtues i çipeve dhe do të shohë përballjen e dy makinerive për një GPU të vetme, të bashkuara nëpërmjet një lidhjeje 10TB/s NV-HBI çip-me-çip.
Siç sugjeron tipsteri i mirënjohur kopite7kimi, ky numër transistorësh u arrit falë nyjës “të porositur” TSMC 4NP mbi të cilën bazohet arkitektura Blackwell, e cila duhet të përfaqësojë vetëm një përsosje të nyjes 4N në 5 nanometra të përdorur tashmë në Ada Lovelace. por me një përmirësim 30% në densitet.
Efikasiteti i gjeneratës së re, pra, do të varet kryesisht nga faktorët arkitektonikë dhe jo nga ndryshimi i nyjës, vetitë e të cilit mund të kenë pasur vetëm një ndikim margjinal në krahasim me atë që tashmë është vërejtur me Hopper dhe Ada.
Pikërisht në krahasim me Hopper dhe, në veçanti, me H100, përfitimi më i madh në kalimin në një strukturë chiplet qëndron pikërisht në ndryshimin e ndjeshëm të ritmit midis 80 miliardë tranzistorëve “të vjetër” dhe 208, 104 aktual për çdo makineri. B200.
Sistemi me shumë çipa ju lejon gjithashtu të shkoni më tej në pjesën e përparme të memories: çdo die është e lidhur me katër module memorie 24 GB HBM3E, për një total prej 192 GB në një autobus 8192-bit.
NVIDIA nuk i shtjelloi shumë numrat, duke dhënë një pamje jo të plotë por jo më pak interesante të ofertës së gjeneratës së re për databazat/HPC. Opsionet që do të dalin në treg do të kenë një TDP prej 700W dhe 1000W (përkatësisht B100 dhe B200), duke marrë parasysh që H100 ndaloi në 700W.
Sa i përket performancës, vlerësimet e NVIDIA sugjerojnë se arkitektura e re do të jetë të paktën dy herë më e fuqishme se Hopper dhe tashmë ka klientë të kalibrit të Meta në derë, e cila pret çipat e parë deri në fund të 2024.
Në përgjithësi, Blackwell mund të godasë 20 petaflops në FP4 dhe 10 petaflops në FP8. Duke marrë parasysh që nuk është e mundur të operohet me saktësi FP4 në Hopper, tashmë në FP8 Blackwell ofron më shumë se dyfishin e performancës.
Bashkëpunëtor i këtij përmirësimi, përveç vetë arkitekturës, është edhe gjenerata e dytë e Transformer Engine, e cila shton mbështetjen 4-bit, duke rritur kapacitetin llogaritës dhe madhësinë e modeleve që mund të menaxhohen.
Në fund të fundit, do të jetë shumë interesante të shihet se si tregu do të pranojë mundësinë e operimit me saktësi kaq të ulët.
Discussion about this post