නඩු බැනරය

කර්මාන්ත පුවත්: Jim Keller විසින් නව RISC-V චිපයක් දියත් කර ඇත

කර්මාන්ත පුවත්: Jim Keller විසින් නව RISC-V චිපයක් දියත් කර ඇත

Jim Keller-ප්‍රමුඛ චිප් සමාගම Tenstorrent විසින් AI වැඩ බර සඳහා එහි ඊළඟ පරම්පරාවේ Wormhole ප්‍රොසෙසරය නිකුත් කර ඇති අතර, එය දැරිය හැකි මිලකට හොඳ කාර්ය සාධනයක් ලබා දීමට අපේක්ෂා කරයි.සමාගම දැනට වර්ම්හෝල් ප්‍රොසෙසර එකක් හෝ දෙකකට ඉඩ දිය හැකි අතිරේක PCIe කාඩ්පත් දෙකක් මෙන්ම මෘදුකාංග සංවර්ධකයින් සඳහා TT-LoudBox සහ TT-QuietBox වැඩපොළවල් ද පිරිනමයි. අද දින සියලුම නිවේදන ඉලක්ක කර ඇත්තේ සංවර්ධකයින් වෙත මිස වාණිජ වැඩ බර සඳහා Wormhole පුවරු භාවිතා කරන අය නොවේ.

“අපගේ නිෂ්පාදන වැඩි ප්‍රමාණයක් සංවර්ධකයින් අතට පත් කිරීම සැමවිටම සතුටට කරුණකි. අපගේ Wormhole™ කාඩ්පත් භාවිතයෙන් සංවර්ධන පද්ධති මුදා හැරීම මඟින් සංවර්ධකයින්ට බහු-චිප් AI මෘදුකාංගය පරිමාණය කිරීමට සහ සංවර්ධනය කිරීමට උපකාර කළ හැකිය,” Tenstorrent හි ප්‍රධාන විධායක නිලධාරී Jim Keller පැවසීය.මෙම දියත් කිරීමට අමතරව, අපගේ දෙවන පරම්පරාවේ නිෂ්පාදනයක් වන Blackhole හි ටේප් අවුට් සහ බලගැන්වීමෙන් අප ලබා ගන්නා ප්‍රගතිය දැකීමට අපි සතුටු වෙමු.

1

සෑම වර්ම්හෝල් ප්‍රොසෙසරයකම ටෙන්සික්ස් කෝර් 72ක් (ඒවායින් පහක් විවිධ දත්ත ආකෘතිවල RISC-V කෝර් සඳහා සහය දක්වයි) සහ 108 MB SRAM අඩංගු වන අතර, 160W තාප සැලසුම් බලයක් සමඟ 1 GHz ට 262 FP8 TFLOPS ලබා දෙයි. තනි චිප Wormhole n150 කාඩ්පත 12 GB GDDR6 වීඩියෝ මතකයකින් සමන්විත වන අතර 288 GB/s කලාප පළලක් ඇත.

වර්ම්හෝල් ප්‍රොසෙසරයන් විවිධ වැඩ බර අවශ්‍යතා සපුරාලීම සඳහා නම්‍යශීලී පරිමාණයක් සපයයි. Wormhole n300 කාඩ්පත් හතරක් සහිත සම්මත වැඩපොළ සැකසුමකදී, ප්‍රොසෙසර ඒකාබද්ධ, පුළුල් Tensix core ජාලයක් ලෙස මෘදුකාංගයේ දිස්වන තනි ඒකකයකට ඒකාබද්ධ කළ හැක. මෙම වින්‍යාසය ත්වරණකාරකයට එකම කාර්ය භාරය හැසිරවීමට, සංවර්ධකයින් හතර දෙනෙකු අතර බෙදීමට හෝ එකවර විවිධ AI මාදිලි අටක් දක්වා ධාවනය කිරීමට ඉඩ සලසයි. මෙම පරිමාණයේ ප්‍රධාන ලක්ෂණයක් වන්නේ එය අථත්‍යකරණයේ අවශ්‍යතාවයකින් තොරව දේශීයව ධාවනය කළ හැකි වීමයි. දත්ත මධ්‍යස්ථාන පරිසරයකදී, Wormhole ප්‍රොසෙසර යන්ත්‍රය තුළ ප්‍රසාරණය සඳහා PCIe හෝ බාහිර ප්‍රසාරණය සඳහා Ethernet භාවිතා කරයි.

කාර්ය සාධනය අනුව, Tenstorrent හි තනි-චිප් Wormhole n150 කාඩ්පත (ටෙන්සික්ස් කෝර් 72, 1 GHz සංඛ්‍යාතය, 108 MB SRAM, 12 GB GDDR6, 288 GB/s කලාප පළල) 262 FP8 TFLOPS ලබා ගත් අතර, 160W හෝ dual-chip30 පුවරුවේදී (128 Tensix cores, 1 GHz සංඛ්‍යාතය, 192 MB SRAM, සමස්ථ 24 GB GDDR6, 576 GB/s කලාප පළල) 466 FP8 TFLOPS දක්වා 300W දක්වා ලබා දෙයි.

466 FP8 TFLOPS හි 300W සන්දර්භය තුළට දැමීම සඳහා, අපි එය AI වෙළඳපල ප්‍රමුඛයා වන Nvidia මෙම තාප සැලසුම් බලයෙන් ලබා දෙන දේ සමඟ සංසන්දනය කරන්නෙමු. Nvidia හි A100 FP8 සඳහා සහය නොදක්වයි, නමුත් එය INT8 සඳහා සහය දක්වයි, උපරිම කාර්ය සාධනය 624 TOPS (විරල විට TOPS 1,248). සැසඳීමේදී, Nvidia හි H100 FP8 සඳහා සහය දක්වන අතර Tenstorrent's Wormhole n300 ට වඩා සැලකිය යුතු ලෙස වෙනස් වන 300W (විරල ලෙස TFLOPS 3,341) ට 1,670 TFLOPS උපරිම කාර්ය සාධනය කරා ළඟා වේ.

කෙසේ වෙතත්, එක් ප්රධාන ගැටළුවක් තිබේ. Tenstorrent's Wormhole n150 ඩොලර් 999 කට අලෙවි වන අතර n300 ඩොලර් 1,399 කට අලෙවි වේ. සැසඳීමේදී, තනි Nvidia H100 ග්‍රැෆික් කාඩ්පතක් ප්‍රමාණය මත පදනම්ව ඩොලර් 30,000 කට අලෙවි වේ. ඇත්ත වශයෙන්ම, Wormhole ප්‍රොසෙසර හතරකට හෝ අටකට තනි H300 එකක ක්‍රියාකාරීත්වය ලබා දිය හැකිද යන්න අපි නොදනිමු, නමුත් ඒවායේ TDP පිළිවෙළින් 600W සහ 1200W වේ.

කාඩ්පත් වලට අමතරව, Tenstorrent විසින් සංවර්ධකයින් සඳහා පෙර-සාදන ලද වැඩපොළවල් පිරිනමයි, සක්‍රීය සිසිලනය සහිත වඩාත් දැරිය හැකි Xeon මත පදනම් වූ TT-LoudBox කාඩ්පත් 4ක් සහ EPYC මත පදනම් වූ Xiaolong) ද්‍රව සිසිලන කාර්යය සහිත උසස් TT-QuietBox ඇතුළුව.


පසු කාලය: ජූලි-29-2024