شرکت تراشه Tenstorrent به رهبری جیم کلر نسل بعدی پردازنده Wormhole خود را برای بارهای کاری هوش مصنوعی منتشر کرده است که انتظار دارد عملکرد خوبی با قیمت مقرون به صرفه ارائه دهد.این شرکت در حال حاضر دو کارت PCIe اضافی را ارائه می دهد که می توانند یک یا دو پردازنده Wormhole و همچنین ایستگاه های کاری TT-LoudBox و TT-QuietBox را برای توسعه دهندگان نرم افزار در خود جای دهند. تمام اعلانهای امروز توسعهدهندگان را هدف قرار دادهاند، نه کسانی که از بردهای Wormhole برای بارهای کاری تجاری استفاده میکنند.
«همیشه باعث خوشحالی است که بیشتر محصولاتمان را در اختیار توسعه دهندگان قرار دهیم. جیم کلر، مدیر عامل Tenstorrent گفت: انتشار سیستمهای توسعه با استفاده از کارتهای Wormhole™ ما میتواند به توسعهدهندگان کمک کند نرمافزار هوش مصنوعی چند تراشهای را توسعه دهند.علاوه بر این راهاندازی، ما از دیدن پیشرفتهایی که با استفاده از نوار و روشنکردن محصول نسل دوم خود، Blackhole در حال انجام هستیم، هیجانزده هستیم.
هر پردازنده Wormhole شامل 72 هسته Tensix (پنج مورد از آنها از هسته های RISC-V در فرمت های مختلف داده پشتیبانی می کند) و 108 مگابایت SRAM، 262 FP8 TFLOPS در 1 گیگاهرتز با قدرت طراحی حرارتی 160 وات ارائه می دهد. کارت تک تراشه Wormhole n150 مجهز به حافظه تصویری 12 گیگابایتی GDDR6 و دارای پهنای باند 288 گیگابایت بر ثانیه است.
پردازندههای Wormhole مقیاسپذیری انعطافپذیری را برای پاسخگویی به نیازهای مختلف حجم کاری فراهم میکنند. در یک راه اندازی ایستگاه کاری استاندارد با چهار کارت Wormhole n300، پردازنده ها را می توان در یک واحد ترکیب کرد که در نرم افزار به عنوان یک شبکه هسته ای گسترده و یکپارچه Tensix ظاهر می شود. این پیکربندی به شتابدهنده اجازه میدهد تا حجم کاری یکسان را مدیریت کند، بین چهار توسعهدهنده تقسیم شود یا تا هشت مدل مختلف هوش مصنوعی را به طور همزمان اجرا کند. یکی از ویژگی های کلیدی این مقیاس پذیری این است که می تواند به صورت محلی بدون نیاز به مجازی سازی اجرا شود. در محیط مرکز داده، پردازندههای Wormhole از PCIe برای توسعه در داخل دستگاه یا اترنت برای توسعه خارجی استفاده میکنند.
از نظر عملکرد، کارت تکتراشه Wormhole n150 Tenstorrent (72 هسته Tensix، فرکانس 1 گیگاهرتز، 108 مگابایت SRAM، 12 گیگابایت GDDR6، 288 گیگابایت بر ثانیه پهنای باند) به 262 FP8 TFLOPS در 160WW30W دست یافت، در حالی که 160W. (128 هسته Tensix، فرکانس 1 گیگاهرتز، 192 مگابایت SRAM، 24 گیگابایت GDDR6 مجموع، 576 گیگابایت بر ثانیه پهنای باند) تا 466 FP8 TFLOPS در 300 وات ارائه می دهد.
برای قرار دادن 300 وات 466 FP8 TFLOPS، آن را با آنچه که انویدیا رهبر بازار هوش مصنوعی در این قدرت طراحی حرارتی ارائه میکند، مقایسه میکنیم. A100 انویدیا از FP8 پشتیبانی نمی کند، اما از INT8 با حداکثر عملکرد 624 TOPS (1248 TOPS در صورت پراکندگی) پشتیبانی می کند. در مقایسه، H100 انویدیا از FP8 پشتیبانی می کند و به حداکثر عملکرد 1670 TFLOPS در 300 وات (3341 TFLOPS در حالت پراکنده) می رسد که تفاوت قابل توجهی با Wormhole n300 Tenstorrent دارد.
با این حال، یک مشکل اساسی وجود دارد. Wormhole n150 Tenstorrent با قیمت 999 دلار به فروش می رسد در حالی که n300 با قیمت 1399 دلار به فروش می رسد. در مقایسه، یک کارت گرافیک Nvidia H100 بسته به مقدار، 30000 دلار به فروش می رسد. البته، ما نمی دانیم که آیا چهار یا هشت پردازنده Wormhole می توانند عملکرد یک H300 را ارائه دهند یا خیر، اما TDP آنها به ترتیب 600 وات و 1200 وات است.
علاوه بر کارت ها، Tenstorrent ایستگاه های کاری از پیش ساخته شده را برای توسعه دهندگان ارائه می دهد، از جمله 4 کارت n300 در TT-LoudBox مقرون به صرفه تر مبتنی بر Xeon با خنک کننده فعال، و TT-QuietBox پیشرفته با عملکرد خنک کننده مایع مبتنی بر EPYC Xiaolong).
زمان ارسال: ژوئیه-29-2024