شرکت Tenstorrent به رهبری جیم کلر، نسل بعدی پردازنده Wormhole خود را برای حجم کاری هوش مصنوعی عرضه کرده است که انتظار میرود عملکرد خوبی را با قیمتی مقرون به صرفه ارائه دهد.این شرکت در حال حاضر دو کارت PCIe اضافی ارائه میدهد که میتوانند یک یا دو پردازنده Wormhole را در خود جای دهند، و همچنین ایستگاههای کاری TT-LoudBox و TT-QuietBox را برای توسعهدهندگان نرمافزار ارائه میدهد. تمام اطلاعیههای امروز برای توسعهدهندگان است، نه کسانی که از بردهای Wormhole برای بارهای کاری تجاری استفاده میکنند.
جیم کلر، مدیرعامل Tenstorrent، گفت: «همیشه خوشحالکننده است که تعداد بیشتری از محصولات ما به دست توسعهدهندگان برسد. انتشار سیستمهای توسعه با استفاده از کارتهای Wormhole™ ما میتواند به توسعهدهندگان در مقیاسبندی و توسعه نرمافزار هوش مصنوعی چندتراشه کمک کند.»علاوه بر این رونمایی، ما از دیدن پیشرفتی که در زمینهی بیرون آوردن نوار و راهاندازی محصول نسل دوم خود، بلکهول، به دست آوردهایم، هیجانزدهایم.

هر پردازنده Wormhole شامل ۷۲ هسته Tensix (که پنج تای آنها از هستههای RISC-V در فرمتهای داده مختلف پشتیبانی میکنند) و ۱۰۸ مگابایت SRAM است که ۲۶۲ FP8 TFLOPS را در ۱ گیگاهرتز با توان طراحی حرارتی ۱۶۰ وات ارائه میدهد. کارت تک تراشهای Wormhole n150 به ۱۲ گیگابایت حافظه ویدیویی GDDR6 مجهز شده و پهنای باند ۲۸۸ گیگابایت بر ثانیه دارد.
پردازندههای Wormhole مقیاسپذیری انعطافپذیری را برای برآورده کردن نیازهای متنوع حجم کار فراهم میکنند. در یک ایستگاه کاری استاندارد با چهار کارت Wormhole n300، پردازندهها میتوانند در یک واحد واحد ترکیب شوند که در نرمافزار به عنوان یک شبکه هستهای Tensix یکپارچه و گسترده ظاهر میشود. این پیکربندی به شتابدهنده اجازه میدهد تا حجم کار یکسانی را مدیریت کند، بین چهار توسعهدهنده تقسیم شود یا حداکثر هشت مدل مختلف هوش مصنوعی را به طور همزمان اجرا کند. یکی از ویژگیهای کلیدی این مقیاسپذیری این است که میتواند بدون نیاز به مجازیسازی به صورت محلی اجرا شود. در یک محیط مرکز داده، پردازندههای Wormhole از PCIe برای گسترش در داخل دستگاه یا از اترنت برای گسترش خارجی استفاده میکنند.
از نظر عملکرد، کارت تک تراشهای Wormhole n150 شرکت Tenstorrent (با ۷۲ هسته Tensix، فرکانس ۱ گیگاهرتز، ۱۰۸ مگابایت SRAM، ۱۲ گیگابایت GDDR6، پهنای باند ۲۸۸ گیگابایت بر ثانیه) با توان ۱۶۰ وات به ۲۶۲ FP8 TFLOPS دست یافت، در حالی که برد دو تراشهای Wormhole n300 (با ۱۲۸ هسته Tensix، فرکانس ۱ گیگاهرتز، ۱۹۲ مگابایت SRAM، ۲۴ گیگابایت GDDR6، پهنای باند ۵۷۶ گیگابایت بر ثانیه) با توان ۳۰۰ وات تا ۴۶۶ FP8 TFLOPS ارائه میدهد.
برای اینکه مفهوم ۳۰۰ وات توان پردازشی معادل ۴۶۶ ترافلاپس FP8 را بهتر درک کنیم، آن را با آنچه انویدیا، رهبر بازار هوش مصنوعی، با این قدرت طراحی حرارتی ارائه میدهد، مقایسه خواهیم کرد. کارت گرافیک A100 انویدیا از FP8 پشتیبانی نمیکند، اما از INT8 پشتیبانی میکند و حداکثر عملکرد آن ۶۲۴ TOPS (۱۲۴۸ TOPS در حالت کممصرف) است. در مقایسه، کارت گرافیک H100 انویدیا از FP8 پشتیبانی میکند و در ۳۰۰ وات به حداکثر عملکرد ۱۶۷۰ TFLOPS (۳۳۴۱ TFLOPS در حالت کممصرف) میرسد که تفاوت قابل توجهی با Wormhole n300 شرکت Tenstorrent دارد.
با این حال، یک مشکل اساسی وجود دارد. کارت گرافیک Wormhole n150 شرکت Tenstorrent با قیمت ۹۹۹ دلار و کارت گرافیک n300 با قیمت ۱۳۹۹ دلار به فروش میرسد. در مقام مقایسه، یک کارت گرافیک Nvidia H100 بسته به تعداد، ۳۰ هزار دلار قیمت دارد. البته، ما نمیدانیم که آیا چهار یا هشت پردازنده Wormhole میتوانند عملکرد یک H300 را ارائه دهند یا خیر، اما توان حرارتی آنها به ترتیب ۶۰۰ و ۱۲۰۰ وات است.
علاوه بر کارتها، Tenstorrent ایستگاههای کاری از پیش ساخته شدهای را برای توسعهدهندگان ارائه میدهد، از جمله ۴ کارت n300 در TT-LoudBox مبتنی بر Xeon با قیمت مناسبتر و خنککننده فعال، و TT-QuietBox پیشرفته با عملکرد خنککننده مایع Xiaolong مبتنی بر EPYC.
زمان ارسال: ۲۹ ژوئیه ۲۰۲۴