
همکاری آمازون با آنتروپیک برای ارتقاء الکسا
مهر ۱۲, ۱۴۰۳
آغاز انقلاب بعدی ربات آمازون
مهر ۱۲, ۱۴۰۳Cerebras در مقابل Nvidia: ابزار جدید استنتاج وعده عملکرد بالاتر را میدهد
۱. معرفی: ابزار جدید استنتاج Cerebras برای رقابت با Nvidia
استارتاپ سختافزاری هوش مصنوعی Cerebras یک راهحل جدید برای استنتاج هوش مصنوعی ایجاد کرده که بهطور بالقوه میتواند با GPUهای Nvidia برای سازمانها رقابت کند.
۱.۱. ابزار استنتاج Cerebras و Wafer-Scale Engine
ابزار استنتاج Cerebras بر اساس Wafer-Scale Engine این شرکت ساخته شده و وعده ارائه عملکرد شگفتانگیزی را میدهد. به گفته منابع، این ابزار به سرعتهای ۱۸۰۰ توکن در ثانیه برای Llama 3.1 8B و ۴۵۰ توکن در ثانیه برای Llama 3.1 70B دست یافته است. Cerebras ادعا میکند که این سرعتها نهتنها سریعتر از محصولات ابری هیپراسکیل موردنیاز برای تولید این سیستمها توسط GPUهای Nvidia هستند، بلکه از نظر هزینه نیز کارآمدتر هستند.
۲. تغییر بزرگ در بازار هوش مصنوعی
این یک تغییر بزرگ است که به بازار هوش مصنوعی مولد وارد شده است. بهگفته تحلیلگر گارتنر، “آرون چاندراسکاران”، تمرکز این بازار که قبلاً بر آموزش بوده، اکنون بهدلیل رشد کاربردهای هوش مصنوعی در سازمانها، به سمت هزینه و سرعت استنتاج در حال حرکت است. این تغییر فرصت بزرگی را برای فروشندگان محصولات و خدمات هوش مصنوعی مانند Cerebras ایجاد میکند تا بر اساس عملکرد رقابت کنند.
۲.۱. عملکرد درخشان Cerebras در استنتاج
“میکا هیل اسمیت”، یکی از بنیانگذاران و مدیرعامل Artificial Analysis، میگوید که Cerebras در بنچمارکهای استنتاج هوش مصنوعی خود واقعاً درخشان عمل کرده است. این شرکت به سرعتهای بیش از ۱۸۰۰ توکن در ثانیه برای Llama 3.1 8B و بیش از ۴۴۶ توکن در ثانیه برای Llama 3.1 70B دست یافت و در هر دو بنچمارک رکوردهای جدیدی ثبت کرد.
Cerebras ابزار استنباط هوش مصنوعی را با سرعت 20 برابر با کسری از هزینه GPU معرفی می کند.
۳. چالشهای بازار سازمانی برای Cerebras
با وجود مزایای بالقوه عملکرد، Cerebras با چالشهای قابلتوجهی در بازار سازمانی روبروست. پشته نرمافزاری و سختافزاری Nvidia بر صنعت غالب است و بهطور گسترده توسط سازمانها پذیرفته شده است. “دیوید نیکلسون”، تحلیلگر Futurum Group، اشاره میکند که سیستم ویفر-مقیاس Cerebras میتواند عملکرد بالا را با هزینه کمتری نسبت به Nvidia ارائه دهد، اما سؤال کلیدی این است که آیا سازمانها مایل به تغییر فرایندهای مهندسی خود برای کار با سیستم Cerebras هستند یا خیر.
۴. رقابت و انتخاب بین Cerebras و Nvidia
انتخاب بین Nvidia و جایگزینهایی مانند Cerebras به عوامل مختلفی بستگی دارد، از جمله مقیاس عملیات و سرمایه موجود. شرکتهای کوچکتر احتمالاً Nvidia را انتخاب میکنند زیرا راهحلهای از پیش تثبیتشده ارائه میدهد. در عین حال، شرکتهای بزرگتر با سرمایه بیشتر ممکن است Cerebras را برای افزایش کارایی و صرفهجویی در هزینه انتخاب کنند.
۴.۱. رقابت سخت Cerebras با ارائهدهندگان ابر
Cerebras همچنین با رقابت از سوی ارائهدهندگان ابر اختصاصی، هیپراسکیلرها مانند مایکروسافت، AWS، و گوگل، و ارائهدهندگان استنتاج مانند Groq مواجه خواهد شد. تعادل بین عملکرد، هزینه، و سهولت پیادهسازی احتمالاً تصمیمات سازمانی را در پذیرش فناوریهای جدید استنتاج شکل میدهد.
۵. نتیجهگیری: آینده استنتاج هوش مصنوعی
ظهور استنتاج هوش مصنوعی با سرعت بالا که قادر به ارائه بیش از ۱۰۰۰ توکن در ثانیه است، معادل توسعه اینترنت پهنباند است و میتواند مرز جدیدی برای کاربردهای هوش مصنوعی باز کند. دقت ۱۶ بیتی و توانایی استنتاج سریعتر Cerebras ممکن است امکان ایجاد برنامههای هوش مصنوعی آینده را فراهم کند که در آن عوامل هوش مصنوعی باید سریع، پیوسته و بهصورت بلادرنگ عمل کنند.
بازار سختافزار استنتاج هوش مصنوعی در حال رشد است و حدود ۴۰٪ از کل بازار سختافزار هوش مصنوعی را به خود اختصاص میدهد. این بخش در حال تبدیل شدن به یک هدف سودآور در صنعت گستردهتر سختافزار هوش مصنوعی است. با توجه به اینکه شرکتهای بزرگتر بخش عمدهای از این بخش را اشغال کردهاند، بسیاری از تازهواردان باید با دقت جنبههای مهم این فضای رقابتی را در نظر بگیرند.