کاهش ۸۲ درصدی استفاده از GPUهای انویدیا در چین با سیستم جدید اشتراک‌گذاری

کد خبر : 11680
۱۵ آبان ۱۴۰۴ - ۹:۳۰

شرکت علی‌بابا راهکاری برای اشتراک‌گذاری توان محاسباتی معرفی کرده که به گفته آن، باعث کاهش ۸۲ درصدی تعداد واحدهای پردازش گرافیکی (GPU) شرکت انویدیا موردنیاز برای پشتیبانی از مدل‌های هوش مصنوعی‌اش شده است.

به گزارش ساوت چاینا مورنینگ پست، این سیستم که Aegaeon نام دارد، بیش از سه ماه در بازار مدل‌های هوش مصنوعی علی‌باباکلاود به‌صورت آزمایشی اجرا شد و توانست تعداد GPUهای انویدیا H20 مورد نیاز برای اجرای ده‌ها مدل تا سقف ۷۲ میلیارد پارامتر را از ۱۱۹۲ عدد به تنها ۲۱۳ عدد کاهش دهد.

ارائه‌دهندگان خدمات ابری مانند علی‌باباکلاود و Volcano Engine (متعلق به بایت‌دنس) هم‌زمان هزاران مدل هوش مصنوعی را برای کاربران اجرا می‌کنند؛ به این معنا که تماس‌های API متعددی به‌صورت هم‌زمان پردازش می‌شوند. با این حال، تنها تعداد محدودی از مدل‌ها مانندQwen (مدل اختصاصی علی‌بابا) و دیپ‌سیک بیشترین سهم را از درخواست‌های استنتاج (inference) دارند، در حالی که سایر مدل‌ها تنها به‌صورت پراکنده فراخوانی می‌شوند.

پژوهشگران دریافتند که در بازار مدل علی‌بابا کلاود، ۱۷.۷ درصد از GPUها تنها برای پاسخ‌گویی به ۱.۳۵ درصد از درخواست‌ها اختصاص یافته‌اند، که بیانگر ناکارآمدی شدید در تخصیص منابع است.

در سطح جهانی نیز، پژوهش‌های مختلفی با هدف افزایش کارایی از طریق تجمیع توان GPUها صورت گرفته است تا هر GPU بتواند به‌طور هم‌زمان چندین مدل را سرویس دهد.

در چارچوب Aegaeon، پژوهشگران سیستمی طراحی کردند که مقیاس‌گذاری خودکار در سطح توکن (token-level auto-scaling) انجام می‌دهد؛ به این معنا که یک GPU می‌تواند در حین تولید توکن‌ها بین مدل‌های مختلف جابه‌جا شود.

این راهکار باعث شد هر GPU بتواند تا ۷ مدل را پشتیبانی کند (در مقایسه با حداکثر ۲ تا ۳ مدل در سامانه‌های دیگر) و در عین حال تأخیر (latency) ناشی از جابه‌جایی بین مدل‌ها را تا ۹۷ درصد کاهش دهد.

علی‌بابا کلاود اعلام کرد این راهکار هم‌اکنون در بازار مدل‌هایش موسوم به Bailian پیاده‌سازی شده است؛ بازاری که مدل‌های اختصاصی Qwen شرکت را برای کاربران سازمانی ارائه می‌دهد.

مدل GPU انویدیا H20 تراشه‌ای است که توسط غول تراشه‌سازی آمریکایی برای بازار چین و با هدف انجام استنتاج مدل‌های هوش مصنوعی طراحی شده بود؛ این تراشه پاسخی به محدودیت‌های صادراتی دولت بایدن محسوب می‌شود.

با این حال، اخیراً مقام‌های نظارتی چین این تراشه را به دلیل شائبه وجود «در پشتی» امنیتی (security backdoor) مورد بررسی قرار داده‌اند.

در همین حال، شرکت‌های بزرگ چینی مانند هوآوی و کمبریکن تلاش‌های خود را برای توسعه GPUهای بومی در راستای راهبرد خودکفایی فناورانه پکن افزایش داده‌اند.

جنسن هوانگ، بنیان‌گذار و مدیرعامل انویدیا به تازگی گفت که سهم این شرکت در بازار تراشه‌های پیشرفته چین به «صفر» رسیده است.

منبع: scmp

لینک کوتاه : https://techchina.ir/?p=11680

اخبار مهم

کاهش ۸۲ درصدی استفاده از GPUهای انویدیا در چین با سیستم جدید اشتراک‌گذاری

برچسب ها

نوشته های مشابه

ثبت دیدگاه

جدیدترین اخبار

دانشمندان چینی موفق به ساخت حافظه کوانتومی با دسترسی دلخواه شدند

وزیر دفاع آمریکا برای چین خط و نشان کشید

فشار آمریکا به رژیم صهیونیستی برای کاهش روابط با چین

ترامپ: اگر بایدن رئیس‌جمهور شود، چین کشور ما را تصاحب خواهد کرد!

آمریکا ۲۴ شرکت چینی را تحریم کرد

زیردریایی چینی بر بستر گودال ماریانا نشست

آمریکا و چین بر اجرای فاز نخست توافق تجاری تاکید کردند

افزایش ۱۹/۱ درصدی تولید ربات‌های صنعتی در چین در سال ۲۰۲۰

هواپیمای جاسوسی آمریکا وارد منطقه پرواز ممنوع چین شد

بایدو با سرمایه ۲ میلیارد دلاری استارتاپ بیوتک تاسیس می‌کند

آمریکا یک محقق ناسا را به همکاری با چین متهم کرد

۱۳ کشور در شورای‌امنیت با مکانیسم‌ ماشه مخالفت کرده‌اند

شانگهای راهبرد صنایع نوآورانه در لینگانگ را معرفی کرد

هند: برای اقدام نظامی علیه چین آماده‌ایم

رابطه ایران و چین به همکاری استراتژیک ارتقا یافته است

اخبار مهم

برچسب ها

نوشته های مشابه

استقرار مدل هوش مصنوعی در منظومه چینی ۰۷ اسفند ۱۴۰۴ - ۹:۳۰

چرخش تسلا به سوی هوش مصنوعی و ترغیب خودروسازان چینی به گسترش فناوری‌ ۰۷ اسفند ۱۴۰۴ - ۹:۰۰

افتتاح نیروگاه خورشیدی فتوولتائیک ساخته‌شده توسط چین در تونس ۰۶ اسفند ۱۴۰۴ - ۹:۰۰

بزرگترین سازنده گوشی‌های موبایل چینی به مسابقه ارتباط ماهواره‌ای مستقیم پیوست ۰۶ اسفند ۱۴۰۴ - ۸:۳۰

قدرت و ویژگی‌های قابل مقایسه تراشه هوش مصنوعی علی‌بابا با انویدیا ۰۶ اسفند ۱۴۰۴ - ۸:۰۰

ثبت دیدگاه

جدیدترین اخبار