• امروز : پنج شنبه - ۱۵ آبان - ۱۴۰۴
  • برابر با : Thursday - 6 November - 2025
0

کاهش ۸۲ درصدی استفاده از  GPUهای انویدیا در چین با سیستم جدید اشتراک‌گذاری

  • کد خبر : 11680
  • ۱۵ آبان ۱۴۰۴ - ۹:۳۰
کاهش ۸۲ درصدی استفاده از  GPUهای انویدیا در چین با سیستم جدید اشتراک‌گذاری
شرکت علی‌بابا راهکاری برای اشتراک‌گذاری توان محاسباتی معرفی کرده که به گفته آن، باعث کاهش ۸۲ درصدی تعداد واحدهای پردازش گرافیکی (GPU) شرکت انویدیا موردنیاز برای پشتیبانی از مدل‌های هوش مصنوعی‌اش شده است.

به گزارش ساوت چاینا مورنینگ پست، این سیستم که Aegaeon نام دارد، بیش از سه ماه در بازار مدل‌های هوش مصنوعی علی‌باباکلاود به‌صورت آزمایشی اجرا شد و توانست تعداد  GPUهای انویدیا H20 مورد نیاز برای اجرای ده‌ها مدل تا سقف ۷۲ میلیارد پارامتر را از ۱۱۹۲ عدد به تنها ۲۱۳ عدد کاهش دهد.

ارائه‌دهندگان خدمات ابری مانند علی‌باباکلاود و Volcano Engine  (متعلق به بایت‌دنس) هم‌زمان هزاران مدل هوش مصنوعی را برای کاربران اجرا می‌کنند؛ به این معنا که تماس‌های API متعددی به‌صورت هم‌زمان پردازش می‌شوند. با این حال، تنها تعداد محدودی از مدل‌ها مانندQwen  (مدل اختصاصی علی‌بابا) و دیپ‌سیک بیشترین سهم را از درخواست‌های استنتاج (inference) دارند، در حالی که سایر مدل‌ها تنها به‌صورت پراکنده فراخوانی می‌شوند.

پژوهشگران دریافتند که در بازار مدل علی‌بابا کلاود، ۱۷.۷ درصد از  GPUها تنها برای پاسخ‌گویی به ۱.۳۵ درصد از درخواست‌ها اختصاص یافته‌اند، که بیانگر ناکارآمدی شدید در تخصیص منابع است.

در سطح جهانی نیز، پژوهش‌های مختلفی با هدف افزایش کارایی از طریق تجمیع توان  GPUها صورت گرفته است تا هر GPU بتواند به‌طور هم‌زمان چندین مدل را سرویس دهد.

در چارچوب Aegaeon، پژوهشگران سیستمی طراحی کردند که مقیاس‌گذاری خودکار در سطح توکن (token-level auto-scaling)  انجام می‌دهد؛ به این معنا که یک GPU می‌تواند در حین تولید توکن‌ها بین مدل‌های مختلف جابه‌جا شود.

این راهکار باعث شد هر GPU بتواند تا ۷ مدل را پشتیبانی کند (در مقایسه با حداکثر ۲ تا ۳ مدل در سامانه‌های دیگر) و در عین حال تأخیر (latency) ناشی از جابه‌جایی بین مدل‌ها را تا ۹۷ درصد کاهش دهد.

علی‌بابا کلاود اعلام کرد این راهکار هم‌اکنون در بازار مدل‌هایش موسوم به Bailian پیاده‌سازی شده است؛ بازاری که مدل‌های اختصاصی Qwen شرکت را برای کاربران سازمانی ارائه می‌دهد.

مدل GPU انویدیا H20 تراشه‌ای است که توسط غول تراشه‌سازی آمریکایی برای بازار چین و با هدف انجام استنتاج مدل‌های هوش مصنوعی طراحی شده بود؛ این تراشه پاسخی به محدودیت‌های صادراتی دولت بایدن محسوب می‌شود.

با این حال، اخیراً مقام‌های نظارتی چین این تراشه را به دلیل شائبه وجود «در پشتی» امنیتی (security backdoor)  مورد بررسی قرار داده‌اند.

در همین حال، شرکت‌های بزرگ چینی مانند هوآوی و کمبریکن تلاش‌های خود را برای توسعه GPUهای بومی در راستای راهبرد خودکفایی فناورانه پکن افزایش داده‌اند.

جنسن هوانگ، بنیان‌گذار و مدیرعامل انویدیا به تازگی گفت که سهم این شرکت در بازار تراشه‌های پیشرفته چین به «صفر» رسیده است.

منبع: scmp

لینک کوتاه : https://techchina.ir/?p=11680

ثبت دیدگاه

قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.