به گزارش ساوت چاینا مورنینگ پست، واحد رایانش ابری علیبابا از خانوادهQwen3 رونمایی کرد؛ مجموعهای شامل هشت مدل تقویتشده که از ۶۰۰ میلیون تا ۲۳۵ میلیارد پارامتر دارند. در یادگیری ماشین، پارامترها متغیرهایی هستند که در حین آموزش مدل برای تعیین چگونگی پاسخدهی آن به دادهها به کار میروند.
مدلهای جدید علیبابا نشان میدهند که شرکتهای چینی توانستهاند فاصله خود با رقبای آمریکایی را به شکل چشمگیری کاهش دهند و با وجود محدودیتهای صادراتی آمریکا در زمینه نیمهرساناهای پیشرفته، روند نوآوری در چین همچنان ادامه خواهد داشت.
تأثیر تحریمهای آمریکا بر تلاشهای توسعه هوش مصنوعی چین نسبت به سالهای قبل کاهش یافته است، چراکه تأمین تراشههای جایگزین داخلی، مانند محصولات شرکتهای هواوی و Cambricon، افزایش یافته است.
عرضه جدید علیبابا نشاندهنده موقعیت کنونی Qwen بهعنوان بزرگترین اکوسیستم هوش مصنوعی متنباز در جهان است که حتی از جامعه Llama متعلق به شرکت متا (مالک فیسبوک) نیز فراتر رفته است.
متنباز بودن به معنای در دسترس بودن کد منبع برنامه برای عموم است که امکان ویرایش، توسعه، یا اشتراکگذاری آن توسط توسعهدهندگان ثالث را فراهم میسازد. فناوریهای متنباز طی دهههای اخیر سهم چشمگیری در رشد صنعت فناوری چین داشتهاند.
خانواده مدل Qwen3 در پلتفرمهای متنباز از جمله GitHub متعلق به مایکروسافت، Hugging Face و سرویس مدلیابی علیبابا به نام ModelScope در دسترس قرار گرفتهاند. این مدل همچنین بهعنوان مدل پیشفرض در ربات چت اینترنتی Qwen نیز یکپارچه شده است.
مدلQwen3 بهسرعت به محبوبترین خانواده مدلهای هوش مصنوعی در پلتفرمهایی مانند Hugging Face تبدیل شده، زیرا ترکیبی از توانایی استدلال، پاسخدهی سریع و هزینه بهرهبرداری پایین را ارائه میدهد.
خانواده Qwen بهترین، جامعترین و پرکاربردترین مدل متنباز جهان است. تقریباً کل بازار بر سر این موضوع اتفاق نظر دارند.
به گفته علیبابا، مدل Qwen3-235B که بزرگترین عضو این خانواده محسوب میشود، در حوزههایی مانند درک زبان، دانش تخصصی، ریاضی و مهارتهای برنامهنویسی، عملکردی فراتر از مدلهای o3-mini و o1 شرکت OpenAI و مدل R1 شرکت دیپسیک داشته است.
چین احتمالاً در آینده به سطح آمریکا در زمینه قابلیتهای مدلهای هوش مصنوعی خواهد رسید که این موضوع میتواند نگرانیهایی در مورد از دست رفتن برتری فناوری ایالات متحده ایجاد کند.
با این حال، آمریکا همچنان مالک تراشههای هوش مصنوعی پیشرفتهتری است، زیرا کنترلهای صادراتی سختتری را اعمال کرده است.
در همین حال، تأمینکنندگان تراشه هوش مصنوعی از شرکت انویدیا گرفته تا AMD، بهسرعت پشتیبانی از Qwen3 را آغاز کردهاند. شرکت Biren Technology، استارتاپ مستقر در شانگهای، اعلام کرد که محصولاتش تنها ظرف چند ساعت پس از معرفی رسمی علیبابا، از مدلهای Qwen3 پشتیبانی کردهاند.
وضعیت فعلی توسعه مدلهای هوش مصنوعی در چین نسبت به زمانی که OpenAI برای نخستین بار ChatGPT را در نوامبر ۲۰۲۲ معرفی کرد، تفاوت چشمگیری دارد.
پس از عرضه متوالی مدلهای V3 و R1 از سوی دیپسیک در دسامبر و ژانویه، چندین شرکت چینی از جمله غولهای فناوری بایدو، بایتدنس، تنسنت و استارتاپهایی مانند Moonshot و MiniMax موفق به توسعه مدلهایی در سطح «مرزی» یا Frontier-level شدهاند.
بهجز چین و آمریکا، هیچ کشور دیگری نتوانسته مدلهایی با این سطح از پیشرفت را آموزش دهد.
مهندسان چینی پیشرفتهای چشمگیری در بهینهسازی دادهها و الگوریتمها داشتهاند؛ بهگونهای که مدلهای آنها از نظر کیفیت، قابل مقایسه با نمونههای آمریکایی هستند.
منبع: scmp