به گزارش ساوت چاینا مورنینگ پست، Qwen2-72B-Instruct – پیشرفتهترین نسخه از خانواده Qwen مدلهای زبان بزرگ (LLM)، نسخه متن باز Tongyi Qianwen درست پس از GPT-4o OpenAI و کلود ۳٫۵ Anthropic قرار گرفت. ارزیابی مدلها بر اساس معیارهایی مانند محاسبات، استدلال منطقی، کدنویسی و درک متن و غیره ارزیانجام میشود.
پنج مدل چینی –علیبابا، استارتآپ Deepseek، سنس تایم، فروشنده گوشیهای هوشمند Oppo، و تلاش مشترک بین دانشگاه چینهوا و استارتآپ Zhipu AI – از GPT-4 Turbo، یکی از بهترین مدلهای OpenAI مایکروسافت، بهتر عمل کردند.
چین در نیمه اول سال پیشرفت چشمگیری در پیشرفت LLM های داخلی داشته است، به نظر میرسد شکاف بین مدلهای هوش مصنوعی چینی و ایالات متحده در حال کاهش است.
این رتبهبندی تنها چند هفته پس از آن صورت میگیرد که این مدل در رده بندی مدلهای منبع باز پلتفرم توسعهدهنده یادگیری ماشینی Hugging Face، با سه مدل Qwen در رتبهبندی ۱۰ مدل برتر قرار گرفت.
برنامه Hugging Face بهعنوان پلتفرمی برای مدلهای منبع باز، مدلهای منبع بسته را که اغلب در چنین آزمایشهایی هدایت میکنند، محک نمیزند. یک آزمایش جداگانه در این ماه توسط LMSYS – یک سازمان تحقیقاتی مدل هوش مصنوعی که توسط دانشگاه کالیفرنیا، برکلی پشتیبانی میشود – Qwen2-72B را در رتبه ۲۰ قرار داد و مدلهای منبع بسته از OpenAI، Anthropic و Google بیشتر ۱۰ جایگاه برتر را به خود اختصاص دادند.
شرکت OpenAI در اواخر سال ۲۰۲۲ با راه اندازی ChatGPT که در آن زمان بر اساس مدل GPT-3.5 آن بود، یک مسابقه تسلیحاتی هوش مصنوعی را آغاز کرد. محبوبیت این محصول باعث شد غولهای فناوری مانند گوگل و مایکروسافت تلاش کنند تا چتباتهای خود را منتشر کنند.
مدلهای بعدی OpenAI همچنان در صنعت پیشرو هستند، اگرچه اکثر مدلهای منبع بسته چینی در این مرحله از قابلیتهای GPT-3.5-Turbo پیشی گرفتهاند.
منبع: scmp