به گزارش ساوت چاینا مورنینگ پست، شرکت Shanghai Goku Technologies که در سال ۲۰۱۵ تأسیس شده، مقاله خود را به کنفرانس پردازش عصبی اطلاعات (NeurIPS) ارائه کرده است؛ گردهمایی سالانهای که از آن با عنوان «المپیک هوش مصنوعی» یاد میشود و محققان برجسته حوزه یادگیری ماشین و هوش مصنوعی در آن حضور دارند.
در این مقاله، Goku محدودیتهای روشهای مرسوم آموزش مدلهای هوش مصنوعی از جمله تنظیم دقیق نظارتشده (SFT) و یادگیری تقویتی (RL) را مورد بررسی قرار داده و چارچوبی جدید تحت عنوان چارچوب آموزش ترکیبی تطبیقی گامبهگام (SASR) معرفی کرده است. این روش از نحوه رشد تدریجی تواناییهای استدلال در انسانها الهام گرفته شده است.
روشهای SFT و RL از تکنیکهای کلیدی هستند که شرکتهایی مانند OpenAI (با حمایت مایکروسافت) و دیپسیک از آنها برای آموزش مدلهای خود بهره میبرند. دیپسیک پیشتر نقش مؤثر این دو روش را در ارتقاء عملکرد مدل V3 خود، مورد تأکید قرار داده بود.
نتایج آزمایشگاهی نشان میدهند که SASR عملکردی بهتر از روشهای SFT، RL وآموزش ترکیبی ایستا دارد.
این دستاورد در حوزه آموزش مدلهای هوش مصنوعی، نشاندهنده پیشرفت مستمر چین در این حوزه و ناتوانی سیاستهای سختگیرانه آمریکا در مهار این پیشرفت از طریق محدودیتهای سختافزاری است.
چین دارای ۵۰ درصد از توسعهدهندگان هوش مصنوعی در جهان است. بهویژه دیپسیک که توانسته توجهات بسیاری را جلب کند و نشان دهد که چین میتواند با تکیه بر پیشرفتهای الگوریتمی و ادغام بهینه سختافزار و نرمافزار، به رهبری جهانی در هوش مصنوعی دست یابد.
شرکت Goku تا پایان سال گذشته بیش از ۱۵ میلیارد یوان (۲.۱ میلیارد دلار) دارایی در بازارهای داخلی و بینالمللی مدیریت میکرد و از استراتژیهای مبتنی بر هوش مصنوعی برای این منظور بهره میگرفت.
منبع: scmp