به گزارش ساوت چاینا مورنینگ پست، این نوع مدلهای پیشرفته هوش مصنوعی قبل از ارائه پاسخ، زمان بیشتری را صرف «تفکر و تعمق» میکنند.
علیبابا کلود که بازوی محاسبات ابری هلدینگ گروه علیبابا محسوب میشود، جدیدترین شرکتی است که نسخه اولیهای از مدل استدلالی خود با نام QwQ را ارائه کرد. این مدل شبیه به اوپنایآی او۱ است که در زمینه ریاضی، برنامهنویسی و بررسیهای علمی تخصص دارد و در ماه سپتامبر عرضه شده بود.
در بیانیه شرکت سازنده آمده که QwQ در دو آزمون ریاضی عملکردی بهتر از او۱ داشته و در حل مسئله و کدنویسی مشابه آن بوده است.
در هفتههای اخیر شرکتهای چینی مختلف از چند مدل استدلالی رونمایی کردند که نشاندهنده پیشرفت و تلاش آنها برای رسیدن به همتایان آمریکاییشان است.
اوپنایآی در زمان معرفی او۱ اعلام کرد که این مدل برای «اصلاح فرایند تفکر خود، امتحان کردن راهبردهای مختلف و تشخیص اشتباهاتش» آموزش دیده است تا بتواند در مقایسه با نسل قبلی هوش مصنوعی یعنی مدلهای مولد، وظایف پیچیدهتر را انجام دهد و مسائل سختتری را حل کند.
مونشات ایآی که تحت حمایت علیبابا و هلدینگ تنسنت قرار دارد جزء اولین شرکتهایی بود که به پیشرفتهای جدید اوپنایآی واکنش نشان داد و در اوایل اکتبر نسخه جدیدی از بات مکالمه کیمی (Kimi) با قابلیت استدلال مشابه او۱ و امکانات بیشتری برای جستجوی آنلاین را عرضه نمود.
وقتی از کیمی بهروزرسانی شده خواسته شد که بگوید طلا برای سرمایهگذاری بهتر است یا بیوایدی (غول خودروهای برقی چینی)، طی چند دقیقه مراحل مختلفی را برای جمعآوری دادههای قیمت سهام و طلا طی کرد و در نهایت پس از انجام محاسبات به جواب رسید.
دیگران، از جمله شرکت نوپای دیپسیک (DeepSeek)، آزمایشگاه هوش مصنوعی شانگهای (Shanghai AI Lab)، شرکت سازنده بازیهای ویدئویی کونلون تِک (که مالک مرورگر وب اپرا هم هست) و واحد بازرگانی بینالمللی علیبابا هم بهسرعت مدلهای استدلالی خود را ارائه کردند. عرضه تمام این مدلها ظرف مدت دو هفته و با فاصله تنها چند روز از یکدیگر صورت گرفت.
طبق اعلام دیپسیک، مدل آر۱ (r1) این شرکت در نیمی از شش آزمون ریاضی، برنامهنویسی و بررسیهای علمی بهتر از او۱ عمل کرده است.
آزمایشگاه هوش مصنوعی شانگهای نیز فرایندی پیشرفتهتر را برای هدایت روند حل مسئله در مدل خود، اینترنتینکر (InternThinker)، از طریق درک سوالات، رجوع به دانستههای قبلی، برنامهریزی و پیادهسازی وظایف، «خویشتناندیشی» (self-reflection) و خلاصهسازی نتایج طراحی نمود.
اما شرکت دیپلرنینگ.ایآی (DeepLearning.AI) که در زمینه آموزش هوش مصنوعی فعالیت دارد هشدار داده که زمان طولانیتر رسیدن به پاسخ ممکن است به این معنا باشد که چنین مدلهایی عملا برای کارهای روزمره مناسب نیستند، بهویژه آن که هزینههای بیشتری هم دارند.
این شرکت در پستی در وبگاه خود نوشته است مدلهای استدلالی که در مسائل ریاضی و علمی عملکرد خوبی دارند، کند و پرهزینه هستند.
منبع: scmp