• امروز : چهارشنبه - ۲۶ دی - ۱۴۰۳
  • برابر با : Wednesday - 15 January - 2025
0

رونمایی از چند مدل هوش مصنوعی «استدلالی» چینی

  • کد خبر : 9013
  • ۲۶ دی ۱۴۰۳ - ۸:۰۰
رونمایی از چند مدل هوش مصنوعی «استدلالی» چینی
شرکت‌های فناور چینی با شتاب فراوان مشغول رونمایی از مدل‌های استدلالی (reasoning models) هستند تا فاصله چین با آمریکا در این حوزه را کاهش دهند.

به گزارش ساوت چاینا مورنینگ پست، این نوع مدل‌های پیشرفته هوش مصنوعی قبل از ارائه پاسخ، زمان بیشتری را صرف «تفکر و تعمق» می‌کنند.

علی‌بابا کلود که بازوی محاسبات ابری هلدینگ گروه علی‌بابا محسوب می‌شود، جدیدترین شرکتی است که نسخه اولیه‌ای از مدل استدلالی خود با نام QwQ را ارائه کرد. این مدل شبیه به اوپن‌ای‌آی او۱ است که در زمینه ریاضی، برنامه‌نویسی و بررسی‌های علمی تخصص دارد و در ماه سپتامبر عرضه شده بود.

در بیانیه شرکت سازنده آمده که QwQ در دو آزمون ریاضی عملکردی بهتر از او۱ داشته و در حل مسئله و کدنویسی مشابه آن بوده است.

در هفته‌های اخیر شرکت‌های چینی مختلف از چند مدل استدلالی رونمایی کردند که نشان‌دهنده پیشرفت و تلاش آنها برای رسیدن به همتایان آمریکایی‌شان است.

اوپن‌ای‌آی در زمان معرفی او۱ اعلام کرد که این مدل برای «اصلاح فرایند تفکر خود، امتحان کردن راهبردهای مختلف و تشخیص اشتباهاتش» آموزش دیده است تا بتواند در مقایسه با نسل قبلی هوش مصنوعی یعنی مدل‌های مولد، وظایف پیچیده‌تر را انجام دهد و مسائل سخت‌تری را حل کند.

مون‌شات ای‌آی که تحت حمایت علی‌بابا و هلدینگ تنسنت قرار دارد جزء اولین شرکت‌هایی بود که به پیشرفت‌های جدید اوپن‌ای‌آی واکنش نشان داد و در اوایل اکتبر نسخه جدیدی از بات مکالمه کیمی (Kimi) با قابلیت استدلال مشابه او۱ و امکانات بیشتری برای جستجوی آنلاین را عرضه نمود.

وقتی از کیمی به‌روزرسانی شده خواسته شد که بگوید طلا برای سرمایه‌گذاری بهتر است یا بی‌وای‌دی (غول خودروهای برقی چینی)، طی چند دقیقه مراحل مختلفی را برای جمع‌آوری داده‌های قیمت سهام و طلا طی کرد و در نهایت پس از انجام محاسبات به جواب رسید.

دیگران، از جمله شرکت نوپای دیپ‌سیک (DeepSeek)، آزمایشگاه هوش مصنوعی شانگهای (Shanghai AI Lab)، شرکت سازنده بازی‌های ویدئویی کونلون تِک (که مالک مرورگر وب اپرا هم هست) و واحد بازرگانی بین‌المللی علی‌بابا هم به‌سرعت مدل‌های استدلالی خود را ارائه کردند. عرضه تمام این مدل‌ها ظرف مدت دو هفته و با فاصله تنها چند روز از یکدیگر صورت گرفت.

طبق اعلام دیپ‌سیک، مدل آر۱ (r1) این شرکت در نیمی از شش آزمون ریاضی، برنامه‌نویسی و بررسی‌های علمی بهتر از او۱ عمل کرده است.

آزمایشگاه هوش مصنوعی شانگهای نیز فرایندی پیشرفته‌تر را برای هدایت روند حل مسئله در مدل خود، اینترن‌تینکر (InternThinker)، از طریق درک سوالات، رجوع به دانسته‌های قبلی، برنامه‌ریزی و پیاده‌سازی وظایف، «خویشتن‌اندیشی» (self-reflection) و خلاصه‌سازی نتایج طراحی نمود.

اما شرکت دیپ‌لرنینگ.ای‌آی (DeepLearning.AI) که در زمینه آموزش هوش مصنوعی فعالیت دارد هشدار داده که زمان طولانی‌تر رسیدن به پاسخ ممکن است به این معنا باشد که چنین مدل‌هایی عملا برای کارهای روزمره مناسب نیستند، به‌ویژه آن که هزینه‌های بیشتری هم دارند.

این شرکت در پستی در وبگاه خود نوشته است مدل‌های استدلالی که در مسائل ریاضی و علمی عملکرد خوبی دارند، کند و پرهزینه هستند.

منبع:‌ scmp

لینک کوتاه : https://techchina.ir/?p=9013

ثبت دیدگاه

قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.