• امروز : شنبه - ۱۳ بهمن - ۱۴۰۳
  • برابر با : Saturday - 1 February - 2025
0

فناوری DeepSeek تغییر دهنده بازی در جنگ هوش مصنوعی آمریکا و چین

  • کد خبر : 9283
  • ۱۳ بهمن ۱۴۰۳ - ۸:۰۰
فناوری DeepSeek تغییر دهنده بازی در جنگ هوش مصنوعی آمریکا و چین
فناوری DeepSeek در آستانه سال نو قمری، موجی از شوک را در بازار فناوری جهانی ایجاد کرد و ارزش غول نیمه‌رسانا انویدیا و سایر شرکت‌های بزرگ که پیشرو صنعت هوش مصنوعی هستند را کاهش داد، زیرا این استارت‌آپ چینی به شاهکاری دست یافت که زمانی غیرممکن به نظر می‌رسید.

به گزارش ساوت چاینا مورنینگ پست، این شرکت مستقر در هانگژو در چند هفته گذشته دو مدل جدید هوش مصنوعی قدرتمند DeepSeek-V3 و DeepSeek-R1 را منتشر کرد که با کسری از هزینه و قدرت محاسباتی که شرکت‌های بزرگ فناوری برای ساخت مدل‌های زبان بزرگ (LLM) جمع‌آوری می‌کنند ساخته شده‌اند.

جامعه هوش مصنوعی در رسانه‌های اجتماعی از اینکه چگونه دو مدل متن‌باز DeepSeek با وجود محدودیت‌های شدید ایالات متحده در دسترسی چین به نیمه‌رساناهای پیشرفته و فناوری‌های مرتبط، از عملکرد محصولات رقیب در طیف وسیعی از آزمایش‌های معیار صنعت پیشی گرفتند یا با آنها مطابقت داشتند، تحسین کردند.

اما در روزهای اخیر  DeepSeek در صدر اخبار بود و چت ربات همنام آن، در میان برنامه‌های کاربردی رایگان در فروشگاه‌های App اپل در ایالات متحده و چین، جایگاه برتر را به خود اختصاص داد.

آنچه تاکنون در مورد این شرکت و دلایل قابل تشخیص موفقیت آن می دانیم در اینجا آمده است:

رهبری رویایی

لیانگ ونفنگ، بنیانگذار و مدیر اجرایی DeepSeek به ندرت با مردم صحبت می‌کند. اما در سال‌های ۲۰۲۳ و ۲۰۲۴، او دو مصاحبه با رسانه فناوری چینی ۳۶Kr انجام داد که در مورد چشم‌اندازش برای آموزش LLM، آینده هوش مصنوعی و فعالیت‌های شخصی او گزارش می‌داد.

هنگامی که DeepSeek را در ماه مه ۲۰۲۳ راه اندازی کرد، لیانگ گفت بر تحقیقات هوش عمومی مصنوعی (AGI) متمرکز شده است. او قصد داشت نتایج این تحقیق را برای همه باز کند تا این فناوری صرفاً در دست «گروه کوچکی از مردم و مشاغل» نباشد. وی گفت با ایجاد تیم DeepSeek به دنبال نیروهای جدید با علاقه مشابهی بوده است.

بحث AGI به نرم افزاری اطلاق می‌شود که هوش انسانی و توانایی خودآموزی دارد و وظایفی را انجام می‌دهد که لزوماً برای آنها آموزش ندیده است.

پس از راه اندازی DeepSeek-V2 در می ۲۰۲۴، لیانگ از اینکه شرکت‌های چینی تمایلی به انجام تحقیقات ندارند ابراز ناامیدی کرد. لیانگ گفت: چین باید یک مشارکت کننده {در نوآوری جهانی} باشد. وی خاطرنشان کرد نوآوری ناشی از کنجکاوی و میل به ایجاد است نه صرفا نیازهای تجاری.

او گفت که تیم DeepSeek تصمیم گرفت روی سخت‌ترین چیزها در این صنعت کار کند.

لیانگ در سال ۱۹۸۵ در جنوب استان گوانگدونگ متولد شد. پدرش معلم دبستان بود. در سال ۲۰۰۲، لیانگ برای تحصیل در مقطع کارشناسی و کارشناسی ارشد خود در رشته مهندسی اطلاعات در دانشگاه ژجیانگ به شرق رفت و در سال ۲۰۱۰ فارغ التحصیل شد. مهندسی اطلاعات به طور معمول شامل عناصر علوم کامپیوتر، مهندسی الکترونیک، علوم داده، امنیت اطلاعات، شبکه های مخابراتی و هوش مصنوعی است.

در آن دوره در دانشگاه، لیانگ علاقه خود را به استفاده از فناوری یادگیری ماشینی در تجارت توسعه داد. در سال ۲۰۱۵، لیانگ High-Flyer Quant را تأسیس کرد که از الگوریتم‌های یادگیری عمیق برای اجرای یکی از بزرگترین صندوق‌های تامینی در سرزمین اصلی چین، استفاده می‌کند.

در پایان سال ۲۰۱۷، تقریباً تمام عملیات‌های High-Flyer Quant مدل‌های مبتنی بر هوش مصنوعی را اجرا می‌کردند که باعث شد شرکت سخت‌افزار، نرم‌افزار و تیم‌های الگوریتم خود را گسترش دهد. تا سال ۲۰۱۹، مجموع دارایی‌های مدیریت صندوق تامینی از ۱۰ میلیارد یوان (۱٫۴ میلیارد دلار) فراتر رفت. در سال ۲۰۲۱، این مجموع برای مدت کوتاهی از ۱۰۰ میلیارد یوان بیشتر شد.

تیم نابغه جوان

تیم دانشمندان جوان DeepSeek تقریباً منحصراً از اتباع چینی از برخی از مدارس برتر این کشور مانند دانشگاه شینهوا و دانشگاه پکن تشکیل شده است. اگرچه DeepSeek عمدتاً فارغ التحصیلان تازه وارد از این مدارس را استخدام می‌کند، اما همچنین داوطلبان دکترا و متخصصان جوان هوش مصنوعی را با تنها چند سال تجربه نیز به کار می‌گیرد.

منابع مالی و محاسباتی

بر اساس اطلاعات پلتفرم ردیابی مشاغل چینی Tianyancha، کل سرمایه ثبت شده DeepSeek فقط ۱۰ میلیون یوان است. اما از منابع مالی و زیرساخت‌های فنی مدیریت صندوق تامینی High-Flyer Quant سود می‌برد.

در ژوئیه سال ۲۰۲۴، لیانگ اعلام کرد مشکل High-Flyer Quant مسائل مالی نیست، بلکه محدودیت‌های ایالات متحده در صادرات تراشه‌های پیشرفته به چین است. در می ۲۰۲۳، لیانگ بدون ذکر جزئیات فاش کرد که این شرکت بیش از ۱۰ هزار واحد پردازش گرافیکی را از انویدیا جمع آوری کرده است.

صندوق High-Flyer Quant در آوریل ۲۰۲۳ گفت تمرکز خود را برای ایجاد یک سازمان تحقیقاتی مستقل که به “کاوش در ماهیت AGI” اختصاص دارد تغییر می‌دهد و امیدوار است که اعضای تیم همفکر خود را استخدام کند.

لیانگ گفت DeepSeek هیچ برنامه‌ای برای افزایش بودجه خارجی در کوتاه مدت ندارد. این استراتژی کاملاً در تضاد با کاری است که دیگر شرکت‌های جوان چینی هوش مصنوعی انجام می‌دهند. به‌عنوان مثال، شش استارت‌آپ بزرگ LLM در چین – Zhipu AI، Moonshot AI، MiniMax، Baichuan AI، StepFun و ۰۱٫AI – طبق گزارش‌های رسانه‌های چینی، حداقل ۲۰ میلیارد یوان در سال ۲۰۲۴ از طریق نزدیک به ۱۲ دور تأمین مالی جذب کردند.

ذهنیت مدیریت استارت آپ

لیانگ پیش از این اعلام کرد DeepSeek هیچ محدودیتی از نظر استقرار منابع محاسباتی یا جذب استعداد ندارد زیرا این شرکت هیچ لایه داخلی یا بخش‌های دپارتمانی ندارد. برای یک شرکت جوان، به نظر می‌رسد که این یک مجموعه ایده آل برای پیگیری سریع یا پاسخگویی به آخرین پیشرفت‌های فناوری باشد.

به گفته لیانگ، آنچه DeepSeek انجام می‌دهد، تقسیم کار «طبیعی» در میان کارکنانش است.

منبع: scmp

لینک کوتاه : https://techchina.ir/?p=9283

ثبت دیدگاه

قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.