• امروز : دوشنبه - ۲۳ تیر - ۱۴۰۴
  • برابر با : Monday - 14 July - 2025
1

بنیان‌گذار «دیپ‌سیک» و تهدیدی برای سلطه آمریکا در رقابت هوش مصنوعی

  • کد خبر : 10582
  • ۲۳ تیر ۱۴۰۴ - ۸:۰۰
بنیان‌گذار «دیپ‌سیک» و تهدیدی برای سلطه آمریکا در رقابت هوش مصنوعی
لیانگ وِن‌فِنگ با هیکل لاغر و سبک رفتاری محتاط، در جلسات ممکن است خجالتی یا حتی عصبی به‌نظر برسد؛ اما بنیان‌گذار استارتاپ چینی دیپ‌سیک، شرکتی که اخیراً دنیای هوش مصنوعی را دگرگون کرده، اغلب پس از سکوت‌های طولانی، سوالاتی دقیق و دشوار درباره معماری مدل، هزینه محاسبات و دیگر جزئیات فنی سیستم‌های هوش مصنوعی شرکتش مطرح می‌کند.

به گزارش بلومبرگ، کارمندان، لیانگ را «لائوبان» (lǎo bǎn، به معنی رئیس) صدا می‌زنند، عنوانی رایج برای ابراز احترام در فضای کاری چین. چیزی که در مورد او غیرمعمول است، این است که به محققان جوان و حتی کارآموزان اجازه می‌دهد پروژه‌های تجربی بزرگ را برعهده بگیرند. او اغلب به‌صورت غیررسمی به میز آن‌ها سر می‌زند، آخرین تحولات را جویا می‌شود و آن‌ها را به انتخاب مسیرهای مهندسی غیرمتعارف ترغیب می‌کند. هرچه بحث فنی‌تر باشد، برای او جذاب‌تر است – مخصوصاً اگر به بهبود عملکرد واقعی منجر شود.

شهرت جهانی دیپ‌سیک و لیانگ، در ژانویه و با انتشار مدل R1 به‌طور ناگهانی افزایش یافت؛ مدلی که مانند یک انفجار علمی به‌نظر می‌رسید. R1 در چندین آزمون استاندارد سنجش عملکرد مدل‌های هوش مصنوعی، از رقبای غربی پیشی گرفت – و این در حالی بود که دیپ‌سیک مدعی شد مدل پایه خود را با تنها ۵٪ از هزینه تخمینی GPT-4، مدلی که پشتوانه ChatGPT شرکت OpenAI است، ساخته است.

این نتایج شوک‌آور منجر به افت یک تریلیون دلاری در بازارهای آمریکا شد و سوالات جدی درباره استراتژی ایالات متحده برای مهار پیشرفت هوش مصنوعی چین از طریق کنترل صادرات برانگیخت. شرکت‌هایی مانند آمازون و مایکروسافت به‌سرعت مدل‌های دیپ‌سیک را به خدمات ابری خود اضافه کردند.

پیش از ظهور دیپ‌سیک، بسیاری از شرکت‌ها و سیاست‌گذاران آمریکایی با آرامش خاطر باور داشتند که چین هنوز با فاصله‌ای قابل‌توجه عقب‌تر از سیلیکون‌ولی است و این فاصله فرصتی برای آماده‌سازی یا حتی جلوگیری از رسیدن چین به نقطه برابری فراهم می‌کند؛ اما دیپ‌سیک با R1 ثابت کرد که تهدید چین دیگر نه فرضی، بلکه بسیار واقعی و بالفعل است.

در واقع، هانگژو، جایی که شرکت دیپ‌سیک مستقر است و دیگر مراکز فناوری پیشرفته چین، این روزها از اژدهایان کوچک هوش مصنوعی – اصطلاحی رایج برای استارتاپ‌های هوش مصنوعی – لبریز شده‌اند. چت‌بات‌های پیشرفته‌ای که توسط استارتاپ‌های بومی مانندMiniMax  وMoonshot AI  توسعه یافته‌اند، حتی در ایالات متحده به‌سرعت در حال محبوب شدن هستند.

گروه علی‌بابا نیز با خانواده مدل‌های زبانی خود به نام Qwen، موفق شده به‌طور مداوم در صدر رتبه‌بندی‌های معتبر مدل‌های زبانی بزرگ (LLMها) قرار گیرد.

در همین حال، مدیرعامل بیدو، با افتخار اعلام کرد که این غول جست‌وجوی چینی می‌تواند مدل‌هایی با کیفیت مشابه دیپ‌سیک توسعه دهد، اما با هزینه‌ای حتی کمتر، آن‌هم به لطف ابررایانه جدیدی که با تراشه‌های ساخت داخل مونتاژ شده است.

هوآوی نیز با محصولات سخت‌افزاری خود که برای رقابت با تجهیزات شرکت آمریکایی انویدیا طراحی شده‌اند، تحسین‌های فراوانی را دریافت کرده است. باید توجه داشت که واحدهای پردازش گرافیکی (GPU) انویدیا، پشتوانه اصلی پیشرفته‌ترین مدل‌های هوش مصنوعی در آمریکا و اروپاست.

این روند نشان می‌دهد که چین نه تنها در عرصه نرم‌افزار و الگوریتم‌های هوش مصنوعی، بلکه در زیرساخت‌های سخت‌افزاری نیز به‌سرعت در حال پیشرفت و مستقل شدن است. رقابت با غرب دیگر صرفاً در سطح تقلید نیست، بلکه به‌طور فزاینده‌ای به نوآوری، بومی‌سازی و صرفه‌جویی در مقیاس تبدیل شده است.

زمان چندانی از محدود کردن بخش فناوری داخلی از سوی حزب کمونیست نگذشته بود. تحقیقات ضدانحصاری، بررسی‌های مربوط به انطباق با قوانین داده و محدودیت‌های جدید بر رسانه‌های اجتماعی، اقتصاد گیگ و بازی‌های آنلاین اعمال شد؛ چهره‌هایی مانند جک ما (هم‌بنیان‌گذار علی‌بابا) از دید عموم محو شدند؛ اما اکنون، حزب حاکم چین در واکنش به مداخلات خارجی، مشغول تقویت صنعت فناوری داخلی است. شی جین‌پینگ، رئیس‌جمهور چین، منابع کشورش را به سمت هوش مصنوعی و تراشه‌های نیمه‌رسانا بسیج کرده و خواستار ایجاد اکوسیستمی «مستقل، قابل‌کنترل و مبتنی بر همکاری» در حوزه سخت‌افزار و نرم‌افزار شده است.

جالب آنکه، یکی از عوامل مؤثر در پیشرفت‌های اخیر چین در هوش مصنوعی، محدودیت‌های ژئوپلیتیکی‌ای بوده‌اند که با هدف کند کردن حرکت چین اعمال شده‌اند. فاصله چین و آمریکا در حوزه هوش مصنوعی دیگر در مقیاس سال نیست، بلکه در حد چند ماه است.

اما در حالی که چین این پیشرفت‌ها را به‌عنوان نوآوری می‌بیند، بسیاری در آمریکا همچنان با بدگمانی به آن نگاه می‌کنند. کمیته‌ای دوحزبی در مجلس نمایندگان آمریکا در گزارشی ادعا کرد که شرکت دیپ‌سیک روابط قابل‌توجهی با دولت چین دارد، به‌طور غیرقانونی داده‌هایی از OpenAI دزدیده است و تهدیدی جدی برای امنیت ملی آمریکا محسوب می‌شود.

مقامات آمریکایی در حال تحقیق هستند تا ببینند آیا دیپ‌سیک از طریق شرکت‌های واسطه‌ای در سنگاپور تحریم‌های صادراتی را دور زده یا نه.

در واکنش، سفارت چین ادعاهای کمیته کنگره را «بی‌اساس» خواند. انویدیا نیز گفته است تراشه‌هایی که دیپ‌سیک استفاده کرده، مطابق مقررات صادراتی بوده‌اند و اعمال محدودیت‌های بیشتر ممکن است به نفع شرکت‌های چینی مانند هواوی تمام شود. اگر دیپ‌سیک مجبور شود از تراشه‌ها و خدمات ساخت چین استفاده کند، این موضوع باعث تقویت هواوی و دیگر تأمین‌کنندگان زیرساخت هوش مصنوعی خارجی می‌شود.

با این حال، دیپ‌سیک همچنان شرکتی مرموز باقی مانده است. این شرکت با وجود منبع‌باز کردن برخی از فناوری‌های خود، اطلاعاتی در مورد هزینه ساخت مدل‌ها، ترکیب تراشه‌ها یا منابع داده‌ای که استفاده کرده، ارائه نمی‌دهد.

لیانگ ون‌فنگ، بنیان‌گذار دیپ‌سیک، آن‌قدر گوشه‌گیر است که بعضی رهبران حوزه هوش مصنوعی چین به او لقب «دیوانه فنی» (Tech Madman) داده‌اند – لقبی که معمولاً برای کارآفرینان عجیب‌وغریب با جاه‌طلبی‌های عظیم به‌کار می‌رود. در ۱۰ ماه گذشته حتی یک مصاحبه مطبوعاتی هم انجام نداده و چهره‌اش تا مدت‌ها برای عموم ناشناخته بود تا اینکه عکسی از حضورش در جلسه‌ای با نخست‌وزیر چین، لی چیانگ، منتشر شد.

اما حتی کسانی که نگران دیپ‌سیک هستند نیز نمی‌توانند قدرت فنی آن را انکار کنند.

دیپ‌سیک از مدت‌ها پیش پیش‌بینی کرده بود که هوش مصنوعی‌اش ممکن است در خارج از چین نگرانی‌هایی برانگیزد. در یک ارائه‌ی آنلاین کم‌توجه‌شده در کنفرانس توسعه‌دهندگان انویدیا در مارس ۲۰۲۴، دِلی چن، پژوهشگر یادگیری عمیق در دیپ‌سیک، گفت که باید ارزش‌ها را از مدل‌های زبانی بزرگ  (LLM)ها جدا کرد و مطابق با جوامع مختلف، آن‌ها را تطبیق داد.

یافتن چنین راه‌حل‌های کارآمدی، از ابتدا بخشی از فرهنگ سازمانی دیپ‌سیک بوده است. لیانگ ون‌فِنگ و دوستانش در اواسط دهه ۲۰۰۰ در دانشگاه ژجیانگ به تحصیل در رشته‌هایی مانند یادگیری ماشین، پردازش سیگنال و مهندسی الکترونیک مشغول بودند و در همان زمان، برای سرگرمی (و البته پول)، برنامه‌هایی برای معاملات الگوریتمی در بازار بورس در دوران بحران مالی جهانی ساختند.

پس از فارغ‌التحصیلی، لیانگ به‌تنهایی به ساخت سیستم‌های معاملات کمی ادامه داد و ثروت قابل‌توجهی به دست آورد. سپس با چند نفر از همان دوستان دانشگاهی‌اش در هانگژو شرکتی به‌نامHigh-Flyer Quant  را در سال ۲۰۱۵ تأسیس کردند. در آگهی‌های استخدامی اولیه، شرکت ادعا می‌کرد توانسته استعدادهایی از گوگل و فیسبوک جذب کند.

همانند دیپ‌سیک، شرکت High-Flyer نیز حسی از رمز و راز را حفظ می‌کرد. در عین حال، شرکت نوعی شفافیت مبتنی بر عملکرد را پیش گرفت؛ هر هفته، نمودار عملکرد ۱۰ صندوق سرمایه‌گذاری اصلی خود را منتشر می‌کرد. پیش از آنکه در تابستان ۲۰۱۶ دسترسی به این داده‌ها فقط به سرمایه‌گذاران ثبت‌نام‌شده محدود شود، بازدهی سالانه آن‌ها به‌طور متوسط ۳۵ درصد بود.

با گذشت زمان، میلیاردها دلار وارد سبد سرمایه‌گذاری High-Flyer شد و تیم تحقیقاتی و سرمایه‌گذاری‌اش به بیش از ۱۰۰ نفر گسترش یافت. در سال ۲۰۱۹، لیانگ به‌طور جدی شروع به جذب نیرو برای یک بخش هوش مصنوعی کرد تا از مجموعه داده‌های عظیم برای شناسایی سهام کم‌ارزش، نوسانات ریز قیمتی در معاملات فرکانس بالا و روندهای کلان پنهان‌شده بهره بگیرد.

در آغاز همه‌گیری کووید-۱۹، او و تیمش یک سیستم رایانشی با عملکرد بالا (HPC) ساختند، متشکل از پردازنده‌های به‌هم‌پیوسته در قالب یک کلاستر. طبق اعلام شرکت، برای این کلاستر، ۱۰۰۰ عدد GPU مدل انویدیا  ۲۰۸۰Tiکه معمولاً گیمرها و طراحان سه‌بعدی از آن استفاده می‌کنندو ۱۰۰ عدد GPU سری Volta (V100)  تهیه شده بود.

البته این مدل‌های مالی با وجود پیشرفته بودن، از لحاظ ابعاد بسیار کوچک‌تر از مدل‌های عمومی‌ای بودند که شرکت‌های آمریکایی مانند OpenAI توسعه می‌دادند. لیانگ تصمیم گرفت ابررایانه‌ی بسیار بزرگ‌تری با استفاده از GPU های A100 انویدیا (جانشین ارتقاءیافته‌ی  V100) بسازد.

اختصاص صدها میلیون دلار به چنین زیرساختی برای یک شرکت معاملات کمی، شاید اغراق‌آمیز به‌نظر برسد، اما لیانگ به اندازه کافی از معاملات قبلی سود کرده بود که این هزینه برایش قابل‌تحمل باشد.

شرکت High Flyer که در آن زمان حدود ۱۴.۱ میلیارد دلار دارایی تحت مدیریت داشت، در نامه‌ای در دسامبر ۲۰۲۱ به سهام‌داران بابت مجموعه‌ای از بازده‌های ناامیدکننده عذرخواهی کرد. این شرکت افت عملکرد را به سیستم‌های هوش مصنوعی خود نسبت داد که به گفته‌اش انتخاب‌های هوشمندانه‌ای در بازار سهام انجام داده بودند اما در زمان‌بندی خروج از معاملات در بحبوحه نوسانات ناشی از پاندمی ناکام مانده بودند. با این حال، این شرکت تصمیم گرفت به معنای واقعی کلمه روی هوش مصنوعی «دو برابر» شرط ببندد: در ژانویه ۲۰۲۲، High Flyer  در شبکه‌های اجتماعی اعلام کرد که ۵٬۰۰۰ عدد از پردازنده‌های انویدیا A100 را جمع‌آوری کرده است که هر یک معمولاً ده‌ها هزار دلار قیمت دارند. در ماه مارس اعلام شد که این خوشه پردازشی به ۱۰٬۰۰۰ عدد افزایش یافته، تنها شش ماه پیش از آنکه شرکت انویدیا نسبت به تأثیرگذاری محدودیت‌های جدید ایالات متحده بر صادرات چنین تراشه‌هایی به چین هشدار دهد.

در بهار بعد، حدود پنج ماه پس از معرفی ChatGPT توسط OpenAI، او شرکت دیپ‌سیک را به‌عنوان یک آزمایشگاه تحقیقاتی مستقل راه‌اندازی کرد. در دفاتری جداگانه در هانگژو و پکن، دیگر تمرکز بر امور مالی نبود.

در طول سال ۲۰۲۳، آزمایشگاه دیپ‌سیک به سرعت برای ساخت دستیار کدنویسی هوش مصنوعی، چت‌بات دانشی عمومی و ابزار تبدیل متن به هنر سه‌بعدی تلاش می‌کرد. لیانگ مهندسانی را از High Flyer به این شرکت آورد و افراد بیشتری را از دفتر پکن شرکت مایکروسافت، شرکت‌های پیشرو فناوری در چین و دانشگاه‌ها جذب کرد. این شرکت به کارآموزان معادل روزانه ۱۴۰ دلار همراه با کمک‌هزینه مسکن ماهانه ۴۲۰ دلار پرداخت می‌کرد؛ رقمی سخاوتمندانه در چین اما حدود یک‌سوم درآمد کارآموزان شرکت‌های هوش مصنوعی در آمریکا و کسری ناچیز از درآمد مهندسان تمام‌وقت در سیلیکون‌ولی.

لیانگ روی رویکردی به نام «پراکندگی» (sparsity) تمرکز کرد که روشی برای آموزش و اجرای کارآمدتر مدل‌های زبانی بزرگ (LLMs) از طریق تقسیم آن‌ها به تخصص‌های جداگانه است. برای مثال، وقتی از نسخه اولیه ChatGPT سوالی می‌پرسیدی، کل «مغز» مدل زبانی فعال می‌شد تا بهترین پاسخ را ارائه دهد، چه سوال ساده‌ای مثل حاصل جمع ۲+۲ باشد یا طرز تهیه یک پای؛ اما یک مدل پراکنده با استفاده بهینه‌تری از منابع، به جای فعال‌سازی کامل، فقط «کارشناس»‌های مرتبط با موضوع سؤال را فعال می‌کرد.

رویکرد پراکنده می‌تواند صرفه‌جویی عظیمی در هزینه‌های محاسباتی ایجاد کند، اما بسیار پیچیده است. اگر یک پرسش توسط بخش‌های کافی از «مغز» پردازش نشود یا به بخش‌های اشتباه فرستاده شود، کیفیت پاسخ کاهش می‌یابد. (مثلاً بخش مربوط به ریاضیات می‌داند عدد π در فرمول چه کاربردی دارد، اما نمی‌داند در دستور تهیه پای از چه موادی استفاده می‌شود.) لیانگ پیشرفت‌هایی را در این زمینه از سوی گوگل و شرکت فرانسوی «میسترال» دید که در دسامبر ۲۰۲۳ مدلی پراکنده با ۸ کارشناس منتشر کرده بود؛ مدلی که در هر پرسش، دو کارشناس مرتبط با توجه به زمینه فعال می‌شدند. او تیم خود را برای طراحی مدل‌هایی با تعداد کارشناسان بیشتر ترغیب کرد، رویکردی که در کنار مزایای بالقوه، می‌تواند به افزایش «توهمات» (hallucinations) و پراکندگی دانش مدل منجر شود.

پیشرفت‌های بیشتری از پی آمد و هرکدام به‌صورت عمومی منتشر ‌شدند و به‌تدریج توجه رقبای چینی را بیشتر به خود جلب ‌کردند. سپس، در اواخر سال ۲۰۲۴، شرکت دیپ‌سیک مدل V3 را منتشر کرد؛ یک مدل هوش مصنوعی همه‌منظوره که حدود ۶۵ درصد بزرگ‌تر از مدل معادل شرکت Meta Platforms Inc. بود – مدلی که در آن زمان بزرگ‌ترین مدل متن‌باز LLM موجود به‌شمار می‌رفت؛ اما چیزی که واقعاً توجه مدیران اجرایی گوگل،OpenAI  و مایکروسافت را جلب کرد، مقاله تحقیقاتی مفصل مربوط به V3 بود که حدود یک ماه پیش از آنکه دیپ‌سیک با مدل استدلالی R1 وارد آگاهی عمومی گسترده‌تر شود، منتشر شد. یکی از آمارهای تکان‌دهنده در آن این بودکه اشاره کرد کل هزینه توسعه V3 تنها ۵.۶ میلیون دلار بوده است. احتمالاً این رقم صرفاً به مرحله نهایی آموزش مدل اشاره داشت – فرایند پالایش داده که نسخه‌های اولیه مدل را به محصول نهایی تبدیل می‌کند – اما بسیاری از افراد این مبلغ را بودجه‌ای باورنکردنی اندک برای کل پروژه تلقی کردند. برای مقایسه، آموزش تجمعی مدل‌های پیشرفته مرزی (frontier models) ممکن است بیش از ۱۰۰ میلیون دلار هزینه داشته باشد.

پیشرفت سریع دیپ‌سیک ناشی از این بود که لیانگ، باور عمیقی به فلسفه متن‌باز داشت. او معتقد بود که پنهان کردن تکنیک‌های اختصاصی و دریافت هزینه برای استفاده از مدل‌های قدرتمند – روشی که توسط آزمایشگاه‌های آمریکایی مانند OpenAI و گوگل دنبال می‌شود – بیشتر به منافع کوتاه‌مدت اولویت می‌دهد تا موفقیت پایدار. ارائه آزاد و تقریباً رایگان مدل‌ها به عموم، کارآمدترین راه برای تسریع پذیرش فناوری‌های دیپ‌سیک و تشویق استارتاپ‌ها و محققان به استفاده از آن بود. امید این بود که این روند، چرخه‌ای خودتقویت‌گر از مصرف محصول و بازخورد ایجاد کند.

در یک روز ابری آوریل در فرودگاه بین‌المللی شلوغ شیاوشان در هانگژو، بیلبوردهای دیجیتال که خدمات هوش مصنوعی شرکت‌های علی‌بابا، بایت‌دَنس و هواوی را تبلیغ می‌کنند، به استقبال مسافران می‌روند. رباتی انسان‌نما با موهای آبی، در داخل ترمینال مدرن، مسافران را با تکان دادن دست خوش‌آمد می‌گوید. در بیرون، یک استارتاپ خودران در حال آزمایش کامیون‌های کوچک خودران برای جابه‌جایی بار در محوطه فرودگاه است. با وجود تمام سر و صدایی که حول دیپ‌سیک وجود دارد، بسیاری از غربی‌ها فراموش می‌کنند که این شرکت تنها یکی از بسیاری از «اژدهایان هوش مصنوعی» است که در معادل‌های سیلیکون‌ولی متعدد چین در حال ظهورند.

در پشت‌صحنه همه این استارتاپ‌ها، دولت شی جین‌پینگ ایستاده است. شی در یکی از جلسات اخیر دفتر سیاسی حزب کمونیست گفت که هوش مصنوعی مولد  (generative AI)، رباتیک و سایر جاه‌طلبی‌های فناورانه، در خدمت یک دستور کار ملی قرار دارند که پیش از هر چیز به دنبال «خوداتکایی و خودتقویت‌گری» است.

و اژدهایان به این پیام گوش سپرده‌اند – و البته همه آن‌ها آن‌قدر هم «کوچک» نیستند. پردیس مرکزی گروه عظیم ۳۰۰ میلیارد دلاری علی‌بابا، مجموعه‌ای وسیع با دریاچه اختصاصی، در منطقه‌ای در حدود ۴۰ دقیقه‌ای غرب دریاچه غربی قرار دارد. این شرکت اخیراً وعده داده است که در سه سال آینده ۵۳ میلیارد دلار برای ساخت مراکز داده هوش مصنوعی اختصاص خواهد داد. همچنین گفته شده است که مدل‌های پرچمدار جدید آن با نامQwen3  از نظر عملکرد و بهره‌وری هزینه، با مدل‌های دیپ‌سیک رقابت می‌کنند. در خارج از چین، علی‌بابا معمولاً به‌عنوان یک شرکت تجارت الکترونیکی شناخته می‌شود، اما واحد هوش مصنوعی و رایانش ابری آن با سرعت بیشتری در حال رشد است و در سال ۲۰۲۲ به یک مرکز مستقل در حومه هانگژو منتقل شد.

ستاره‌های دنیای فناوری چین ظاهراً بار دیگر مورد لطف حزب کمونیست چین قرار گرفته‌اند و تازه‌واردانی مانند لیانگ نیز به آنان پیوسته‌اند در حالی که در ایالات متحده، از جذابیت رهبران فناوری کاسته شده است. در چین، احساس غرور ملی رو به افزایش است و این کشور مشتاق است نشان دهد می‌تواند بر موانع غربی غلبه کند. جرج چن، مدیر اجرایی مستقر در هنگ‌کنگ در شرکت مشاوره سیاست‌گذاری «آسیا گروپ»، می‌گوید مهندسان برتر چینی که پیش‌تر در شرکت‌هایی مانند اپل، گوگل، مایکروسافت و دیگر غول‌های فناوری آمریکا فعالیت داشته‌اند، به کشور بازمی‌گردند. بخشی از این بازگشت، نتیجه خصومت‌های دولت ترامپ است، اما در عین حال بسیاری از آن‌ها به دلیل این احساس که مرکز تحول فناوری در حال انتقال به شرق است، جذب چین می‌شوند. سیلیکون ولی دیگر برای استعدادهای چینی جذابیت سابق را ندارد.

کای‌فو لی، بنیان‌گذار یونیکورن چینی دیگری به‌نام ۰۱٫AI، پا را از این هم فراتر می‌گذارد. او که سابقه فعالیت در اپل، گوگل و مایکروسافت را دارد، می‌گوید نسل جدید مهندسان دیگر مسیر او را، یعنی فعالیت در شرکت‌های آمریکایی پیش از تأسیس استارتاپ در چین، دنبال نمی‌کنند. وی می‌گوید: «این مهندسان جوان هوش مصنوعی عمدتاً در داخل کشور پرورش یافته‌اند. موفقیت دیپ‌سیک، در کنار دیگر استارتاپ‌های نوظهور، الهام‌بخش بسیاری از استعدادهای جوان شده تا در نهضت هوش مصنوعی چین سهیم باشند.»

در حال حاضر هیچ شرکت فناوری در چین به اندازه دیپ‌سیک مایه غرور ملی نیست. گردشگران و اینفلوئنسرهای شبکه‌های اجتماعی نیز اغلب به دفتر مرکزی دیپ‌سیک که در مجتمعی چهار برجی مشرف به کانال بزرگ چین قرار دارد، سر می‌زنند.

لیانگ به‌ندرت با افراد بیرونی ملاقات می‌کند او دعوت‌نامه اجلاس تأثیرگذار هوش مصنوعی در پاریس را نپذیرفت — رویدادی که چهره‌هایی چون سم آلتمن از OpenAI، سوندار پیچای مدیرعامل گوگل و چندین نخست‌وزیر و رئیس‌جمهور در آن شرکت داشتند.

در حالی که چین از دیپ‌سیک تجلیل می‌کند، ایالات متحده با دیده تردید به آن می‌نگرد، گویی با موجودی ناشناس مواجه شده و حالا باید بررسی شود که آیا بی‌خطر است یا تهدیدناک. منتقدان، دیپ‌سیک را متهم می‌کنند که تحت کنترل حزب کمونیست چین است، داده‌های آموزشی را از شرکت‌های آمریکایی سرقت کرده و بخشی از یک کارزار جاسوسی یا عملیات روانی برای تضعیف سلطه سیلیکون‌ولی در هوش مصنوعی است.

با این حال، دیپ‌سیک خود را شرکتی نوپا و پرتلاش معرفی می‌کند. صرف این‌که صنعت هوش مصنوعی تا همین اواخر توجه چندانی به دیپ‌سیک نداشت، به معنای آن نیست که پشت‌پرده ماجرای مشکوکی جریان دارد.

نکته مهم در مورد دیپ‌سیک آن است که شرکت‌های چینی به طرز موثری توانسته‌اند محدودیت‌هایشان را به نقطه قوت بدل کنند. در چین ذهن‌های باهوش زیادی هستند که با منابع محاسباتی بسیار کمتر، نوآوری‌های فوق‌العاده‌ای خلق کرده‌اند.

اما هنوز هم درباره یکی از بخش‌های مهم داستان دیپ‌سیک اختلاف‌نظر وجود دارد اینکه این شرکت واقعاً چقدر برای ساخت مدل‌های خود هزینه کرده است. شرکت تحقیقاتی آمریکاییSemiAnalysis  برآورد کرده که شرکت‌های High-Flyer و دیپ‌سیک احتمالاً به خوشه‌هایی شامل حدود ۵۰٬۰۰۰ واحد GPU پیشرفته سری H  شرکت انویدیا دسترسی داشته‌اند که ارزش آن‌ها به ۱.۴ میلیارد دلار می‌رسد — زیرساختی که عمدتاً از دید عموم پنهان مانده است. به گفته این مؤسسه، بخش اعظم این زیرساخت شامل چیپ‌هایی بوده که ظاهراً با مقررات صادراتی ایالات متحده مطابقت داشته‌اند. (ایالات متحده فروش برخی چیپ‌های خاص انویدیا از جمله H20 و H800  را به چین مجاز دانسته بود، البته به شرطی که عملکرد آن‌ها با اصلاحاتی محدود شود تا با محدودیت‌های کاخ سفید هم‌خوانی داشته باشند.)

با این حال، این مؤسسه همچنین مدعی است که دیپ‌سیک به ۱۰٬۰۰۰ واحد GPU بسیار پیشرفته H100 نیز دسترسی داشته — چیپ‌هایی که فروش آن‌ها به چین توسط دولت آمریکا ممنوع شده بود.

آنچه جای تردید ندارد، این است که دیپ‌سیک بی‌تردید از دسترسی به مقیاس عظیم قدرت محاسباتی شرکت‌های فناوری آمریکایی استقبال خواهد کرد. به نظر می‌رسد این شرکت اطمینان دارد که می‌تواند استفاده مؤثرتری از این منابع در مقایسه با سیلیکون‌ولی داشته باشد.

اما دسترسی بیشتر به منابع، مشکلی است که متخصصان چینی قطعاً مایل به رویارویی با آن هستند.

منبع: bloomberg

لینک کوتاه : https://techchina.ir/?p=10582

ثبت دیدگاه

قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.