به گزارش ساوت چاینا مورنینگ پست، این شرکت مستقر در هانگژو در چند هفته گذشته دو مدل جدید هوش مصنوعی قدرتمند DeepSeek-V3 و DeepSeek-R1 را منتشر کرد که با کسری از هزینه و قدرت محاسباتی که شرکتهای بزرگ فناوری برای ساخت مدلهای زبان بزرگ (LLM) جمعآوری میکنند ساخته شدهاند.
جامعه هوش مصنوعی در رسانههای اجتماعی از اینکه چگونه دو مدل متنباز DeepSeek با وجود محدودیتهای شدید ایالات متحده در دسترسی چین به نیمهرساناهای پیشرفته و فناوریهای مرتبط، از عملکرد محصولات رقیب در طیف وسیعی از آزمایشهای معیار صنعت پیشی گرفتند یا با آنها مطابقت داشتند، تحسین کردند.
اما در روزهای اخیر DeepSeek در صدر اخبار بود و چت ربات همنام آن، در میان برنامههای کاربردی رایگان در فروشگاههای App اپل در ایالات متحده و چین، جایگاه برتر را به خود اختصاص داد.
آنچه تاکنون در مورد این شرکت و دلایل قابل تشخیص موفقیت آن می دانیم در اینجا آمده است:
رهبری رویایی
لیانگ ونفنگ، بنیانگذار و مدیر اجرایی DeepSeek به ندرت با مردم صحبت میکند. اما در سالهای ۲۰۲۳ و ۲۰۲۴، او دو مصاحبه با رسانه فناوری چینی ۳۶Kr انجام داد که در مورد چشماندازش برای آموزش LLM، آینده هوش مصنوعی و فعالیتهای شخصی او گزارش میداد.
هنگامی که DeepSeek را در ماه مه ۲۰۲۳ راه اندازی کرد، لیانگ گفت بر تحقیقات هوش عمومی مصنوعی (AGI) متمرکز شده است. او قصد داشت نتایج این تحقیق را برای همه باز کند تا این فناوری صرفاً در دست «گروه کوچکی از مردم و مشاغل» نباشد. وی گفت با ایجاد تیم DeepSeek به دنبال نیروهای جدید با علاقه مشابهی بوده است.
بحث AGI به نرم افزاری اطلاق میشود که هوش انسانی و توانایی خودآموزی دارد و وظایفی را انجام میدهد که لزوماً برای آنها آموزش ندیده است.
پس از راه اندازی DeepSeek-V2 در می ۲۰۲۴، لیانگ از اینکه شرکتهای چینی تمایلی به انجام تحقیقات ندارند ابراز ناامیدی کرد. لیانگ گفت: چین باید یک مشارکت کننده {در نوآوری جهانی} باشد. وی خاطرنشان کرد نوآوری ناشی از کنجکاوی و میل به ایجاد است نه صرفا نیازهای تجاری.
او گفت که تیم DeepSeek تصمیم گرفت روی سختترین چیزها در این صنعت کار کند.
لیانگ در سال ۱۹۸۵ در جنوب استان گوانگدونگ متولد شد. پدرش معلم دبستان بود. در سال ۲۰۰۲، لیانگ برای تحصیل در مقطع کارشناسی و کارشناسی ارشد خود در رشته مهندسی اطلاعات در دانشگاه ژجیانگ به شرق رفت و در سال ۲۰۱۰ فارغ التحصیل شد. مهندسی اطلاعات به طور معمول شامل عناصر علوم کامپیوتر، مهندسی الکترونیک، علوم داده، امنیت اطلاعات، شبکه های مخابراتی و هوش مصنوعی است.
در آن دوره در دانشگاه، لیانگ علاقه خود را به استفاده از فناوری یادگیری ماشینی در تجارت توسعه داد. در سال ۲۰۱۵، لیانگ High-Flyer Quant را تأسیس کرد که از الگوریتمهای یادگیری عمیق برای اجرای یکی از بزرگترین صندوقهای تامینی در سرزمین اصلی چین، استفاده میکند.
در پایان سال ۲۰۱۷، تقریباً تمام عملیاتهای High-Flyer Quant مدلهای مبتنی بر هوش مصنوعی را اجرا میکردند که باعث شد شرکت سختافزار، نرمافزار و تیمهای الگوریتم خود را گسترش دهد. تا سال ۲۰۱۹، مجموع داراییهای مدیریت صندوق تامینی از ۱۰ میلیارد یوان (۱٫۴ میلیارد دلار) فراتر رفت. در سال ۲۰۲۱، این مجموع برای مدت کوتاهی از ۱۰۰ میلیارد یوان بیشتر شد.
تیم نابغه جوان
تیم دانشمندان جوان DeepSeek تقریباً منحصراً از اتباع چینی از برخی از مدارس برتر این کشور مانند دانشگاه شینهوا و دانشگاه پکن تشکیل شده است. اگرچه DeepSeek عمدتاً فارغ التحصیلان تازه وارد از این مدارس را استخدام میکند، اما همچنین داوطلبان دکترا و متخصصان جوان هوش مصنوعی را با تنها چند سال تجربه نیز به کار میگیرد.
منابع مالی و محاسباتی
بر اساس اطلاعات پلتفرم ردیابی مشاغل چینی Tianyancha، کل سرمایه ثبت شده DeepSeek فقط ۱۰ میلیون یوان است. اما از منابع مالی و زیرساختهای فنی مدیریت صندوق تامینی High-Flyer Quant سود میبرد.
در ژوئیه سال ۲۰۲۴، لیانگ اعلام کرد مشکل High-Flyer Quant مسائل مالی نیست، بلکه محدودیتهای ایالات متحده در صادرات تراشههای پیشرفته به چین است. در می ۲۰۲۳، لیانگ بدون ذکر جزئیات فاش کرد که این شرکت بیش از ۱۰ هزار واحد پردازش گرافیکی را از انویدیا جمع آوری کرده است.
صندوق High-Flyer Quant در آوریل ۲۰۲۳ گفت تمرکز خود را برای ایجاد یک سازمان تحقیقاتی مستقل که به “کاوش در ماهیت AGI” اختصاص دارد تغییر میدهد و امیدوار است که اعضای تیم همفکر خود را استخدام کند.
لیانگ گفت DeepSeek هیچ برنامهای برای افزایش بودجه خارجی در کوتاه مدت ندارد. این استراتژی کاملاً در تضاد با کاری است که دیگر شرکتهای جوان چینی هوش مصنوعی انجام میدهند. بهعنوان مثال، شش استارتآپ بزرگ LLM در چین – Zhipu AI، Moonshot AI، MiniMax، Baichuan AI، StepFun و ۰۱٫AI – طبق گزارشهای رسانههای چینی، حداقل ۲۰ میلیارد یوان در سال ۲۰۲۴ از طریق نزدیک به ۱۲ دور تأمین مالی جذب کردند.
ذهنیت مدیریت استارت آپ
لیانگ پیش از این اعلام کرد DeepSeek هیچ محدودیتی از نظر استقرار منابع محاسباتی یا جذب استعداد ندارد زیرا این شرکت هیچ لایه داخلی یا بخشهای دپارتمانی ندارد. برای یک شرکت جوان، به نظر میرسد که این یک مجموعه ایده آل برای پیگیری سریع یا پاسخگویی به آخرین پیشرفتهای فناوری باشد.
به گفته لیانگ، آنچه DeepSeek انجام میدهد، تقسیم کار «طبیعی» در میان کارکنانش است.
منبع: scmp