به گزارش ساوت چاینا مورنینگ پست، بر اساس بخشنامه ۱۳ مادهای که به طور مشترک توسط چهار نهاد دولتی چین منتشر شد، این کشور برچسبگذاری سیستماتیک و استفاده از دادههای عمومی را ترویج میکند و در عین حال به نیازهای داده بخشهای کلیدی مانند کشاورزی، تولید و فناوری اطلاعات رسیدگی میکند.
دولت چین از استفاده فرابخشی، منطقهای و بین اداری از دادههای عمومی حمایت میکند. تشویق همکاری بین دولت و شرکتها در برچسبگذاری دادهها و آموزش مدلهای زبان بزرگ متناسب با امور دولتی و همچنین گنجاندن خدمات برچسبگذاری دادهها در اولویتهای پکن قرار دارد.
برچسبگذاری دادههای عمومی باید به شیوهای منظم و مطابق با قانون انجام شود.
حاشیهنویسی داده – فرآیند طبقهبندی و برچسبگذاری انواع مختلف داده مانند متن، صدا، تصاویر و ویدئو – اغلب به عنوان پایهای برای توانمندسازی سیستمهای هوش مصنوعی برای تولید نتایج دقیق و قابلاعتماد در نظر گرفته میشود. فقدان دادههای با کیفیت بالا یکی از چالشهای توسعه مدلهای زبان بزرگ بوده است.
ارزش این بخش در سال ۲۰۲۳ به ۸۰ میلیارد یوان (۱۰٫۹۱ میلیارد دلار) رسید و حاشیهنویسی دادهها به طور گسترده در زمینههای پیشرفته مانند رانندگی خودکار، اقتصادهای در ارتفاع کم، تولید هوشمند و مراقبتهای بهداشتی هوشمند قابلاستفاده است. طبق این دستورالعمل، چین متعهد شده است که نرخ رشد سالانه ترکیبی صنعت حاشیهنویسی داده را تا سال ۲۰۲۷ به ۲۰ درصد افزایش دهد.
در چین، دولت دادههای عمومی را برای استفاده اجتماعی به اشتراک میگذارد و مدیریت میکند، در حالی که افراد یا شرکتها دادههای خصوصی را کنترل میکنند و مشمول مقررات سختگیرانه حریم خصوصی هستند.
در بخش حاشیهنویسی دادهها، چین برخی از شرکتهای «غزال» و «تکشاخ» را پرورش خواهد داد – نامهایی که به استارت آپهای با رشد سریع با ارزشگذاریهای بسیار بالا اشاره دارد – و از یارانههای مالی برای کاهش هزینههای این شرکتها استفاده خواهد کرد.
این اقدام به دنبال پیشنهاد اخیر پکن برای راهاندازی یک ابتکار “AI Plus” برای ادغام هوش مصنوعی با صنایع مختلف بهمنظور افزایش بهره وری و رقابت آنها صورت گرفت.
طبق گزارش مککنزی در سال ۲۰۲۳، چین در حال برداشتن گامهای قابلتوجهی در توسعه صنعت هوش مصنوعی خود است که میتواند ۲ تریلیون دلار به اقتصاد این کشور کمک کند و یکسوم سهم اقتصادی جهانی هوش مصنوعی را به خود اختصاص دهد.
با این حال، چین قبلاً دادههای عمومی خود را باز نکرده است. در مقابل، ایالاتمتحده، رقیب چین در رقابت هوش مصنوعی، در سال ۲۰۱۳ شروع به باز کردن دادههای عمومی کرد. دولت باراک اوباما، رئیسجمهور سابق ایالاتمتحده، طرح دولت باز را از طریق یک فرمان اجرایی راهاندازی کرد و انتشار دادههای دولتی را برای محققان و مشاغل و در توسعه هوش مصنوعی الزامی کرد.
یکی از پیشروترین شرکتهای حاشیهنویسی داده در جهان، Scale AI، مستقر در کالیفرنیا، ۱۳٫۸ میلیارد دلار ارزشگذاری شده است. این شرکت دادههای آموزشی هوش مصنوعی را برای غولهای فناوری مانند OpenAI، متا و گوگل فراهم میکند.
منبع: scmp