• امروز : دوشنبه - ۱۷ دی - ۱۴۰۳
  • برابر با : Monday - 6 January - 2025
1

ابزار هوش مصنوعی تبدیل متن به ویدئوی تنسنت در پاسخ به سورا

  • کد خبر : 8908
  • ۱۵ دی ۱۴۰۳ - ۹:۰۰
ابزار هوش مصنوعی تبدیل متن به ویدئوی تنسنت در پاسخ به سورا
تنسنت، غول چینی بازی‌های ویدئویی و رسانه‌های اجتماعی، ابزار تولید متن به ویدئو را بر اساس مدل پایه هوش مصنوعی Hunyuan راه‌اندازی کرده است و به رقابت میان رقبای داخلی برای به چالش کشیدن همتایان آمریکایی در این زمینه می‌پیوندد.

به گزارش ساوت چاینا مورنینگ پست، این شرکت اعلام کرد HunyuanVideo به صورت رایگان در اختیار کاربران شرکتی و فردی قرار گرفته است. این ابزار با بیش از ۱۳ میلیارد پارامتر – معیاری از متغیرهای موجود در یک سیستم هوش مصنوعی در طول آموزش – بزرگ‌ترین مدل منبع باز جهان برای تولید ویدئو است.

HunyuanVideo برای تولید ویدئوهای با کیفیت بالا و «فوق واقع‌گرایانه» طراحی شده که در آن تغییر زوایای دوربین و بازتاب‌ها به طور قانع‌کننده‌ای ارائه می‌شود. در یک ویدیوی نمایشی، یک موج‌سوار بر یک موج بزرگ سوار می‌شود و خودش می‌چرخد. در یک کلیپ دیگر، چندین بالن هوای گرم به آرامی به سمت آسمان بلند می‌شوند در حالی که آتش‌ روی زمین می‌سوزند.

تنسنت، صاحب پرکاربردترین اپلیکیشن رسانه اجتماعی چین و بزرگ‌ترین تجارت بازی‌های ویدئویی جهان از نظر درآمد، آخرین شرکت فناوری چینی است که پس از معرفی سورا توسط OpenAI سازنده ChatGPT، در ماه فوریه، وارد نبرد هوش مصنوعی در تولید ویدئو شده است.

اپراتور اپلیکیشن ویدئوی کوتاه Kuaishou Technology، رقیب اصلی بایت دنس در چین، سرویس تبدیل متن به ویدئو Kling AI Model خود را در ماه ژوئن راه‌اندازی کرد. علی‌بابا، غول تجارت الکترونیک، در حال کار بر روی یک ابزار ویدئویی هوش مصنوعی به نام Tora است که سورا OpenAI را به عنوان مدل پایه خود پذیرفته است.

مدل HunyuanVideo  تنسنت بر اساس معماری Diffusion Transformer، همان معماری سورا است.

مدل HunyuanVideo می‌تواند ویدئوهای طولانی تا پنج ثانیه با وضوح ۷۲۰p ایجاد کند. بر اساس دستورهایی که به زبان انگلیسی یا چینی نوشته شده بود، این ابزار توانست یک ویدئوی واقعی از یک خانم چینی در حال پختن و پرتاب غذا در هوا و یک کلیپ متحرک از یک گربه در منظره بازی سایبرپانک تولید کند.

کاربران می‌توانند HunyuanVideo را از طریق Yuanbao، برنامه چت ربات هوش مصنوعی تنسنت، آزمایش کنند، که درخواست‌های متنی را به زبان چینی یا انگلیسی می‌پذیرد و گزینه‌های مختلفی را در سبک، کیفیت و اندازه ویدئو ارائه می‌دهد. همچنین به کاربران این امکان را می‌دهد تا از میان تنظیمات فیلم‌سازی پیشرفته، مانند حرکات و عکس‌های مختلف دوربین، انتخاب کنند.

از زمان رونمایی از مدل پایه Huanyuan در سپتامبر سال ۲۰۲۳، تنسنت آن را ارتقا بخشیده است. در ماه مارس، یک ابزار تبدیل تصویر به ویدئو به نام Follow-Your-Click را با همکاری دانشگاه علم و فناوری هنگ کنگ و دانشگاه شینهوا معرفی کرد.

در ماه مه، این شرکت قابلیت تولید متن به تصویر را به Hunyuan اضافه کرد که عملکرد کلی آن را در مقایسه با نسخه قبلی ۲۰ درصد بهبود بخشید.

منبع: scmp

لینک کوتاه : https://techchina.ir/?p=8908

ثبت دیدگاه

قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.