به گزارش ساوت چاینا مورنینگ پست، این شرکت اعلام کرد HunyuanVideo به صورت رایگان در اختیار کاربران شرکتی و فردی قرار گرفته است. این ابزار با بیش از ۱۳ میلیارد پارامتر – معیاری از متغیرهای موجود در یک سیستم هوش مصنوعی در طول آموزش – بزرگترین مدل منبع باز جهان برای تولید ویدئو است.
HunyuanVideo برای تولید ویدئوهای با کیفیت بالا و «فوق واقعگرایانه» طراحی شده که در آن تغییر زوایای دوربین و بازتابها به طور قانعکنندهای ارائه میشود. در یک ویدیوی نمایشی، یک موجسوار بر یک موج بزرگ سوار میشود و خودش میچرخد. در یک کلیپ دیگر، چندین بالن هوای گرم به آرامی به سمت آسمان بلند میشوند در حالی که آتش روی زمین میسوزند.
تنسنت، صاحب پرکاربردترین اپلیکیشن رسانه اجتماعی چین و بزرگترین تجارت بازیهای ویدئویی جهان از نظر درآمد، آخرین شرکت فناوری چینی است که پس از معرفی سورا توسط OpenAI سازنده ChatGPT، در ماه فوریه، وارد نبرد هوش مصنوعی در تولید ویدئو شده است.
اپراتور اپلیکیشن ویدئوی کوتاه Kuaishou Technology، رقیب اصلی بایت دنس در چین، سرویس تبدیل متن به ویدئو Kling AI Model خود را در ماه ژوئن راهاندازی کرد. علیبابا، غول تجارت الکترونیک، در حال کار بر روی یک ابزار ویدئویی هوش مصنوعی به نام Tora است که سورا OpenAI را به عنوان مدل پایه خود پذیرفته است.
مدل HunyuanVideo تنسنت بر اساس معماری Diffusion Transformer، همان معماری سورا است.
مدل HunyuanVideo میتواند ویدئوهای طولانی تا پنج ثانیه با وضوح ۷۲۰p ایجاد کند. بر اساس دستورهایی که به زبان انگلیسی یا چینی نوشته شده بود، این ابزار توانست یک ویدئوی واقعی از یک خانم چینی در حال پختن و پرتاب غذا در هوا و یک کلیپ متحرک از یک گربه در منظره بازی سایبرپانک تولید کند.
کاربران میتوانند HunyuanVideo را از طریق Yuanbao، برنامه چت ربات هوش مصنوعی تنسنت، آزمایش کنند، که درخواستهای متنی را به زبان چینی یا انگلیسی میپذیرد و گزینههای مختلفی را در سبک، کیفیت و اندازه ویدئو ارائه میدهد. همچنین به کاربران این امکان را میدهد تا از میان تنظیمات فیلمسازی پیشرفته، مانند حرکات و عکسهای مختلف دوربین، انتخاب کنند.
از زمان رونمایی از مدل پایه Huanyuan در سپتامبر سال ۲۰۲۳، تنسنت آن را ارتقا بخشیده است. در ماه مارس، یک ابزار تبدیل تصویر به ویدئو به نام Follow-Your-Click را با همکاری دانشگاه علم و فناوری هنگ کنگ و دانشگاه شینهوا معرفی کرد.
در ماه مه، این شرکت قابلیت تولید متن به تصویر را به Hunyuan اضافه کرد که عملکرد کلی آن را در مقایسه با نسخه قبلی ۲۰ درصد بهبود بخشید.
منبع: scmp