این ویدئو تنها با استفاده از یک تصویر از اینشتین و یک فایل صوتی ایجاد شده است!
اما نکته مهم چیست!؟
مدل جدیدOmniHuman-1 از شرکت چینیByteDance دقیقا میداند که کاراکتر چگونه در زمان گفتن کلمات اکت و اجرا میکند!
این درک بیش از حد خارج از چارچوب است!
شرکت چینی ByteDance با معرفی مدل جدید OmniHuman-1، تحولی شگرف در عرصه تولید ویدئو رقم زد. این هوش مصنوعی قادر است تنها با استفاده از یک تصویر و یک فایل صوتی، ویدیویی کاملا واقعی از شخصیت مورد نظر خلق کند. نکته حیرت انگیز اینجاست که OmniHuman-1 نه تنها صدا را به تصویر تبدیل می کند، بلکه حرکات و حالات چهره کاراکتر را نیز به گونه ای دقیق و طبیعی بازسازی می کند که گویی او واقعا در حال صحبت کردن است.
دیدگاه تان را بنویسید