شرکت علی‌بابا از هوش مصنوعی EMO رونمایی کرد

1402/12/12

هوش مصنوعی EMO می‌تواند عکس‌های پرتره شما را به ویدئوهایی تبدیل کند که در آن‌ها در حال صحبت یا آواز خواندن هستید.

به گزارش پلاتو هنر، شرکت چینی علی‌بابا از جدیدترین سیستم هوش مصنوعی خود به نام EMO رونمایی کرد.

این مدل را که با مجموعه داده‌ای متشکل از 250 ساعت ویدئوهای مربوط به فیلم‌ها، نمایش‌های تلویزیونی، سخنرانی‌ها و اجراهای آواز آموزش داده‌اند، می‌تواند عکس‌های پرتره را به ویدئو تبدیل کند.

EMO عکس‌های پرتره و فایل‌ صوتی شما را می‌تواند به ویدئوهایی تبدیل کند که در آنها در حال صحبت کردن یا آواز خواندن هستید. نقطه قوت این مدل این است که حرکات اجزای صورت و حالت‌های سر کاربران را به طبیعی‌‌ترین شکل ممکن (در مقایسه با مدل‌های دیگر) نمایش می‌دهد.

یکی از ویدئوهایی که در شبکه‌های مجازی دست‌به‌دست می‌شود، ویدئو زیر است که در آن، خروجی نهایی از عکس پرتره و صوتی‌ که در اختیار EMO قرار داده شده است را می‌توانید ببینید.

به نظر می‌رسد که امسال شاهد پیشرفت‌های چشمگیرتری در حوزه فناوری هوش مصنوعی خواهیم بود. در سال جدید میلادی، کمپانی‌های زیادی از جدیدترین مدل‌های هوش مصنوعی خود رونمایی کرده‌اند. یکی از جدیدترین و بحث‌برانگیزترین مدل‌های امسال، هوش مصنوعی Sora بود که می‌تواند پرامپت‌های متنی را به ویدئوهای یک دقیقه‌ای تبدیل کند. چیزی که باعث نگرانی بسیاری از هنرمندان عرصه سینما شده، توانایی خوب Sora در واقع‌نمایی و پرداختن به جزئیات است. البته، ویدئوهای Sora صامت هستند اما شرکت ElevenLabs از فرصت استفاده کرد و با جدیدترین مدل هوش مصنوعی خود، ویدئوهای Sora را صداگذاری کرد.

پیشنهاد پلاتو هنر

اخبار مرتبط

جدیدترین ها