به گزارش پلاتو هنر، «این اولین باری بود که احساس کردم زمین زیرپایم می‌لرزد.» این جمله را فیلمسازی به نام پال تریلو در واکنش به توانایی‌های ابزار تبدیل متن به ویدئو Sora گفته است!

15 فوریه امسال بود که OpenAI شرکت سازنده چت‌بات ChatGPT و ابزار تبدیل متن به عکس Dall-E، از ابزار تبدیل متن به ویدئو Sora در ایکس رونمایی کرد. سم آلتمن مدیرعامل این شرکت، در صفحه ایکس خود از کاربران خواست تا چند پرامپت پیشنهاد دهند. آلتمن هم با ویدئویی‌هایی که با Sora ساخته بود به پرامپت‌های پیشنهادی مخاطبانش پاسخ داد!

Sora در زبان ژاپنی به معنی آسمان است و احتمالا سازندگان آن، چنین اسمی را انتخاب کردند تا در ذهن، تداعی‌گر خلاقیت بدون حدومرز باشد. این ابزار پرامپت‌های متنی کاربران را به ویدئوهای صامت یک دقیقه‌ای تبدیل می‌کند. البته، «سورا» اولین ابزار تبدیل متن به ویدئو نیست. پیش از آن، ابزارهای هوش مصنوعی زیادی برای ساخت ویدئو وجود داشتند اما مسئله‌ای که باعث شده تا Sora این همه سر زبان‌ها بیافتد، توانایی منحصربه‌فرد آن در واقع‌نمایی صحنه‌ها است. ویدئوهای «سورا» توانایی این ابزار در خلق ویدئوهایی باکیفیت بالا از صحنه‌های پیچیده که جزئیات زیادی دارند را نشان می‌دهد.

پال تریلو فیلمساز و مشاور برخی از کمپانی‌های هوش مصنوعی عنوان کرد که توانایی‌های «سورا» و کیفیت ویدئوهایش او را شگفت‌زده می‌کند اما تا زمانی که «سورا» تبدیل به برنامه‌ای منبع‌باز نشود و به هنرمندان اجازه کنترل کامل و شخصی‌سازی ندهد، او نمی‌داند که Sora مخل این صنعت است یا صرفا یک دمو خوب از محصول یک شرکت فناوری.

او مطرح کرد: «به نظرم Sora به کار کسانی می‌آید که هنوز در ابتدای مسیر فیلمسازی هستند و می‌خواهند آزمون‌وخطا کنند و ایده‌هایشان را امتحان کنند اما امکانات کافی ندارند.»

یکی از ویدئوهای Sora، موجودی را نشان می‌دهد که در جنگل بالاوپایین می‌پرد و به یک قارچ می‌رسد. تریلو با اشاره به این ویدئو عنوان کرد که «سورا» ترتیب رخ دادن وقایع در یک پرامپت پیچیده که چندین اتفاق همزمان با هم رخ می‌دهند را متوجه می‌شود و همین توانایی باعث می‌شود تا Sora یک قدم به ابزاری مفیدی برای داستان‌گویی نزدیک‌تر شود.

تریلو که در کمپانی‌های هوش مصنوعی زیادی به عنوان مشاور ساخت ابزارهایشان حضور داشته، گفت: «این اولین باری بود که احساس کردم زمین زیرپایم می‌لرزد. این نگران‌کننده است اما در عین حال نمی‌شود برایش شگفت‌زده نبود.»

Sora علاوه‌بر همه توانایی‌های نگران‌کننده‌ای که دارد، ضعف‌هایی هم دارد. شاید یکی از بزرگ‌ترین ضعف‌های آن، صامت بودن ویدئوها باشد. در ویدئوهای «سورا»، شخصیت‌ها نمی‌توانند دیالوگ بگویند.

یکی دیگر از ضعف‌های Sora، قوانین سخت‌گیرانه شرکت OpenAI است که به کاربران اجازه ساخت صحنه‌های خشن برای فیلم‌های جنایی و اکشن را نمی‌دهد. برخی از فیلمسازان تلاش کردند تا این محدودیت‌ها را دور بزنند و برای مثال، به جای استفاده از  کلمه خون در پرامپت‌هایشان، از کلمه سس کچاپ استفاده کردند اما در نهایت جز ناامیدی، نتیجه دیگری دست‌گیرشان نشد. باتوجه به قوانین سختگیرانه این شرکت، ساخت صحنه‌های عاشقانه با Sora هم سرنوشتی مثل سرنوشت صحنه‌های خشن و اکشن را دارند.

Sora می‌تواند نمای 60 ثانیه‌ای قابل‌ قبولی تولید کند ولی این به آن معنا نیست که می‌تواند یک فیلم منسجم هم بسازد. حتی اگر هالیوود بخواهد از ابزارهای هوش مصنوعی مولد مانند «سورا» استفاده کند، امکان این‌که تولیدات هوش مصنوعی را کپی‌رایت کند، وجود ندارد. ادوارد کلاریس وکیل دادگستری عنوان کرد که «استودیوها باید خیلی مراقب باشند تا هوش مصنوعی مولد را در مراحل ساخت تولیدات‌شان به‌ کار نگیرند» زیرا در غیر این صورت، با توجه به اینکه فعلا قانون کپی‌رایت شامل تولیدات هوش مصنوعی نمی‌شود، آنها عملا دارند آثاری را تولید می‌کنند که «تحت پوشش قوانین مالکیت فکری نیستند.»

گری مارکس پژوهشگر حوزه هوش مصنوعی با اشاره به ظاهر و غیب شدن یک دفعه اجسام یا تغییر شکل ناگهانی آنها در ویدئوهای «سورا» عنوان کرد که فکر نمی‌کند این ابزار مناسب تولیدات حرفه‌ای سینما و تلوزیون باشد.

نشریه هالیوود ریپورتر طی گزارشی اعلام کرده بود که در ماه ژانویه، مطالعه‌ای با حضور ۳۰۰ تن از مدیران هالیوود صورت گرفت و سه چهارم آن‌ها عنوان کردند که ابزارهای هوش مصنوعی به حذف و کاهش مشاغل در شرکت‌های‌شان می‌انجامند. براساس این مطالعه، تا سه سال آینده، نزدیک ۲۰۴,۰۰۰ موقعیت شغلی شدیدا تحت‌تاثیر هوش مصنوعی و ابزارهای آن قرار خواهند گرفت.

در این مطالعه همچنین مطرح شد که اگر این فناوری به رشد خود ادامه دهد، مهندسین صدا، صدا پیشگان و طراحان کانسپت در معرض بیشترین خطر جابه‌جایی با هوش مصنوعی قرار دارند. جلوه‌های بصری و دیگر کارهای مربوط به بخش پساتولید فیلم نیز به همان مقدار در معرض تهدید قرار دارند.

کارلا اُرتیز طراح کانسپت بعضی از فیلم‌های کمپانی مارول گفت: «این مشخصا یک زنگ خطر برای اتحادیه‌ها و هر متخصصی با هر توانایی است. این نشان می‌دهد که این فناوری اینجا است تا با ما رقابت کند. این تنها قدم اول است.» او با اشاره به این‌که از هوش مصنوعی مولد دارد در ساخت پروژه‌ها استفاده می‌شود، مطرح کرد: «هوش مصنوعی صنعت ما را از بین خواهد برد.»

البته هنرمندانی هم مانند دیوید استریپینیس وجود دارند که حاضر به استفاده از هوش مصنوعی و ابزارهای آن هستند. دیوید استریپینیس طراح جلوه‌های بصری فیلم‌های «آواتار» و «مرد پولادین» درمورد این مسئله گفت: «این صنعت همیشه دنبال راه‌های کم خرج برای انجام هر کاری است. من از این فناوری استفاده خواهم کرد چون دو راه بیشتر ندارم: یا آن را بپذیرم یا با امیدوار بودن، جلوی فاجعه را بگیرم.»

تعدادی هنرمند طی گفتگوهایشان با نشریه هالیوود ریپورتر، خبر از به کار گیری ابزارهای هوش مصنوعی مانند میدجرنی در هالیوود را دادند. آنها عنوان کردند که رندرهای اولیه را با کمک این ابزار می‌سازند و سپس، تغییراتی را روی آنها اعمال می‌کنند.

دیوید استریپینیس در رابطه با کاهش هزینه‌ها عنوان کرد: «بزرگ‌ترین مشکل در جلوه‌های بصری این است که کارفرما نمی‌داند چه چیزی می‌خواهد و موقعی که می‌گوید کاری که انجام دادید درست نیست، در حقیقت شما 15,000 دلار خرج انجام ایده اشتباهی کردید.» او در ادامه مطرح کرد که با استفاده از این فناوری، کارگردانان می‌توانند چیزی که در نظر دارند را بهتر بیان کنند.

ابزار Sora با همه مزایای نگران‌کننده‌ای که به همراه دارد، هنوز نمی‌تواند کاملا نیازهای یک فیلمساز را بر طرف کند یا به عبارتی دیگر، یک فیلم کامل بسازد و همچنان در حد یک ابزار است نه یک جایگزین! این ابزار هنوز در دسترس عموم قرار نگرفته و فعلا توسط متخصصین و فیلمسازان در مرحله ارزیابی است.

فاطمه زهرا معصومی

 

منابع:

Hollywood Reporter, ”AI’s New Job? All-Purpose Hollywood Crewmember”,  2024

IndieWire, ”Is OpenAI’s Sora the Filmmaking Apocalypse, or Just a Great Demo for a Tech Company?”, 2024

بیشتر بخوانید: