مجموع نظرات: ۰

شنبه ۲۸ بهمن ۱۴۰۲ - ۰۸:۰۹

۲ نفر

خلق یک شاهکار دیگر در دنیای هوش مصنوعی | تبدیل متن به ویدیو

شرکت فناوری OpenAI خالق روبات چت جنجالی ChatGPT یک شاهکار جدید رو کرده است.

به گزارش همشهری آنلاین به نقل از الجزیره: تصور اینکه به توان یک پیام متنی ساده را به یک ویدئو خیره‌کننده تبدیل کرد، تا پیش از این غیرممکن به نظر می‌رسید. اما به لطف هوش مصنوعی Sora، آخرین مدل هوش مصنوعی از OpenAI می‌توان ویدئوهای شگفت‌انگیز را از متن تولید کند.

سورا Sora یک مدل هوش مصنوعی است که می‌تواند ویدئوهای یک دقیقه‌ای تولید کند که صحنه‌های بسیار دقیق، حرکت دوربین پیچیده و شخصیت‌های متعدد با احساسات پر جنب‌وجوش دارد. سورا همچنین می‌تواند ویدئوها را براساس یک تصویر ثابت یا فیلم‌های موجود را با مواد جدید ایجاد کند. این هوش مصنوعی می‌تواند با گرفتن یک دستور توصیفی کوتاه از کاربر، مانند «یک زن شیک‌پوش در خیابانی در توکیو قدم می‌زند که پر از نئون درخشان و تابلوهای متحرک شهری است» کار ‌کند. سپس با استفاده از مجموعه بزرگی از ویدئوهایی که از آنها آموخته است، دستور را تفسیر و دنیای فیزیکی در حال حرکت را شبیه‌سازی‌ کند.

سورا همچنین می‌تواند ترجیحات کاربر را در مورد سبک و حال و هوای ویدئو، مانند «سبک سینمایی، فیلمبرداری با فیلم ۳۵میلی‌متری، رنگ‌های زنده» درک کند و نور، رنگ و زوایای دوربین را متناسب با آن تنظیم کند.

این مدل عجیب و غریب می تواند ویدیوهایی با وضوح ۱۹۲۰x۱۰۸۰ و حداکثر ۱۰۸۰x۱۹۲۰ تولید کند. علاوه بر همه اینها می تواند ژانرها و موضوعات مختلفی مانند فانتزی، علمی تخیلی، ترسناک، کمدی و غیره را مدیریت کند.

به زبان ساده تر سورا یک مدل هوش مصنوعی است که می‌تواند با استفاده از تکنیکی به نام تبدیل متن به ویدئو، ویدیوها را از پیام‌های متنی تولید کند. این تکنیک شامل تبدیل زبان طبیعی به بازنمایی های بصری، مانند تصاویر یا ویدئوها است.

بیشتر بخوانید:

این ویژگی آیفون جان شما را نجات می دهد

ترکیب متن به ویدئو یک کار چالش برانگیز است، زیرا نیاز به مدل هوش مصنوعی برای درک معنا و زمینه متن، و همچنین جنبه های بصری و فیزیکی ویدئو دارد. برای مثال، مدل باید بداند که چه اشیا و شخصیت‌هایی در صحنه هستند، چگونه به نظر می‌رسند، چگونه حرکت می‌کنند، چگونه تعامل دارند و چگونه تحت تأثیر محیط قرار می‌گیرند.