به گزارش همشهری آنلاین به نقل از الجزیره: تصور اینکه به توان یک پیام متنی ساده را به یک ویدئو خیرهکننده تبدیل کرد، تا پیش از این غیرممکن به نظر میرسید. اما به لطف هوش مصنوعی Sora، آخرین مدل هوش مصنوعی از OpenAI میتوان ویدئوهای شگفتانگیز را از متن تولید کند.
سورا Sora یک مدل هوش مصنوعی است که میتواند ویدئوهای یک دقیقهای تولید کند که صحنههای بسیار دقیق، حرکت دوربین پیچیده و شخصیتهای متعدد با احساسات پر جنبوجوش دارد. سورا همچنین میتواند ویدئوها را براساس یک تصویر ثابت یا فیلمهای موجود را با مواد جدید ایجاد کند. این هوش مصنوعی میتواند با گرفتن یک دستور توصیفی کوتاه از کاربر، مانند «یک زن شیکپوش در خیابانی در توکیو قدم میزند که پر از نئون درخشان و تابلوهای متحرک شهری است» کار کند. سپس با استفاده از مجموعه بزرگی از ویدئوهایی که از آنها آموخته است، دستور را تفسیر و دنیای فیزیکی در حال حرکت را شبیهسازی کند.
سورا همچنین میتواند ترجیحات کاربر را در مورد سبک و حال و هوای ویدئو، مانند «سبک سینمایی، فیلمبرداری با فیلم ۳۵میلیمتری، رنگهای زنده» درک کند و نور، رنگ و زوایای دوربین را متناسب با آن تنظیم کند.
این مدل عجیب و غریب می تواند ویدیوهایی با وضوح ۱۹۲۰x۱۰۸۰ و حداکثر ۱۰۸۰x۱۹۲۰ تولید کند. علاوه بر همه اینها می تواند ژانرها و موضوعات مختلفی مانند فانتزی، علمی تخیلی، ترسناک، کمدی و غیره را مدیریت کند.
به زبان ساده تر سورا یک مدل هوش مصنوعی است که میتواند با استفاده از تکنیکی به نام تبدیل متن به ویدئو، ویدیوها را از پیامهای متنی تولید کند. این تکنیک شامل تبدیل زبان طبیعی به بازنمایی های بصری، مانند تصاویر یا ویدئوها است.
بیشتر بخوانید:
ترکیب متن به ویدئو یک کار چالش برانگیز است، زیرا نیاز به مدل هوش مصنوعی برای درک معنا و زمینه متن، و همچنین جنبه های بصری و فیزیکی ویدئو دارد. برای مثال، مدل باید بداند که چه اشیا و شخصیتهایی در صحنه هستند، چگونه به نظر میرسند، چگونه حرکت میکنند، چگونه تعامل دارند و چگونه تحت تأثیر محیط قرار میگیرند.
نظر شما