شرکت Stability AI، سازنده هوش مصنوعی مولد تصویر Stable Diffusion، بهتازگی از مولد جدید هوش مصنوعی Stable Cascade رونمایی کرده است. این شرکت ادعا میکند مدل جدیدش نسبت به Stable Diffusion از قدرت و سرعت بیشتری برخوردار است.
براساس گزارش زومیت، در ادامه نگاهی به برخی از قابلیتهای تستشده Stable Cascade و تصاویری که تولید کرده است میاندازیم.
ساخت تصویر از روی دستور «عکس سینمایی از پنگوئن انساننمایی که در کافه نشسته است، کتاب میخواند و قهوه مینوشد»
قابلیت Canny Edge
Canny Edge: مدل بر اساس لبهها یا دورگیریهای تصویری که آپلود میکنید، یک تصویر کامل و جدید ایجاد میکند. این کار روی اسکچها نیز قابل انجام است.
قابلیت Inpainting / Outpainting
Inpainting / Outpainting: تصویر اصلی را همراه با تصویر ماسکشده وارد کنید تا مدل با دنبال کردن دستور متنی شما، قسمت ماسکهی تصویر را پر کند.
Inpainting / Outpainting
قابلیت 2x Super Resolution
2x Super Resolution: وضوح عکس ورودی را تا دو برابر افزایش میدهد؛ بهعنوان مثال وضوح ۱۰۲۴×۱۰۲۴ پیکسل را به ۲۰۴۸×۲۰۴۸ پیکسل میرساند.
قابلیت Image-to-image
Image-to-image: مدل برای شروع ساخت نسلی از تصویرها، به تصویر اصلی نویز اضافه میکند. (تصویر از چپ به راست)
قابلیت Image variations
Image variations: مدل میتواند جاسازیهای تصویر را درک کند و به کمک آن تصاویر متنوع بسازد. برای ساخت تصاویر بالا هیچ دستوری نوشته نشده است.
امیدواریم از تماشای این شاتر لذت برده باشید. نظر شما دربارهی عملکرد Stable Cascade چیست؟ آیا میتواند رقیب جدی برای مدلهای مولد تصویر فعلی همچون DALL-E 2 یا میدجورنی باشد؟