بررسی مدلها و ابزارهای هوش مصنوعی در حوزه تولید و ویرایش تصویر
در این جلسه به بررسی سه شاخه اصلی هوش مصنوعی در حوزه تصویرپردازی پرداختیم: تبدیل متن به تصویر (Text-to-Image)، ویرایش تصویر، و تنظیم مجدد مدلها (Fine-tuning). در بخش تولید تصویر از متن، چهار مدل اصلی شامل DALL·E (اپنایآی)، Midjourney، Imagen (گوگل) و Stable Diffusion معرفی شدند. همچنین ابزار رایگان و بدون نیاز به فیلترشکن «Bing Image» به عنوان یک نمونه کاربردی معرفی شد. در حوزه ویرایش تصویر، نرمافزار «کبات» که امکان ویرایش تصاویر و تصاویر متحرک را فراهم میکند، معرفی گردید. همچنین در مورد نحوه عملکرد مدلها به عنوان ماشینهایی که با تحلیل میلیاردها عکس یاد میگیرند تا تصاویر دلخواه کاربران را تولید کنند توضیح داده شد. این جلسه مقدمهای برای معرفی عملی ابزار بینگ ایمیج در جلسات بعدی بود.
عناوین مطرح شده در درس:
-
سه شاخه اصلی هوش مصنوعی در حوزه تصویر
-
تبدیل متن به تصویر
-
ویرایش تصویر
-
تنظیم مجدد مدل (Fine-tuning)
-
-
معرفی مدلهای اصلی تولید تصویر از متن
-
DALL·E (OpenAI)
-
Midjourney
-
Imagen (Google)
-
Stable Diffusion
-
-
معرفی ابزار رایگان Bing Image برای تبدیل متن به تصویر
-
معرفی نرمافزار Kibat برای ویرایش تصاویر و تصاویر متحرک
-
شرح عملکرد مدلهای هوش مصنوعی در یادگیری و تولید تصویر
-
اهمیت دادههای عظیم و تحلیل شباهتها در آموزش مدلها
-
مقدمه برای آموزش عملی کار با ابزار Bing Image در جلسات بعدی