ابزار شناسی هوش مصنوعی (1)ابزار تصویرسازی با هوش مصنوعی بررسی مدل‌ها و ابزارهای هوش مصنوعی در حوزه تولید و ویرایش تصویر

بررسی مدل‌ها و ابزارهای هوش مصنوعی در حوزه تولید و ویرایش تصویر

در این جلسه به بررسی سه شاخه اصلی هوش مصنوعی در حوزه تصویرپردازی پرداختیم: تبدیل متن به تصویر (Text-to-Image)، ویرایش تصویر، و تنظیم مجدد مدل‌ها (Fine-tuning). در بخش تولید تصویر از متن، چهار مدل اصلی شامل DALL·E (اپن‌ای‌آی)، Midjourney، Imagen (گوگل) و Stable Diffusion معرفی شدند. همچنین ابزار رایگان و بدون نیاز به فیلترشکن «Bing Image» به عنوان یک نمونه کاربردی معرفی شد. در حوزه ویرایش تصویر، نرم‌افزار «کبات» که امکان ویرایش تصاویر و تصاویر متحرک را فراهم می‌کند، معرفی گردید. همچنین در مورد نحوه عملکرد مدل‌ها به عنوان ماشین‌هایی که با تحلیل میلیاردها عکس یاد می‌گیرند تا تصاویر دلخواه کاربران را تولید کنند توضیح داده شد. این جلسه مقدمه‌ای برای معرفی عملی ابزار بینگ ایمیج در جلسات بعدی بود.

عناوین مطرح شده در درس:

سه شاخه اصلی هوش مصنوعی در حوزه تصویر
- تبدیل متن به تصویر
- ویرایش تصویر
- تنظیم مجدد مدل (Fine-tuning)
معرفی مدل‌های اصلی تولید تصویر از متن
- DALL·E (OpenAI)
- Midjourney
- Imagen (Google)
- Stable Diffusion
معرفی ابزار رایگان Bing Image برای تبدیل متن به تصویر
معرفی نرم‌افزار Kibat برای ویرایش تصاویر و تصاویر متحرک
شرح عملکرد مدل‌های هوش مصنوعی در یادگیری و تولید تصویر
اهمیت داده‌های عظیم و تحلیل شباهت‌ها در آموزش مدل‌ها
مقدمه برای آموزش عملی کار با ابزار Bing Image در جلسات بعدی