هوش مصنوعی Midjourney چیست و چگونه با آن کار کنیم؟

هوش مصنوعی Midjourney یکی از ابزارهای رایگان برای تبدیل متن به عکس است که در دسترس عموم قرار دارد. در مطلب پیش رو به آموزش کار با Midjourney و ارائه توضیحاتی پیرامون امکانات و قابلیت‌های آن خواهیم پرداخت.

هوش مصنوعی Midjourney چیست؟

ساخت آثار هنری با استفاده از هوش‌های مصنوعی و تبدیل متن به عکس با ابزارهای خودکار، یکی از داغ‌ترین جنبه‌های فناوری در ماه‌های اخیر بوده است. هوش مصنوعی Dall-E شرکت OpenAI یکی از بهترین نمونه‌های چنین ابزارهایی است که خروجی آن از دقت بالایی بهره می‌برد. با‌این‌حال محصول گفته‌شده به‌شکل رایگان در اختیار علاقه‌مندان قرار ندارد و معمولاً کاربران برای شروع کار به سراغ گزینه‌های دیگری مثل هوش مصنوعی Midjourney یا Craiyon می‌روند.

کار با ابزار Craiyon نسبت به سایر گزینه‌های موجود بسیار آسان‌تر است؛ زیرا با مراجعه به سایت آن می‌توان حتی بدون ساخت حساب کاربری، اقدام به تبدیل متن به عکس کرد. اما خروجی‌های هوش مصنوعی مذکور، دقت چندان بالایی ندارد و همین مسئله موجب شده است تا کاربران بیشتری به‌سوی Midjourney سوق پیدا کنند. جالب است بدانید که تصویر ساخته‌شده با هوش مصنوعی مذکور توانست در یک جشنواره هنری مقام اول را به خود اختصاص دهد.

شایان ذکر است که برخلاف اغلب پلتفرم‌های فعلی، کاربران هنگام استفاده از Midjourney می‌توانند از چهره افراد مشهور هم خروجی تهیه کنند. اغلب تصاویر ساخته‌شده توسط آن استایل هنری خاصی دارند و چندان واقع‌گرایانه به‌نظر نمی‌رسند؛ اما با واردکردن جزئیات دقیق‌تر، امکان کنترل بیشتر روی استایل تصاویر وجود خواهد داشت. توجه داشته باشید که تنها ۲۵ تصویر اول ساخته‌شده با این هوش مصنوعی رایگان خواهد بود و برای ادامه کار باید ۱۰ دلار در ماه به‌ازای ۲۰۰ فایل پرداخت کنید.

آموزش کار با هوش مصنوعی Midjourney

هوش مصنوعی Midjourney بر بستر پلتفرم دیسکورد فعالیت دارد و نرم‌افزار یا وب‌سایت جداگانه‌ای برای بهره‌مندی از قابلیت‌های آن در نظر گرفته نشده است. دلیل این امر تأکید سازندگان پروژه به اجتماعی‌محور بودن آن است؛ به‌طوری که کاربران می‌توانند تصاویر ساخته‌شده توسط دیگر افراد را مشاهده کنند و از توضیحات آن‌ها برای ساخت خروجی‌های دیگر الهام بگیرند.

برای شروع کار با مراجعه به وب‌سایت Discord.com یک حساب کاربری رایگان برای خود ایجاد کنید و وارد آن شوید. دیسکورد در قالب نسخه تحت وب و اپلیکیشن دسکتاپ یا موبایل در دسترس قرار دارد.
وارد وب‌سایت Midjourney.com شوید و روی گزینه Join the beta کلیک کنید. با زدن گزینه گفته‌شده، به‌صورت خودکار یک دعوتنامه در دیسکورد برای شما ارسال می‌شود.
درخواست دعوت دریافتی در دیسکورد را با زدن گزینه Accept Invite در اپلیکیشن یا نسخه تحت وب، قبول کنید و سپس گزینه Continue to Discord را انتخاب نمایید.

بعد از بازشدن اپلیکیشن دیسکورد به‌شکل خودکار، روی آیکن Midjourney (قایق سفید) از پنل سمت چپ کلیک نمایید.
در داخل کانال‌های Midjourney به‌دنبال عنوان Newcommer Rooms بگردید و سپس یکی از آن‌ها را (مثلاًnewbies 101) را انتخاب کنید.

اکنون قادر خواهید بود از قابلیت تبدیل متن به عکس این ابزار استفاده کنید؛ اما همان‌طور که در قبل اشاره شد، توجه داشته باشید که تنها ۲۵ تصویر رایگان در اختیار شما قرار می‌گیرد.
در داخل چت باکس اتاق انتخاب‌شده، عبارت imagine/ را تایپ کنید. پس از وارد‌کردن این دستور، قادر خواهید بود توضیحات موردنظر را که می‌خواهید به تصویر تبدیلشان کنید، وارد کنید. هرچه جزئیات بیشتری در اختیار هوش مصنوعی قرار دهید، نتیجه مطلوب‌تری هم دریافت خواهید کرد.
پس از اتمام نوشتن توضیحات، کلید Enter را بزنید تا پیام ارسال شود.

کمی صبر کنید تا فرایند ساخت تصاویر براساس توضیحات واردشده به اتمام برسد. پس از اتمام آن، چندین حالت مختلف از تصاویر ایجادشده توسط هوش مصنوعی برای شما در قسمت گفت‌وگو ارسال می‌شود.
در پایین تصاویر چندین کلید با عناوین U و V به‌همراه اعداد مشاهده می‌شوند. این کلید‌ها به‌ترتیب برای بزرگ‌تر‌کردن یک تصویر یا ساخت یک تصویر جدید براساس مورد انتخاب‌شده، کاربرد دارند.
برای مثال اگر کلید U2 را بزنید، تصویر دوم بزرگ‌تر خواهد شد و اگر کلید V4 را بزنید، تصاویر جدیدی براساس تصویر چهارم ایجاد می‌شوند.
همچنین یک کلید دیگر برای رفرش‌کردن نتیجه در پایین تصاویر به‌چشم می‌خورد که با کلیک روی آن می‌توانید نتایج جدیدی را دریافت کنید. توجه داشته باشید با هر بار استفاده از کلید رفرش یا V، یک واحد از اعتبار رایگان شما کم خواهد شد.

اگر روی کلید U کلیک کنید، چندین گزینه متفاوت مشاهده خواهید کرد که هر کدام عملکرد متفاوتی خواهند داشت. برای مثال گزینه Upscale to Max موجب بزرگ‌ترشدن تصویر تا بیشترین حد ممکن (1664 در 1664 پیکسل) می‌شود و گزینه Light Upscale Redo هم تصویر را با جزئیات کمتری بزرگ می‌کند.
پس از اتمام کار می‌توانید تصویر خروجی را با زدن ایموجی پاکت نامه (✉️) برای خود ارسال کنید. سپس می‌توانید آن را ذخیره یا دانلود نمایید. تصاویری که بزرگ شده باشند، در داخل گالری وب‌سایت Midjourney هم قابل مشاهده خواهند بود.

دستورات کاربردی در Midjourney

هنگام استفاده از هوش مصنوعی Midjourney می‌توانید از دستورات و پارامترهایی برای بهبود خروجی، بهره بگیرید. در پایین به برخی از مهم‌ترین دستورات و عملکرد آن‌ها اشاره شده است.

imagine/ مهم‌ترین دستور در Midjourney است که پس از آن توضیحات مربوطه برای ساخت تصویر نوشته می‌شود.
help/ برای نمایش اطلاعات و نکات کاربردی درباره بات Midjourney کاربرد دارد.
info/ برای نمایش پروفایل، طرح کاربری، اعتبار باقی‌مانده و… استفاده می‌شود.
subscribe/ یک لینک اختصاصی برای حساب کاربری دیسکورد فعلی شما ایجاد می‌کند و نیاز به ورود جداگانه از طریق وب‌سایت را از بین می‌برد.
relax/ اگر حساب کاربری پولی داشته باشید، با فعال‌کردن این حالت می‌توانید بدون کم‌شدن از اعتبار، خروجی دریافت کنید؛ اما زمان موردنیاز برای ساختن تصاویر طولانی‌تر خواهد شد.
private/ در این حالت شما تنها می‌توانید خروجی تصاویر خود را مشاهده کنید؛ اما بهره‌مندی از آن ماهانه ۲۰ دلار هزینه در پی خواهد داشت.

همان‌طور که قبل‌تر اشاره شد، توضیحات موردنظر پس از دستور /imagine وارد می‌شوند. همچنین با تعیین‌کردن پارامترهایی، می‌توان نتیجه دقیق‌تری را دریافت نمود. در پایین تعدادی از پارامترهای مرتبط با دستور مذکور توضیح داده شده‌اند.

beta– پارامتری برای استفاده از یک الگوریتم آزمایشی جدید است. این الگوریتم به زمان بیشتری برای ارائه خروجی نیاز خواهد داشت و تنها ۲ تصویر ایجاد خواهد کرد. همچنین برخی دیگر از پارامترها به‌صورت هم‌زمان با آن قابل‌استفاده نخواهند بود.
hd– برای استفاده از یک الگوریتم متفاوت و قدیمی‌تر کاربرد است که گزینه بهتری برای تصاویر بزرگ با موضوعات انتزاعی یا منظره به‌ شمار می‌رود. این الگوریتم به‌صورت خودکار تصاویری با رزولوشن بالاتر بدون نیاز به Upscale ایجاد می‌کند.
aspect– یا ar– برای ایجاد خروجی با نسبت تصویر مشخص به‌کار می‌رود. برای مثال –ar 16:9 اقدام به ارائه تصویری با نسبت ۱۶ به ۹ می‌کند.
w– و h– برای تعیین رزولوشن دقیق خروجی مورد استفاده قرار می‌گیرد. برای مثال –w 256 موجب می‌شود تا عرض تصویر برابر با ۲۵۶ پیکسل باشد. مقادیر وارد‌شده هم باید در بازه ۲۵۶ الی ۲۰۳۴ پیکسل قرار بگیرند.
stylize– یا s- برای تعیین مقدار هنری بودن خروجی کاربرد دارد. پس از آن باید مقدار عددی مورد‌نظر که بین بازه ۶۲۵ الی ۶۰۰۰۰ است، ذکر شود. کمترین مقدار ممکن s– 625 است و هرچه مقدار وارد‌شده کمتر باشد، خروجی نزدیک‌تری به توضیحات کاربر ارائه می‌کند.
quality– یا q– برای تنظیم سرعت ساخت تصاویر استفاده می‌شود و مقدار آن بین 0.25 تا 5 است. بیشترین سرعت با –q 0.25 و کمترین سرعت با –q 5 تنظیم می‌شود.