Telegram Group & Telegram Channel
می‌خوام یه تجربه باحال از مقایسه ابزارهای تولید تصویر با هوش مصنوعی رو باهاتون به اشتراک بذارم! تو این پست قراره سه ابزار معروف، یعنی GPT-4o، Midjourney 7 و Flux رو با یه پرامپت (Prompt) مشخص تست کنیم و ببینیم هر کدوم چه نقاط قوت و ضعفی دارن.

هدفمون اینه که یه پرتره تکی به سبک یه شوت (Shoot) برای مجله وُگ (Vogue) بسازیم. حالا بریم سراغ پرامپت و جزئیاتش!

پرامپت اینه:
photograph of an alternative female with an orange bandana, light brown long hair, clear frame glasses, septum piecing, beige overalls hanging off one shoulder, a white tube top underneath, she is sitting in her apartment on a bohemian rug, in the style of a vogue magazine shoot

خب، حالا بیایم نتیجه هر ابزار رو با هم بررسی کنیم.

اولین ابزار GPT-4o هست. این ابزار تو انسجام (Coherence) واقعاً عالی عمل کرد. سوراخ سپتوم و لباس‌ها دقیقاً همون‌جوری شدن که تو پرامپت گفتیم. پالت رنگی و گریدینگ (Color Palette/Grading) هم خیلی به سبک ووگ نزدیک بود و حس حرفه‌ای بودن رو منتقل می‌کرد. ولی یه سری ضعف هم داشت؛ مثلاً تتوها (Tattoos) یه کم زیادی تمیز و تازه به نظر می‌اومدن و انگار همه‌شون شبیه هم بودن. آپارتمان هم یه حس شخصی و گرم رو منتقل نمی‌کرد، که البته این ممکنه به خاطر سبک خود پرامپت باشه.

ابزار بعدی Midjourney هست. این ابزار حس و حال (Vibes) خیلی قوی‌ای داره و کارش حسابی هنریه. حس متفاوتی نسبت به بقیه ابزارها بهت می‌ده و انگار یه اثر هنری خلق می‌کنه. ولی از نظر انسجام یه کم ضعیفه. مثلاً سوراخ سپتوم رو کلاً نذاشته بود. ژست (Posing) دختر هم اولش خوب به نظر می‌اومد، ولی وقتی بیشتر دقت می‌کنی، یه کم مصنوعی و غیرطبیعی حس می‌شه.

آخرین ابزار Flux هست. این ابزار یه تعادل خوبی بین انسجام و حس هنری ایجاد کرد. نه خیلی مثل GPT-4o دقیق بود، نه خیلی مثل Midjourney هنری. یه نتیجه متعادل بهت می‌ده. ولی یه مشکلش اینه که مدل‌های زن تو Flux معمولاً شبیه همن. به این می‌گن "چهره فلوکس" (Flux Face). اگه پرامپت‌های زیادی باهاش اجرا کنی، می‌بینی که مدل‌هاش هیچ‌وقت به یه جای جالب یا منحصربه‌فرد نمی‌رسن و یه جورایی تکراری می‌شن.

خب، حالا بیایم یه جمع‌بندی کنیم. اگه دنبال انسجام و دقت بالایی، GPT-4o بهترین انتخابه. این ابزار دقیقاً همون چیزی رو که تو پرامپت می‌گی بهت می‌ده، پس با اعتماد به نفس پرامپت بده، ولی یه کم با احتیاط، چون واقعاً همون چیزی که می‌گی رو می‌سازه.

اگه دنبال حس هنری و یه نتیجه متفاوت و خلاقانه‌ای، Midjourney گزینه خوبیه، ولی باید آماده باشی که همیشه به قوانین پرامپتت پایبند نباشه. پس باهاش تجربه کن و خودت رو برای احتمالات پیش بینی نشده آماده کن.

مدل Flux هم یه تعادل بین این دو تا مدل داره، ولی اگه ورودی‌های اضافی بهش ندی، معمولاً یه مدل و چهره تکراری تحویلت می‌ده.

✈️@mohammad_zammani
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1022👏1



group-telegram.com/Mohammad_zammani/4615
Create:
Last Update:

می‌خوام یه تجربه باحال از مقایسه ابزارهای تولید تصویر با هوش مصنوعی رو باهاتون به اشتراک بذارم! تو این پست قراره سه ابزار معروف، یعنی GPT-4o، Midjourney 7 و Flux رو با یه پرامپت (Prompt) مشخص تست کنیم و ببینیم هر کدوم چه نقاط قوت و ضعفی دارن.

هدفمون اینه که یه پرتره تکی به سبک یه شوت (Shoot) برای مجله وُگ (Vogue) بسازیم. حالا بریم سراغ پرامپت و جزئیاتش!

پرامپت اینه:

photograph of an alternative female with an orange bandana, light brown long hair, clear frame glasses, septum piecing, beige overalls hanging off one shoulder, a white tube top underneath, she is sitting in her apartment on a bohemian rug, in the style of a vogue magazine shoot

خب، حالا بیایم نتیجه هر ابزار رو با هم بررسی کنیم.

اولین ابزار GPT-4o هست. این ابزار تو انسجام (Coherence) واقعاً عالی عمل کرد. سوراخ سپتوم و لباس‌ها دقیقاً همون‌جوری شدن که تو پرامپت گفتیم. پالت رنگی و گریدینگ (Color Palette/Grading) هم خیلی به سبک ووگ نزدیک بود و حس حرفه‌ای بودن رو منتقل می‌کرد. ولی یه سری ضعف هم داشت؛ مثلاً تتوها (Tattoos) یه کم زیادی تمیز و تازه به نظر می‌اومدن و انگار همه‌شون شبیه هم بودن. آپارتمان هم یه حس شخصی و گرم رو منتقل نمی‌کرد، که البته این ممکنه به خاطر سبک خود پرامپت باشه.

ابزار بعدی Midjourney هست. این ابزار حس و حال (Vibes) خیلی قوی‌ای داره و کارش حسابی هنریه. حس متفاوتی نسبت به بقیه ابزارها بهت می‌ده و انگار یه اثر هنری خلق می‌کنه. ولی از نظر انسجام یه کم ضعیفه. مثلاً سوراخ سپتوم رو کلاً نذاشته بود. ژست (Posing) دختر هم اولش خوب به نظر می‌اومد، ولی وقتی بیشتر دقت می‌کنی، یه کم مصنوعی و غیرطبیعی حس می‌شه.

آخرین ابزار Flux هست. این ابزار یه تعادل خوبی بین انسجام و حس هنری ایجاد کرد. نه خیلی مثل GPT-4o دقیق بود، نه خیلی مثل Midjourney هنری. یه نتیجه متعادل بهت می‌ده. ولی یه مشکلش اینه که مدل‌های زن تو Flux معمولاً شبیه همن. به این می‌گن "چهره فلوکس" (Flux Face). اگه پرامپت‌های زیادی باهاش اجرا کنی، می‌بینی که مدل‌هاش هیچ‌وقت به یه جای جالب یا منحصربه‌فرد نمی‌رسن و یه جورایی تکراری می‌شن.

خب، حالا بیایم یه جمع‌بندی کنیم. اگه دنبال انسجام و دقت بالایی، GPT-4o بهترین انتخابه. این ابزار دقیقاً همون چیزی رو که تو پرامپت می‌گی بهت می‌ده، پس با اعتماد به نفس پرامپت بده، ولی یه کم با احتیاط، چون واقعاً همون چیزی که می‌گی رو می‌سازه.

اگه دنبال حس هنری و یه نتیجه متفاوت و خلاقانه‌ای، Midjourney گزینه خوبیه، ولی باید آماده باشی که همیشه به قوانین پرامپتت پایبند نباشه. پس باهاش تجربه کن و خودت رو برای احتمالات پیش بینی نشده آماده کن.

مدل Flux هم یه تعادل بین این دو تا مدل داره، ولی اگه ورودی‌های اضافی بهش ندی، معمولاً یه مدل و چهره تکراری تحویلت می‌ده.

✈️@mohammad_zammani

BY هوش مصنوعی | دیجیتال مارکتینگ | محمد زمانی






Share with your friend now:
group-telegram.com/Mohammad_zammani/4615

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Following this, Sebi, in an order passed in January 2022, established that the administrators of a Telegram channel having a large subscriber base enticed the subscribers to act upon recommendations that were circulated by those administrators on the channel, leading to significant price and volume impact in various scrips. In view of this, the regulator has cautioned investors not to rely on such investment tips / advice received through social media platforms. It has also said investors should exercise utmost caution while taking investment decisions while dealing in the securities market. During the operations, Sebi officials seized various records and documents, including 34 mobile phones, six laptops, four desktops, four tablets, two hard drive disks and one pen drive from the custody of these persons. Multiple pro-Kremlin media figures circulated the post's false claims, including prominent Russian journalist Vladimir Soloviev and the state-controlled Russian outlet RT, according to the DFR Lab's report. And indeed, volatility has been a hallmark of the market environment so far in 2022, with the S&P 500 still down more than 10% for the year-to-date after first sliding into a correction last month. The CBOE Volatility Index, or VIX, has held at a lofty level of more than 30.
from nl


Telegram هوش مصنوعی | دیجیتال مارکتینگ | محمد زمانی
FROM American