Telegram Group & Telegram Channel
می‌خوام یه تجربه باحال از مقایسه ابزارهای تولید تصویر با هوش مصنوعی رو باهاتون به اشتراک بذارم! تو این پست قراره سه ابزار معروف، یعنی GPT-4o، Midjourney 7 و Flux رو با یه پرامپت (Prompt) مشخص تست کنیم و ببینیم هر کدوم چه نقاط قوت و ضعفی دارن.

هدفمون اینه که یه پرتره تکی به سبک یه شوت (Shoot) برای مجله وُگ (Vogue) بسازیم. حالا بریم سراغ پرامپت و جزئیاتش!

پرامپت اینه:
photograph of an alternative female with an orange bandana, light brown long hair, clear frame glasses, septum piecing, beige overalls hanging off one shoulder, a white tube top underneath, she is sitting in her apartment on a bohemian rug, in the style of a vogue magazine shoot

خب، حالا بیایم نتیجه هر ابزار رو با هم بررسی کنیم.

اولین ابزار GPT-4o هست. این ابزار تو انسجام (Coherence) واقعاً عالی عمل کرد. سوراخ سپتوم و لباس‌ها دقیقاً همون‌جوری شدن که تو پرامپت گفتیم. پالت رنگی و گریدینگ (Color Palette/Grading) هم خیلی به سبک ووگ نزدیک بود و حس حرفه‌ای بودن رو منتقل می‌کرد. ولی یه سری ضعف هم داشت؛ مثلاً تتوها (Tattoos) یه کم زیادی تمیز و تازه به نظر می‌اومدن و انگار همه‌شون شبیه هم بودن. آپارتمان هم یه حس شخصی و گرم رو منتقل نمی‌کرد، که البته این ممکنه به خاطر سبک خود پرامپت باشه.

ابزار بعدی Midjourney هست. این ابزار حس و حال (Vibes) خیلی قوی‌ای داره و کارش حسابی هنریه. حس متفاوتی نسبت به بقیه ابزارها بهت می‌ده و انگار یه اثر هنری خلق می‌کنه. ولی از نظر انسجام یه کم ضعیفه. مثلاً سوراخ سپتوم رو کلاً نذاشته بود. ژست (Posing) دختر هم اولش خوب به نظر می‌اومد، ولی وقتی بیشتر دقت می‌کنی، یه کم مصنوعی و غیرطبیعی حس می‌شه.

آخرین ابزار Flux هست. این ابزار یه تعادل خوبی بین انسجام و حس هنری ایجاد کرد. نه خیلی مثل GPT-4o دقیق بود، نه خیلی مثل Midjourney هنری. یه نتیجه متعادل بهت می‌ده. ولی یه مشکلش اینه که مدل‌های زن تو Flux معمولاً شبیه همن. به این می‌گن "چهره فلوکس" (Flux Face). اگه پرامپت‌های زیادی باهاش اجرا کنی، می‌بینی که مدل‌هاش هیچ‌وقت به یه جای جالب یا منحصربه‌فرد نمی‌رسن و یه جورایی تکراری می‌شن.

خب، حالا بیایم یه جمع‌بندی کنیم. اگه دنبال انسجام و دقت بالایی، GPT-4o بهترین انتخابه. این ابزار دقیقاً همون چیزی رو که تو پرامپت می‌گی بهت می‌ده، پس با اعتماد به نفس پرامپت بده، ولی یه کم با احتیاط، چون واقعاً همون چیزی که می‌گی رو می‌سازه.

اگه دنبال حس هنری و یه نتیجه متفاوت و خلاقانه‌ای، Midjourney گزینه خوبیه، ولی باید آماده باشی که همیشه به قوانین پرامپتت پایبند نباشه. پس باهاش تجربه کن و خودت رو برای احتمالات پیش بینی نشده آماده کن.

مدل Flux هم یه تعادل بین این دو تا مدل داره، ولی اگه ورودی‌های اضافی بهش ندی، معمولاً یه مدل و چهره تکراری تحویلت می‌ده.

✈️@mohammad_zammani
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1022👏1



group-telegram.com/Mohammad_zammani/4615
Create:
Last Update:

می‌خوام یه تجربه باحال از مقایسه ابزارهای تولید تصویر با هوش مصنوعی رو باهاتون به اشتراک بذارم! تو این پست قراره سه ابزار معروف، یعنی GPT-4o، Midjourney 7 و Flux رو با یه پرامپت (Prompt) مشخص تست کنیم و ببینیم هر کدوم چه نقاط قوت و ضعفی دارن.

هدفمون اینه که یه پرتره تکی به سبک یه شوت (Shoot) برای مجله وُگ (Vogue) بسازیم. حالا بریم سراغ پرامپت و جزئیاتش!

پرامپت اینه:

photograph of an alternative female with an orange bandana, light brown long hair, clear frame glasses, septum piecing, beige overalls hanging off one shoulder, a white tube top underneath, she is sitting in her apartment on a bohemian rug, in the style of a vogue magazine shoot

خب، حالا بیایم نتیجه هر ابزار رو با هم بررسی کنیم.

اولین ابزار GPT-4o هست. این ابزار تو انسجام (Coherence) واقعاً عالی عمل کرد. سوراخ سپتوم و لباس‌ها دقیقاً همون‌جوری شدن که تو پرامپت گفتیم. پالت رنگی و گریدینگ (Color Palette/Grading) هم خیلی به سبک ووگ نزدیک بود و حس حرفه‌ای بودن رو منتقل می‌کرد. ولی یه سری ضعف هم داشت؛ مثلاً تتوها (Tattoos) یه کم زیادی تمیز و تازه به نظر می‌اومدن و انگار همه‌شون شبیه هم بودن. آپارتمان هم یه حس شخصی و گرم رو منتقل نمی‌کرد، که البته این ممکنه به خاطر سبک خود پرامپت باشه.

ابزار بعدی Midjourney هست. این ابزار حس و حال (Vibes) خیلی قوی‌ای داره و کارش حسابی هنریه. حس متفاوتی نسبت به بقیه ابزارها بهت می‌ده و انگار یه اثر هنری خلق می‌کنه. ولی از نظر انسجام یه کم ضعیفه. مثلاً سوراخ سپتوم رو کلاً نذاشته بود. ژست (Posing) دختر هم اولش خوب به نظر می‌اومد، ولی وقتی بیشتر دقت می‌کنی، یه کم مصنوعی و غیرطبیعی حس می‌شه.

آخرین ابزار Flux هست. این ابزار یه تعادل خوبی بین انسجام و حس هنری ایجاد کرد. نه خیلی مثل GPT-4o دقیق بود، نه خیلی مثل Midjourney هنری. یه نتیجه متعادل بهت می‌ده. ولی یه مشکلش اینه که مدل‌های زن تو Flux معمولاً شبیه همن. به این می‌گن "چهره فلوکس" (Flux Face). اگه پرامپت‌های زیادی باهاش اجرا کنی، می‌بینی که مدل‌هاش هیچ‌وقت به یه جای جالب یا منحصربه‌فرد نمی‌رسن و یه جورایی تکراری می‌شن.

خب، حالا بیایم یه جمع‌بندی کنیم. اگه دنبال انسجام و دقت بالایی، GPT-4o بهترین انتخابه. این ابزار دقیقاً همون چیزی رو که تو پرامپت می‌گی بهت می‌ده، پس با اعتماد به نفس پرامپت بده، ولی یه کم با احتیاط، چون واقعاً همون چیزی که می‌گی رو می‌سازه.

اگه دنبال حس هنری و یه نتیجه متفاوت و خلاقانه‌ای، Midjourney گزینه خوبیه، ولی باید آماده باشی که همیشه به قوانین پرامپتت پایبند نباشه. پس باهاش تجربه کن و خودت رو برای احتمالات پیش بینی نشده آماده کن.

مدل Flux هم یه تعادل بین این دو تا مدل داره، ولی اگه ورودی‌های اضافی بهش ندی، معمولاً یه مدل و چهره تکراری تحویلت می‌ده.

✈️@mohammad_zammani

BY هوش مصنوعی | دیجیتال مارکتینگ | محمد زمانی






Share with your friend now:
group-telegram.com/Mohammad_zammani/4615

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Either way, Durov says that he withdrew his resignation but that he was ousted from his company anyway. Subsequently, control of the company was reportedly handed to oligarchs Alisher Usmanov and Igor Sechin, both allegedly close associates of Russian leader Vladimir Putin. Andrey, a Russian entrepreneur living in Brazil who, fearing retaliation, asked that NPR not use his last name, said Telegram has become one of the few places Russians can access independent news about the war. Emerson Brooking, a disinformation expert at the Atlantic Council's Digital Forensic Research Lab, said: "Back in the Wild West period of content moderation, like 2014 or 2015, maybe they could have gotten away with it, but it stands in marked contrast with how other companies run themselves today." In addition, Telegram now supports the use of third-party streaming tools like OBS Studio and XSplit to broadcast live video, allowing users to add overlays and multi-screen layouts for a more professional look. The message was not authentic, with the real Zelenskiy soon denying the claim on his official Telegram channel, but the incident highlighted a major problem: disinformation quickly spreads unchecked on the encrypted app.
from kr


Telegram هوش مصنوعی | دیجیتال مارکتینگ | محمد زمانی
FROM American