group-telegram.com/PinkOrca/1106
Last Update:
🪓 چرا؟ چون چند تا ویدیو دیدم (تو جاهای مختلفی) که با یه پرامپتی اینا رو مقایسه میکردن و به نظرم واقعی نمیومد با توجه به تجربه خودم... حالا همون پرامپت رو خودمم تست میکنم.
🔧 پرامپت:Write an HTML program that simulates a ball bouncing inside a spinning hexagon, with gravity and friction affecting its movement, ensuring realistic bounces off the rotating walls.
🏆 بهترین عملکرد رو Claude داشت با اختلاف فاحش،
بعدش ChatGPT رو حالت reasoning. البته از هر چند بار درخواست یه بار ممکنه خوب در بیاد، مثلا تو همین ویدیو که تست کردم ChatGPT مثل تستهای قبلی حداقل کارایی هم نداشت و چون شرایط همشون برابر بود فرصت دوباره ندادم اینجا.
هرچند Claude هم تو یه تست قبل از رکورد ویدیو بهتر از این بود! (اینم شانس مایه(
بدترین خروجی هم DeepSeek R1 داشت که چندین دقیقه داشت فکر میکرد و خروجی نمیداد (با خودش کلنجار میرفت) و در نهایت بیخیالش شدم قبل از اینکه شب بشه :)
خروجیها:
chat.deepseek.com -> 0:02
copilot.microsoft.com -> 0:16
chatgpt.com -> 0:27
grok.com -> 0:35
chat.jabirproject.org -> 0:42
gemini.google.com -> 0:54
chat.mistral.ai/chat -> 1:08
این ۲ مورد رو از پرامپت تا اجرا میتونید تو ویدیو ببینید، لحظه اجرا:
ChatGPT (reasoning) -> 2:25
Claude 3.7 sonnet -> 3:48
‼️ مدلهایی که برای همشون استفاده شده، بهترین مدل در دسترسشون بوده، مثلا برای grok که خوب هم نبود زیاد، مدل grok 3 بود (آخرین مدلش) و بقیه هم به همین شکل...
📌 فایلهای خروجی همشون رو تو کامنت اول میفرستم. هیچ فایلی ادیت نشده جز مرتبسازی (Ctrl+Shift+i).
💢 این پست هیچکدوم از مدلهای مطرح رو زیر سوال نمیبره، صرفا مقایسه خروجیهاست به شکل واقعی و با توجه به همچین پرامپت ترند شدهای که خودشم جای کار داره!
#هوش_مصنوعی
~> @PinkOrca