Telegram Group & Telegram Channel
Media is too big
VIEW IN TELEGRAM
تو این ویدیو چند تا ChatBot مختلف رو تست کردم تا ببینم هرکدوم چه عملکردی دارن.
🪓 چرا؟ چون چند تا ویدیو دیدم (تو جاهای مختلفی) که با یه پرامپتی اینا رو مقایسه می‌کردن و به نظرم واقعی نمیومد با توجه به تجربه خودم... حالا همون پرامپت رو خودمم تست می‌کنم.

🔧 پرامپت:
Write an HTML program that simulates a ball bouncing inside a spinning hexagon, with gravity and friction affecting its movement, ensuring realistic bounces off the rotating walls.

🏆 بهترین عملکرد رو Claude داشت با اختلاف فاحش،
بعدش ChatGPT رو حالت reasoning. البته از هر چند بار درخواست یه بار ممکنه خوب در بیاد، مثلا تو همین ویدیو که تست کردم ChatGPT مثل تست‌های قبلی حداقل کارایی هم نداشت و چون شرایط همشون برابر بود فرصت دوباره ندادم اینجا.
هرچند Claude هم تو یه تست قبل از رکورد ویدیو بهتر از این بود! (اینم شانس مایه(🙃) تو ویدیو همگی داغون می‌شن) بقیشون هم چنگی به دل نمی‌زدن...
بدترین خروجی هم DeepSeek R1 داشت که چندین دقیقه داشت فکر می‌کرد و خروجی نمی‌داد (با خودش کلنجار می‌رفت) و در نهایت بیخیالش شدم قبل از اینکه شب بشه :)

خروجی‌ها:
chat.deepseek.com -> 0:02
copilot.microsoft.com -> 0:16
chatgpt.com -> 0:27
grok.com -> 0:35
chat.jabirproject.org -> 0:42
gemini.google.com -> 0:54
chat.mistral.ai/chat -> 1:08

این ۲ مورد رو از پرامپت تا اجرا می‌تونید تو ویدیو ببینید، لحظه اجرا:
ChatGPT (reasoning) -> 2:25
Claude 3.7 sonnet -> 3:48


‼️ مدل‌هایی که برای همشون استفاده شده، بهترین مدل در دسترسشون بوده، مثلا برای grok که خوب هم نبود زیاد، مدل grok 3 بود (آخرین مدلش) و بقیه هم به همین شکل...
📌 فایل‌های خروجی همشون رو تو کامنت اول می‌فرستم. هیچ فایلی ادیت نشده جز مرتب‌سازی (Ctrl+Shift+i).
💢 این پست هیچکدوم از مدل‌های مطرح رو زیر سوال نمی‌بره، صرفا مقایسه خروجی‌هاست به شکل واقعی و با توجه به همچین پرامپت ترند شده‌ای که خودشم جای کار داره!
#هوش_مصنوعی
~> @PinkOrca 🩷
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13👍7



group-telegram.com/PinkOrca/1106
Create:
Last Update:

تو این ویدیو چند تا ChatBot مختلف رو تست کردم تا ببینم هرکدوم چه عملکردی دارن.
🪓 چرا؟ چون چند تا ویدیو دیدم (تو جاهای مختلفی) که با یه پرامپتی اینا رو مقایسه می‌کردن و به نظرم واقعی نمیومد با توجه به تجربه خودم... حالا همون پرامپت رو خودمم تست می‌کنم.

🔧 پرامپت:
Write an HTML program that simulates a ball bouncing inside a spinning hexagon, with gravity and friction affecting its movement, ensuring realistic bounces off the rotating walls.

🏆 بهترین عملکرد رو Claude داشت با اختلاف فاحش،
بعدش ChatGPT رو حالت reasoning. البته از هر چند بار درخواست یه بار ممکنه خوب در بیاد، مثلا تو همین ویدیو که تست کردم ChatGPT مثل تست‌های قبلی حداقل کارایی هم نداشت و چون شرایط همشون برابر بود فرصت دوباره ندادم اینجا.
هرچند Claude هم تو یه تست قبل از رکورد ویدیو بهتر از این بود! (اینم شانس مایه(🙃) تو ویدیو همگی داغون می‌شن) بقیشون هم چنگی به دل نمی‌زدن...
بدترین خروجی هم DeepSeek R1 داشت که چندین دقیقه داشت فکر می‌کرد و خروجی نمی‌داد (با خودش کلنجار می‌رفت) و در نهایت بیخیالش شدم قبل از اینکه شب بشه :)

خروجی‌ها:
chat.deepseek.com -> 0:02
copilot.microsoft.com -> 0:16
chatgpt.com -> 0:27
grok.com -> 0:35
chat.jabirproject.org -> 0:42
gemini.google.com -> 0:54
chat.mistral.ai/chat -> 1:08

این ۲ مورد رو از پرامپت تا اجرا می‌تونید تو ویدیو ببینید، لحظه اجرا:
ChatGPT (reasoning) -> 2:25
Claude 3.7 sonnet -> 3:48


‼️ مدل‌هایی که برای همشون استفاده شده، بهترین مدل در دسترسشون بوده، مثلا برای grok که خوب هم نبود زیاد، مدل grok 3 بود (آخرین مدلش) و بقیه هم به همین شکل...
📌 فایل‌های خروجی همشون رو تو کامنت اول می‌فرستم. هیچ فایلی ادیت نشده جز مرتب‌سازی (Ctrl+Shift+i).
💢 این پست هیچکدوم از مدل‌های مطرح رو زیر سوال نمی‌بره، صرفا مقایسه خروجی‌هاست به شکل واقعی و با توجه به همچین پرامپت ترند شده‌ای که خودشم جای کار داره!
#هوش_مصنوعی
~> @PinkOrca 🩷

BY Pink Orca | پینک اورکا


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/PinkOrca/1106

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

So, uh, whenever I hear about Telegram, it’s always in relation to something bad. What gives? "And that set off kind of a battle royale for control of the platform that Durov eventually lost," said Nathalie Maréchal of the Washington advocacy group Ranking Digital Rights. The Securities and Exchange Board of India (Sebi) had carried out a similar exercise in 2017 in a matter related to circulation of messages through WhatsApp. The picture was mixed overseas. Hong Kong’s Hang Seng Index fell 1.6%, under pressure from U.S. regulatory scrutiny on New York-listed Chinese companies. Stocks were more buoyant in Europe, where Frankfurt’s DAX surged 1.4%. The regulator said it had received information that messages containing stock tips and other investment advice with respect to selected listed companies are being widely circulated through websites and social media platforms such as Telegram, Facebook, WhatsApp and Instagram.
from tw


Telegram Pink Orca | پینک اورکا
FROM American