Telegram Group & Telegram Channel
Media is too big
VIEW IN TELEGRAM
تو این ویدیو چند تا ChatBot مختلف رو تست کردم تا ببینم هرکدوم چه عملکردی دارن.
🪓 چرا؟ چون چند تا ویدیو دیدم (تو جاهای مختلفی) که با یه پرامپتی اینا رو مقایسه می‌کردن و به نظرم واقعی نمیومد با توجه به تجربه خودم... حالا همون پرامپت رو خودمم تست می‌کنم.

🔧 پرامپت:
Write an HTML program that simulates a ball bouncing inside a spinning hexagon, with gravity and friction affecting its movement, ensuring realistic bounces off the rotating walls.

🏆 بهترین عملکرد رو Claude داشت با اختلاف فاحش،
بعدش ChatGPT رو حالت reasoning. البته از هر چند بار درخواست یه بار ممکنه خوب در بیاد، مثلا تو همین ویدیو که تست کردم ChatGPT مثل تست‌های قبلی حداقل کارایی هم نداشت و چون شرایط همشون برابر بود فرصت دوباره ندادم اینجا.
هرچند Claude هم تو یه تست قبل از رکورد ویدیو بهتر از این بود! (اینم شانس مایه(🙃) تو ویدیو همگی داغون می‌شن) بقیشون هم چنگی به دل نمی‌زدن...
بدترین خروجی هم DeepSeek R1 داشت که چندین دقیقه داشت فکر می‌کرد و خروجی نمی‌داد (با خودش کلنجار می‌رفت) و در نهایت بیخیالش شدم قبل از اینکه شب بشه :)

خروجی‌ها:
chat.deepseek.com -> 0:02
copilot.microsoft.com -> 0:16
chatgpt.com -> 0:27
grok.com -> 0:35
chat.jabirproject.org -> 0:42
gemini.google.com -> 0:54
chat.mistral.ai/chat -> 1:08

این ۲ مورد رو از پرامپت تا اجرا می‌تونید تو ویدیو ببینید، لحظه اجرا:
ChatGPT (reasoning) -> 2:25
Claude 3.7 sonnet -> 3:48


‼️ مدل‌هایی که برای همشون استفاده شده، بهترین مدل در دسترسشون بوده، مثلا برای grok که خوب هم نبود زیاد، مدل grok 3 بود (آخرین مدلش) و بقیه هم به همین شکل...
📌 فایل‌های خروجی همشون رو تو کامنت اول می‌فرستم. هیچ فایلی ادیت نشده جز مرتب‌سازی (Ctrl+Shift+i).
💢 این پست هیچکدوم از مدل‌های مطرح رو زیر سوال نمی‌بره، صرفا مقایسه خروجی‌هاست به شکل واقعی و با توجه به همچین پرامپت ترند شده‌ای که خودشم جای کار داره!
#هوش_مصنوعی
~> @PinkOrca 🩷
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13👍7



group-telegram.com/PinkOrca/1106
Create:
Last Update:

تو این ویدیو چند تا ChatBot مختلف رو تست کردم تا ببینم هرکدوم چه عملکردی دارن.
🪓 چرا؟ چون چند تا ویدیو دیدم (تو جاهای مختلفی) که با یه پرامپتی اینا رو مقایسه می‌کردن و به نظرم واقعی نمیومد با توجه به تجربه خودم... حالا همون پرامپت رو خودمم تست می‌کنم.

🔧 پرامپت:
Write an HTML program that simulates a ball bouncing inside a spinning hexagon, with gravity and friction affecting its movement, ensuring realistic bounces off the rotating walls.

🏆 بهترین عملکرد رو Claude داشت با اختلاف فاحش،
بعدش ChatGPT رو حالت reasoning. البته از هر چند بار درخواست یه بار ممکنه خوب در بیاد، مثلا تو همین ویدیو که تست کردم ChatGPT مثل تست‌های قبلی حداقل کارایی هم نداشت و چون شرایط همشون برابر بود فرصت دوباره ندادم اینجا.
هرچند Claude هم تو یه تست قبل از رکورد ویدیو بهتر از این بود! (اینم شانس مایه(🙃) تو ویدیو همگی داغون می‌شن) بقیشون هم چنگی به دل نمی‌زدن...
بدترین خروجی هم DeepSeek R1 داشت که چندین دقیقه داشت فکر می‌کرد و خروجی نمی‌داد (با خودش کلنجار می‌رفت) و در نهایت بیخیالش شدم قبل از اینکه شب بشه :)

خروجی‌ها:
chat.deepseek.com -> 0:02
copilot.microsoft.com -> 0:16
chatgpt.com -> 0:27
grok.com -> 0:35
chat.jabirproject.org -> 0:42
gemini.google.com -> 0:54
chat.mistral.ai/chat -> 1:08

این ۲ مورد رو از پرامپت تا اجرا می‌تونید تو ویدیو ببینید، لحظه اجرا:
ChatGPT (reasoning) -> 2:25
Claude 3.7 sonnet -> 3:48


‼️ مدل‌هایی که برای همشون استفاده شده، بهترین مدل در دسترسشون بوده، مثلا برای grok که خوب هم نبود زیاد، مدل grok 3 بود (آخرین مدلش) و بقیه هم به همین شکل...
📌 فایل‌های خروجی همشون رو تو کامنت اول می‌فرستم. هیچ فایلی ادیت نشده جز مرتب‌سازی (Ctrl+Shift+i).
💢 این پست هیچکدوم از مدل‌های مطرح رو زیر سوال نمی‌بره، صرفا مقایسه خروجی‌هاست به شکل واقعی و با توجه به همچین پرامپت ترند شده‌ای که خودشم جای کار داره!
#هوش_مصنوعی
~> @PinkOrca 🩷

BY Pink Orca | پینک اورکا


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/PinkOrca/1106

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Under the Sebi Act, the regulator has the power to carry out search and seizure of books, registers, documents including electronics and digital devices from any person associated with the securities market. Telegram was founded in 2013 by two Russian brothers, Nikolai and Pavel Durov. Friday’s performance was part of a larger shift. For the week, the Dow, S&P 500 and Nasdaq fell 2%, 2.9%, and 3.5%, respectively. The message was not authentic, with the real Zelenskiy soon denying the claim on his official Telegram channel, but the incident highlighted a major problem: disinformation quickly spreads unchecked on the encrypted app. Telegram was co-founded by Pavel and Nikolai Durov, the brothers who had previously created VKontakte. VK is Russia’s equivalent of Facebook, a social network used for public and private messaging, audio and video sharing as well as online gaming. In January, SimpleWeb reported that VK was Russia’s fourth most-visited website, after Yandex, YouTube and Google’s Russian-language homepage. In 2016, Forbes’ Michael Solomon described Pavel Durov (pictured, below) as the “Mark Zuckerberg of Russia.”
from hk


Telegram Pink Orca | پینک اورکا
FROM American