Telegram Group Search
▫️دانشگاه آزاد به دنبال جایزه نوبل؛ سرمایه‌گذاری در سطح جهانی

بیژن رنجبر، قائم‌مقام رئیس دانشگاه آزاد اسلامی، اخیراً صحبت‌های جالبی کرده است. از Grok 3 خواستم خلاصه و نکات مهم صحبت‌های ایشان را بنویسد:

۱. هدف‌گذاری برای مرجعیت علمی و جایزه نوبل

- سیاست جدید دانشگاه آزاد: سرمایه‌گذاری مالی و انسانی در سطح جوایز بین‌المللی مانند نوبل برای بازآفرینی جایگاه علمی ایران.

- تأکید بر مرجعیت علمی: ایران در گذشته خاستگاه تمدن و علم بوده و باید با تکیه بر ظرفیت‌های بومی و فرهنگی، دوباره به این جایگاه بازگردد.

۲. میراث تاریخی و تمدنی ایران

- ایران باستان: مراکز علمی مانند دانشگاه جندی‌شاپور، پیشرو در تولید و انتقال دانش در حوزه‌های پزشکی، نجوم، معماری و تعلیم و تربیت.

- پس از اسلام: تلفیق معارف اسلامی و میراث علمی ایران، منجر به شکوفایی علمی با محوریت ایران شد (بیت‌الحکمه، نظامیه، ظهور ابن‌سینا، خوارزمی و طوسی).

- تأثیر بر اروپا: نظامیه‌های ایرانی الگوی تأسیس دانشگاه‌هایی مانند بولونیا، سوربن و آکسفورد بودند.

۳. دوران افول و احیا

- حمله مغول‌ها: تخریب مراکز علمی و افول مرجعیت علمی ایران در قرن هفتم هجری.

- دوره ایلخانی: بازسازی علمی با تأسیس مراکزی مانند رصدخانه مراغه و ربع رشیدی.

- دوره صفویه: احیای هویت ملی و رشد علوم اسلامی، فلسفه و ادب.

- دوره قاجار و پهلوی: افول علمی به دلیل تقلید از غرب و بی‌توجهی به ظرفیت‌های بومی؛ نظام آموزشی ناکارآمد و بی‌سوادی گسترده تا پیش از انقلاب.

۴. انقلاب اسلامی و خیزش علمی

- پس از انقلاب: آغاز دوباره پیشرفت علمی و تلاش برای بازگشت به جایگاه مرجعیت علمی.

- دیدگاه رهبری: تأکید بر مرجعیت علمی از سال ۱۳۸۴ با دو هدف: ۱) قرار گرفتن در میان سرآمدان جهانی، ۲) حل مسائل کلیدی کشور.

- رستاخیز علمی: پیشرفت‌های علمی پس از انقلاب تنها آغاز راه بوده و فاصله زیادی تا قله‌های جهانی باقی است.

۵. نقش دانشگاه آزاد در مرجعیت علمی

- سند تحول دانشگاه: حرکت به سمت بازتولید مرجعیت علمی با تکیه بر ظرفیت‌های بومی و اسلامی.

- جهاد علمی: لزوم تلاش نخبگان، اساتید و دانشجویان برای دستیابی به قله‌های علمی.

- زبان علم فارسی: تأکید بر تبدیل زبان فارسی به زبان علم برای تحقق مرجعیت علمی.

- انقلاب علمی: هدف، تولید نظریه و دانش نوین به جای صرف مقاله‌نویسی.

۶. مدل راهبردی تحول دانشگاه

- آموزش: اصلاح بسته‌های آموزشی با تمرکز بر الگوی شاگردپرور و تقویت مباحث اخلاقی و فرهنگی.

- پژوهش و فناوری: جهش در پژوهش‌های نوآورانه و مرزدانش‌محور.

- خودکفایی مالی: کاهش وابستگی به شهریه با درآمد از اقتصاد دانش‌بنیان و پیوند با صنعت.

۷. حمایت از پژوهشگران نخبه

- پژوهشگاه مرکزی: حمایت مالی فصلی (گرنت) از ۱۰۰ پژوهشگر نخبه برای تولید علم واقعی.

تقسیم‌بندی پژوهش‌ها:

۱. پژوهش‌های پایان‌نامه‌ای (حمایت معاونت‌های موضوعی).

۲. پژوهش‌های منجر به محصول (حمایت معاونت فناوری).

۳. پژوهش‌های بنیادی (حمایت پژوهشگاه اسلامی).

- سرمایه‌گذاری کلان: بودجه ۵۰۰ میلیارد تومانی برای حمایت از پژوهشگران در ۱۴ حوزه برتر علمی.

- تسهیلات مشابه فرهنگستان‌ها: ایجاد وضعیت «اعضای پیوسته» با حمایت‌های مالی و زیرساختی.

۸. علوم پایه و فناوری

- اهمیت علوم پایه: رکن اساسی پیشرفت علمی کشور و تمرکز دانشگاه برای ارتقاء جایگاه آن.

- توسعه فناوری: هدف‌گذاری برای تولید محصول و گسترش شبکه نوآوری باز.

۹. دیپلماسی علمی و همکاری‌های بین‌المللی

- پروژه‌های مشترک: آغاز پروژه‌های تحقیقاتی بین‌المللی با مشارکت ایران و سایر کشورها.

- حمایت از اساتید و دانشجویان: تأمین مالی مأموریت‌های علمی (تا یک سال) برای پروژه‌های مرز دانش.

- تقویت ارتباطات: تفاهم‌نامه‌های بین‌المللی و فرصت‌های مطالعاتی برای دانشجویان دکتری.

۱۰. ارتقای فرهنگ سازمانی و فضای انقلابی

- وظایف دانشگاه: تربیت متخصصان متعهد، انتقال علم، خدمت به نظام و مدیریت کارآمد.

- تحول ساختاری: ایجاد نظام آموزشی و پژوهشی پاسخگو با تمرکز بر توسعه فناوری و اقتصاد دانش‌بنیان.

- حفظ کیان دانشگاه: گسترش فضای انقلابی و وحدت در راستای اهداف علمی.

۱۱. چشم‌انداز ۱۴۱۵

- نقشه جامع علمی کشور: ترسیم مسیر علمی تا ۱۴۱۵ با اهداف و ارزیابی‌های مشخص.

- تمدن نوین اسلامی: حرکت علمی به‌عنوان الزام اصلی برای تحقق این هدف.

۱۲. سرآمدان علمی

- آیین‌نامه به‌روز شده: انتخاب بیش از ۷۰۰ پژوهشگر ممتاز با معیارهای سخت‌گیرانه.

- حمایت از پسادکتری: تقویت عضویت پیوسته در پژوهشگاه مرکزی برای پژوهشگران ویژه.

۱۳. سرمایه‌گذاری در سطح جهانی

- بودجه‌های کلان: حمایت مالی تا سقف ۷۰ میلیارد تومان برای پروژه‌های خاص.

- هدف‌گذاری جهانی: حضور فعال در ۲۰ جبهه تحقیقاتی برتر جهان و رقابت برای جوایز بین‌المللی.


🆔@irevidence
😁47👍81💔1
▫️افزایش مقالات بی‌کیفیت و سوءاستفاده از داده‌های عمومی و هوش مصنوعی

در ۱۴ مه ۲۰۲۵ مقاله‌ای تحت عنوان زیر در مجله Science منتشر شده است:

Low-quality papers are surging by exploiting public data sets and AI

در این مقاله به رشد مقالات بی‌کیفیتی اشاره شده است که با استفاده از مجموعه‌ داده‌های عمومی سلامت و هوش مصنوعی نوشته شده‌اند.

در سال‌های اخیر، سیل مقالات علمی کم‌کیفیت مبتنی بر مجموعه داده‌های سلامت عمومی، به‌ویژه NHANES (پیمایش ملی سلامت و تغذیه آمریکا)، توجه سردبیران و پژوهشگران را به خود جلب کرده است. مت اسپیک (Matt Spick)، متخصص آمار و کمک‌سردبیر مجله Scientific Reports، متوجه شد که مقالات با ساختار و موضوعات بسیار مشابه، به طور مکرر برای داوری ارسال می‌شوند؛ مقالاتی که همگی بر اساس داده‌های NHANES نوشته شده‌اند. این مجموعه داده، اطلاعات سلامت، تغذیه و آزمایش‌های پزشکی بیش از ۱۳۰ هزار نفر را شامل می‌شود.

اسپیک متوجه شد که این مسئله، بخشی از یک مشکل بسیار گسترده‌تر است. در گزارشی که وی و همکارانش در مجله PLOS Biology منتشر کردند، نشان دادند که موجی از مقالات تکراری و کم‌ارزش مبتنی بر NHANES به صورت انفجاری افزایش یافته است. طبق بررسی آنها، کارخانه‌های تولید مقاله (Paper mills) و ابزارهای هوش مصنوعی (مانند ChatGPT) در شدت گرفتن این روند نقش داشته‌اند. این ابزارها امکان تولید مقالات جدید با تغییرات جزئی و بازنویسی یافته‌ها را بسیار آسان کرده‌اند و راهی برای دور زدن سیستم‌های تشخیص سرقت علمی فراهم آورده‌اند.

ریس ریچاردسون، متاساینتیست (metascientist) دانشگاه نورث‌وسترن، توضیح می‌دهد که داده‌های رایگان و عمومی مثل NHANES به هر کسی اجازه می‌دهد با جایگزینی متغیرها و اعمال یک قالب ثابت، مقالات متعددی بسازد؛ مشابه بازی Mad Libs. این اتفاق نه فقط در حوزه سلامت، بلکه در زمینه‌های دیگری مثل ژنتیک، کتاب‌سنجی و مطالعات جنسیتی نیز رخ داده است.

مقالات شناسایی‌شده تقریباً همیشه از یک فرمول تکراری پیروی می‌کنند: انتخاب یک بیماری یا وضعیت سلامت، یک متغیر محیطی یا فیزیولوژیک و یک گروه جمعیتی خاص (مثلاً ارتباط سطح ویتامین D با افسردگی در مردان بالای ۶۵ سال). اسپیک می‌گوید: "احساس می‌کردم همه ترکیب‌های ممکن را کسی دارد امتحان می‌کند."

در یک بررسی گسترده، اسپیک و همکارانش دو پایگاه PubMed و Scopus را جستجو کردند و ۳۴۱ مقاله یافتند که تنها یک ارتباط را با NHANES بررسی کرده بودند و در ۱۴۷ مجله منتشر شده بودند (از جمله Scientific Reports و BMJ Open). در فاصله ۲۰۱۴ تا ۲۰۲۱، به طور متوسط سالانه چهار مقاله از این نوع چاپ می‌شد، اما از ۲۰۲۲ به بعد جهش بزرگی رخ داد و تا اکتبر ۲۰۲۴ تعداد این مقالات به ۱۹۰ رسید. این افزایش، به مراتب بیشتر از رشد کلی مقالات سلامت مبتنی بر داده‌های بزرگ بوده است. جالب آنکه، ۹۲ درصد از مقالات NHANES پس از سال ۲۰۲۱ نویسندۀ اول چینی داشتند (در مقایسه با ۸ درصد قبل از ۲۰۲۱)، که نشان‌دهنده نقش جدی پژوهشگران چینی و فشارهای شغلی در چین برای تولید سریع مقاله است.

از سوی دیگر، این مقالات معمولاً بخش‌هایی از داده‌ها را به شکل انتخابی تحلیل کرده‌اند (مثلاً فقط سال‌های خاص یا گروه‌های سنی محدود) و به دنبال یافته‌های آماری معنادار بوده‌اند؛ وضعیتی که به ایجاد یافته‌های کاذب منجر می‌شود. وقتی تیم اسپیک ۲۸ مقاله NHANES درباره افسردگی را بررسی کردند، فقط ۱۳ مورد پس از تصحیح آماری همچنان معنادار باقی ماندند.

ناشران مطرحی مانند اشپرینگر نیچر (مالک Scientific Reports و BMC Public Health) و گروه BMJ اعلام کرده‌اند که چندین مقاله NHANES را ریترکت کرده‌اند و ارزیابی‌ها برای مقابله با این مشکل ادامه دارد. با این حال، احتمال می‌رود ابعاد واقعی معضل بسیار بزرگ‌تر باشد؛ چرا که بررسی اسپیک فقط مقالات با الگوی خاص را دربرگرفته بود، اما جستجوی جامع‌تر نشان داد که تعداد کل مقالات NHANES از ۴۹۲۶ در سال ۲۰۲۳ به ۷۸۷۶ در سال ۲۰۲۴ رسیده است. (افزایش ۶۰ درصدی)

ریچاردسون می‌گوید این مقالات بازتاب مشکلات گسترده‌ای در انتشار علمی و شیوه‌های پاداش‌دهی به پژوهش هستند. او یادآور می‌شود: همه ناشران نام‌برده احتمالاً برای چاپ تک‌تک این مقالات بی‌ارزش حدود هزار دلار گرفته‌اند. وی می‌افزاید که پژوهشگران برای پیشرفت شغلی خود، تشویق می‌شوند تا به جای مقالات باکیفیت‌تر، تعداد بیشتری مقاله منتشر کنند. او هشدار می‌دهد: این معضل وخیم‌تر هم خواهد شد مگر آنکه نظام انگیزشیِ نشر علمی را به‌طور بنیادین بازسازی کنیم.

در نهایت، اسپیک هشدار می‌دهد که سوءاستفاده از داده‌های بزرگ، با کمک هوش مصنوعی، نه فقط به اشباع متون علمی از یافته‌های بی‌ارزش منجر می‌شود، بلکه اعتبار و کیفیت پژوهش‌های علمی را هم زیر سؤال می‌برد.
#AI
#publishing
#paper_mill

🆔@irevidence
18👍6😁6👌5
▫️ماجرای جالب مجله پزشکی ابن‌سینا

به‌صورت کاملاً اتفاقی با مجله‌ای به نام Avicenna Journal of Medicine برخورد کردم. در نگاه اول تصور کردم که با یکی دیگر از مجلات علمی داخلی مواجه‌ام؛ چراکه در ایران نیز مجلاتی وجود دارند که از نام ابن سینا بهره برده‌اند، از جمله «مجله پزشکی بالینی ابن سینا» وابسته به دانشگاه علوم پزشکی همدان یا «مجله ابن سینا» متعلق به دانشگاه علوم پزشکی ارتش.

با این حال، این مجله هیچ‌گونه وابستگی به نهادهای علمی ایران نداشت. ناشر علمی آن، انجمن پزشکی سوری–آمریکایی (Syrian American Medical Society) است؛ نهادی غیرانتفاعی، غیرسیاسی و حرفه‌ای که در سال ۱۹۹۸ در ایالات متحده تأسیس شده و نماینده جامعه‌ای گسترده از پزشکان سوری‌تبار مقیم آمریکاست. این انجمن فعالیت‌هایی در زمینه ارائه خدمات بشردوستانه به مردم سوریه انجام می‌دهد.

ماجرا به همین‌جا ختم نمی‌شود. در NLM Catalog ناشر تجاری مجله، Medknow ذکر شده است که در شهر بمبئی هندوستان مستقر است، اما نسخه آنلاین مجله از طریق پلتفرم Thieme Connect متعلق به ناشر معتبر آلمانی، Thieme Publishing Group، در دسترس است. جالب‌تر آنکه سردبیر کنونی این نشریه نیز از کشور عربستان سعودی انتخاب شده است.

ترکیب جالبی بود!

#journal
#Avicenna

🆔@irevidence
😁356👍6👏2
🔘 عنوان وبینار: تدوین استراتژی جستجو با 2Dsearch

⌛️ تاریخ
: یکشنبه ۱۸ خرداد ۱۴۰۴

ساعت: ۱۸ تا ۲۰

👨🏻‍🏫 مدرس: رسول معصومی

انجام جستجوهای پیشرفته همواره زمان‌بر و چالش‌برانگیز است؛ به‌ویژه این‌که هر دیتابیس سینتکس و قواعد مخصوص به خود را دارد و کار با فیلدکدها، عملگرهای بولی و پرانتزها هم نیاز به دقت زیادی دارد.

در این وبینار با سرویس 2Dsearch آشنا می‌شوید؛ ابزاری نوآورانه که فرایند جستجو را برای شما ساده و لذت‌بخش می‌کند.

کافی است تنها به اصطلاحات و کلیدواژه‌ها فکر کنید و طراحی استراتژی جستجوی پیچیده را به این سرویس قدرتمند بسپارید.

سامانه 2Dsearch به شما امکان می‌دهد جستجوی خود را در یک فضای بصری دوبعدی بسازید، آن را به فرمت پایگاه‌های مختلف تبدیل کنید و حتی برای طراحی بهتر، از پیشنهادات هوش مصنوعی هم بهره‌مند شوید.

این سرویس طیف وسیعی از دیتابیس‌ها و موتورهای جستجو را پوشش می‌دهد و برای پژوهشگران، دانشجویان و کتابداران یک ابزار حرفه‌ای به شمار می‌آید.

در این وبینار، به صورت عملی و گام‌به‌گام با نحوه کار با 2Dsearch آشنا خواهیم شد.

🔗 لینک ثبت‌نام سریع

#2dsearch
#searching

🆔 @irevidence
👍85
▫️بحران تکرارپذیری در پژوهش‌های مبتنی بر مدل‌های زبانی بزرگ

در یک نظرسنجی منتشرشده در مجله نیچر در سال ۲۰۱۶، مشخص شد که ۷۰ درصد از پژوهشگران قادر به بازتولید آزمایش‌های سایر محققان نیستند و بیش از نیمی از آن‌ها حتی در بازتولید نتایج پژوهش‌های خود نیز با شکست مواجه شده‌اند از این مشکل با عنوان بحران تکرارپذیری (Reproducibility Crisis) یاد می‌شود.

تکرارپذیری یکی از ارکان اساسی پژوهش‌های علمی است. بر اساس تعریف کمیته بین‌المللی اخلاق نشر (COPE)، تکرارپذیری به معنای توانایی یک پژوهشگر مستقل در تکرار نتایج یک مطالعه با استفاده از داده‌ها و روش‌های اصلی است. این اصل موجب افزایش اعتبار، اعتمادپذیری و قابلیت استفاده نتایج علمی در مطالعات بعدی می‌شود.

بحران بیشتر با ظهور هوش مصنوعی مولد

با ورود هوش مصنوعی مولد (Generative AI) و مدل‌های زبانی بزرگ در عرصه پژوهش‌های علمی، چالش‌هایی جدید در خصوص تکرارپذیری مطرح شده است.
به دلایل زیر، تکرارپذیری در پژوهش‌های مبتنی بر این فناوری به یک معضل جدی تبدیل شده است:

توسعه و به‌روزرسانی مداوم مدل‌ها

مدل‌های مولد به طور پیوسته با داده‌های جدید آموزش داده می‌شوند و پارامترهایشان تغییر می‌کند. شرکت‌های توسعه‌دهنده برای ارتقای عملکرد و رفع باگ‌ها، معماری مدل را بهبود می‌بخشند. این باعث می‌شود نتایج خروجی یک پرامپت خاص در زمان‌های مختلف متفاوت باشد؛ در حالی‌که در روش‌های علمی سنتی، ابزار یا نرم‌افزار معمولاً ثابت است یا نسخه آن قابل دسترس است.

عدم دسترسی به نسخه‌های قبلی مدل‌ها

بسیاری از مدل‌های هوش مصنوعی به صورت سرویس آنلاین ارائه می‌شوند (مانند OpenAI ChatGPT، Google Gemini و غیره) و کاربران فقط به آخرین نسخه مدل دسترسی دارند. نسخه‌های قبلی اغلب به دلایل تجاری یا فنی حذف می‌شوند. این موضوع تکرار دقیق نتایج را حتی برای خود پژوهشگر اصلی نیز غیرممکن می‌کند.

تغییرپذیری خروجی مدل‌ها

بسیاری از LLMها حتی با ورودی یکسان، در اجراهای مکرر ممکن است خروجی‌های متفاوتی تولید کنند. این عدم قطعیت ذاتی، تکرار دقیق نتایج را دشوار می‌سازد.

منسوخ شدن سریع مدل‌ها و ظهور مدل‌های جدید

در فضای پرتلاطم هوش مصنوعی، مدل‌ها به سرعت از دور خارج می‌شوند و مدل‌های جدید جایگزین آنها می‌شوند. این پویایی باعث می‌شود بازتولید یا حتی مقایسه نتایج پژوهش‌های مختلف دشوار یا غیرممکن گردد.

نبود مستندسازی کافی

بسیاری از مقالات، تمام جزئیات لازم برای تکرار دقیق آزمایش‌ها، مانند پرامپت دقیق، تنظیمات ابرپارامترها یا نسخه دقیق مدل را گزارش نمی‌کنند.

به نظر می‌رسد در عصر هوش مصنوعی مولد باید تعریف جدیدی از تکرارپذیری در پژوهش‌های علمی ارائه کرد.

#AI
#reproducibility
#research
#LLM

🆔 @irevidence
👍146
▫️تفاوت‌های بین تئوری، چارچوب نظری و چارچوب مفهومی

در سال 2020 و در مجله Academic Medicine خانم Lara Varpio و سه همکارش مقاله‌ای با عنوان زیر منتشر کرده‌اند که تاکنون 1143 بار استناد دریافت کرده است.

The Distinctions Between Theory, Theoretical Framework, and Conceptual Framework

نویسندگان ابتدا به تعریف دو رویکرد کلی پژوهش پرداخته‌اند: رویکرد قیاسی عینی‌گرا (Objectivist Deductive) و رویکرد استقرایی ذهنی‌گرا (Subjectivist Inductive) و سپس سه اصطلاح تئوری (Theory)، چارچوب نظری (Theoretical Framework) و چارچوب مفهومی (Conceptual Framework) را تعریف و شرح داده‌اند.

رویکرد قیاسی عینی‌گرا

در رویکرد قیاسی، پژوهشگر از یک تئوری یا چارچوب نظریِ کلی آغاز می‌کند و با استخراج فرضیه‌ها یا پیش‌بینی‌هایی بر اساس آن تئوری، به جمع‌آوری داده‌های تجربی می‌پردازد تا این فرضیه‌ها را آزمون کند. این مسیر از کل به جزء است و هدف آن تأیید، رد یا اصلاح تئوری‌های موجود است. پژوهش‌های قیاسی اغلب در قالب آزمایش‌ها و مطالعاتی هستند که به بررسی رابطه علت و معلولی بین متغیرها می‌پردازند. چارچوب نظری یا مفهومی، قبل از شروع پژوهش تعیین می‌شوند و معمولاً در طول مطالعه ثابت باقی می‌مانند.

رویکرد استقرایی ذهنی‌گرا

در رویکرد استقرایی، پژوهشگر بدون فرضیه یا تئوری اولیۀ مشخص، با جمع‌آوری داده‌های تجربی درباره یک پدیده خاص آغاز می‌کند و تلاش می‌کند از دل داده‌ها، الگوها و مفاهیم جدید را کشف و تئوری‌سازی کند. این رویکرد از جزء به کل حرکت می‌کند و تأکید آن بر فهم عمیق پدیده و ایجاد یا توسعه تئوری‌های نوین بر اساس داده‌های گردآوری‌شده است. چارچوب مفهومی و حتی چارچوب نظری می‌توانند در طول پژوهش تکمیل و اصلاح شوند.

بیشتر پژوهش‌های کیفی، استقرایی و بیشتر پژوهش‌های کمی، قیاسی هستند. اما همیشه این‌طور نیست و نوع رویکرد (قیاسی یا استقرایی) بستگی به هدف، سؤال و طراحی پژوهش دارد و نه صرفاً روش (کیفی یا کمی) آن.

تئوری

تئوری مجموعه‌ای از گزاره‌ها و مفاهیم است که رابطه بین چندین مفهوم را به صورت منطقی بیان می‌کند و هدف آن کمک به درک جهان پیرامون است. تئوری‌ها می‌توانند توصیفی باشند (یعنی پدیده‌ای را نام‌گذاری و توصیف می‌کنند)، تبیینی باشند (روابط بین پدیده‌ها را روشن می‌سازند)، رهایی‌بخش باشند (ظلم و ستم وارده به یک گروه را بیان می‌کنند)، مخرب یا انتقادی باشند (دانش موجود را گسترش داده یا به چالش می‌کشند) یا پیش‌بینی‌کننده باشند (بر اساس داده‌ها یا ورودی‌های خاص، یک نتیجه را پیش‌بینی می‌کنند) و ممکن است دامنه آنها از تئوری‌های کلان تا خرد متفاوت باشد. قدرت یک تئوری به میزان داده‌ها و شواهدی که از آن حمایت می‌کنند وابسته است.

در رویکرد قیاسی، تئوری نقطه شروع تحقیق است و فرضیه‌ها از دل آن استخراج می‌شود و آزمون می‌گردد. در رویکرد استقرایی، تئوری می‌تواند محصول تحقیق باشد یا در مراحل مختلف تحقیق شکل بگیرد یا اصلاح شود.

چارچوب نظری

چارچوب نظری، مجموعه‌ای منطقی از مفاهیم و پیش‌فرض‌هاست که از یک یا چند تئوری استخراج می‌شود و پژوهشگر آن را برای ساختاردهی به مطالعه خود توسعه می‌دهد. در واقع، چارچوب نظری، ترجمه و تبدیلِ تئوری به عمل است؛ به این معنا که تئوری انتخاب شده را به شکل عملیاتی و کاربردی وارد پژوهش می‌کند، متغیرهای مورد مطالعه را تعریف می‌کند و جهت‌گیری تحلیل داده‌ها را مشخص می‌سازد.

در مطالعات قیاسی، چارچوب نظری قبل از جمع‌آوری داده‌ها شکل می‌گیرد و معمولاً ثابت باقی می‌ماند. اما در پژوهش‌های استقرایی، بسته به نوع طراحی مطالعه، ممکن است چارچوب نظری از ابتدا تعیین شود یا در طول فرآیند تحلیل داده‌ها شکل بگیرد یا تغییر کند.

چارچوب مفهومی

چارچوب مفهومی، توجیه و دلیل انجام یک مطالعه را فراهم می‌کند. این چارچوب معمولاً شامل مروری بر دانش موجود، شناسایی شکاف‌های پژوهشی، و توضیح بنیان‌های روش‌شناختی مطالعه است. چارچوب مفهومی به دو سوال کلیدی پاسخ می‌دهد: "چرا این پژوهش اهمیت دارد؟" و "این پژوهش چه کمکی به دانش موجود خواهد کرد؟"

در مطالعات قیاسی، چارچوب مفهومی اغلب قبل از آغاز پژوهش، نهایی می‌شود و تغییر نمی‌کند. اما در پژوهش‌های استقرایی، ممکن است در طول پژوهش و با کسب اطلاعات جدید، اصلاح یا تکمیل شود.

بطور کلی:

تئوری، یک نظام مفهومی انتزاعی است که روابط بین پدیده‌ها را بیان می‌کند.

چارچوب نظری، کاربرد و عملی‌سازی یک یا چند تئوری منتخب برای یک مطالعه مشخص است.

چارچوب مفهومی، منطق و ضرورت انجام پژوهش، مرور متون، و بیان شکاف‌ها و سؤالات پژوهش را در بر می‌گیرد.

در رویکرد قیاسی، تئوری و چارچوب نظری نقطه شروع‌اند؛ اما در رویکرد استقرایی، تئوری می‌تواند محصول نهایی پژوهش باشد و چارچوب‌ها قابل تغییر و تکمیل هستند.

#methodology
#research

🆔 @irevidence
🙏179👍5👏2👌2
سایت‌اسکور 2024 منتشر شد

✍️ رسول معصومی

ویرایش سال 2024 سنجه CiteScore منتشر و برای مجلات نمایه‌شده در پایگاه Scopus اعمال شد. برخی نکات کلیدی این نسخه عبارتند از:

▫️در گزارش سال 2024، تعداد 31138 مجله و پیایند موفق به دریافت سایت‌اسکور شده‌اند که از این بین، 1973 عنوان برای اولین بار صاحب این شاخص شده‌اند.

▫️ بر اساس CiteScore 2024، مجلات و پیایندها به این صورت در چارک‌های استنادی توزیع شده‌اند:

‏ Q1 (چارک اول): 9655 عنوان
‏ Q2 (چارک دوم): 8056 عنوان
‏ Q3 (چارک سوم): 7101 عنوان
‏ Q4 (چارک چهارم): 6326 عنوان

▫️از بین نشریات دارای سایت‌اسکور، 7961 عنوان با دسترسی آزاد (Open Access) منتشر می‌شوند که 55 مورد از آن‌ها در طبقه‌بندی موضوعی خود، رتبه اول را دارند.

▫️در اسکوپوس، 11826 مجله و پیایند دارای CiteScore 2024 هستند، در حالی که فاقد Impact Factor براساس گزارش JCR 2023 می‌باشند. جالب آن‌که 424 مورد از این نشریات در طبقه‌بندی‌های موضوعی خود، در میان 10 درصد برتر قرار دارند.

▫️24 درصد از نشریات به زبان‌هایی غیر از انگلیسی منتشر می‌شوند (معادل 7339 نشریه). به‌طور کلی، نشریات منتشرشده به بیش از 50 زبان مختلف - از جمله زبان فارسی - تحت پوشش پایگاه اسکوپوس قرار دارند.

▫️نسبت به گزارش سال 2023، 649 نشریه با افزایش 100 درصدی یا بیشتر در سایت‌اسکور خود مواجه بوده‌اند.

▫️مجله Ca-A Cancer Journal for Clinicians با سایت‌اسکور 1154.2، رتبه نخست را در بین تمامی نشریات کسب کرده است. این مقدار نسبت به نسخه قبلی، بیش از 281 واحد افزایش داشته است. این مجله نخستین نشریه‌ای است که سایت‌اسکوری بالاتر از 1000 به دست آورده است. دلایل بالا بودن CiteScore و IF این مجله قبلاً توضیح داده شده است (اینجا)

▫️رتبه‌های دوم تا پنجم بالاترین CiteScore نیز به ترتیب متعلق‌اند به:

Foundations and Trends in Machine Learning (202.9)

Nature Reviews Drug Discovery (181.8)

Nature Reviews Molecular Cell Biology (150.9)

MMWR Recommendations and Reports (129.9)

▫️برخی از نشریات معتبر کاهش قابل توجهی در سایت‌اسکور خود داشته‌اند؛ برای مثال:

The Lancet از 148.1 به 87.6 کاهش یافته (کاهش 60.5 واحدی)

New England Journal of Medicine از 145.4 به 96.4 رسیده (کاهش 49 واحدی)

⚠️ لازم به یادآوری است که CiteScore یک سنجه استانداردشدۀ بین‌رشته‌ای نیست؛ بنابراین، مقایسه و رتبه‌بندی نشریات حوزه‌های موضوعیِ متفاوت بر پایه این شاخص، نادرست است. این شاخص صرفاً برای مقایسه نشریاتِ درون یک طبقه موضوعی خاص کاربرد دارد.

🔗 دسترسی رایگان به مجلات نمایه شده در اسکوپوس به همراه CiteScore آنها:

https://www.scopus.com/sources

#citescore
#research_metrics
#scopus
#journal

🆔 @irevidence
8👍6
▫️بررسی مجلات ایرانی نمایه‌شده در اسکوپوس

متأسفانه در بخش Sources پایگاه اسکوپوس، فیلتری برای محدود کردن مجلات به یک کشور خاص وجود ندارد. بنابراین، لیست مجلات ایرانی نمایه‌شده در اسکوپوس را از سایت Scimago استخراج کرده و شماره ISSN آنها را جدا نمودم. سپس این مجلات را در دسته‌های ۲۷تایی قرار دادم تا بتوان در اسکوپوس جست‌وجو کرد. در مجموع، ۳۷۶ مجله بازیابی شد.

توزیع مجلات ایرانی در چارک‌های استنادی:

چارک اول: ۳۰ مجله (۷.۹۷ درصد)
چارک دوم: ۵۴ مجله (۱۴.۳۶ درصد)
چارک سوم: ۱۵۳ مجله (۴۰.۶۹ درصد)
چارک چهارم: ۱۳۶ مجله (۳۶.۱۷ درصد)
بدون چارک: ۳ مجله (توقف نمایه‌سازی در اسکوپوس)

در مجموع، حدود ۷۷ درصد مجلات ایرانی (۲۸۹ عنوان) در چارک‌های سوم و چهارم قرار دارند. همچنین نسبت به سال‌های قبل، رشد متوسطی در تعداد مجلات ایرانی در چارک‌های اول و دوم دیده می‌شود.

۱۰ مجله ایرانی با بالاترین سایت‌اسکور

1. Progress in Color, Colorants and Coatings (7.8)

2. Journal of Applied and Computational Mechanics (7.2)

3. International Journal of Health Policy and Management (7.1)

4. Civil Engineering Journal (6.5)

5. Advanced Pharmaceutical Bulletin (6.4)

6. Health Promotion Perspectives (6.1)

7. Iranian Journal of Catalysis (6)

8. Journal of Soft Computing in Civil Engineering (5.6)

9. Global Journal of Environmental Science and Management (4.9)

10. BioImpacts (4.7)

در بین این ۱۰ مجله، چهار مجله وابسته به دانشگاه‌های علوم پزشکی هستند که سه عنوان آن متعلق به دانشگاه علوم پزشکی تبریز (شماره‌های ۵، ۶ و ۱۰) و یکی متعلق به دانشگاه علوم پزشکی کرمان (شماره ۳) است.

همان‌طور که بارها اشاره شده است، CiteScore یک شاخص استانداردشده بر اساس رشته نیست و مقایسه بین‌رشته‌ای آن صحیح نیست. همچنین، میزان استناد و متعاقب آن CiteScore تا حد زیادی به رشته و رفتار استنادی آن حوزه بستگی دارد.

به عنوان مثال، هرچند مجله Progress in Color, Colorants and Coatings با CiteScore برابر ۷.۸ در چارک اول قرار دارد، اما در صدک ۸۱ام است؛ در مقابل، مجله Archives of Academic Emergency Medicine متعلق به دانشگاه علوم پزشکی شهید بهشتی با CiteScore معادل ۳.۵ در صدک ۹۷ام قرار دارد (رتبه ۱ در بین ۱۷ مجله مرتبط با طب اورژانس).

یا مجله Journal of Medical Ethics and History of Medicine وابسته به دانشگاه علوم پزشکی تهران، با وجود CiteScore تنها ۱.۸، در چارک اول و صدک ۹۳ام حوزه موضوعی تاریخ قرار دارد.

همچنین مجله Persica Antiqua متعلق به گروه پژوهشی باستان‌کاوی تیسافرن با CiteScore برابر ۱، در صدک ۹۳ام حوزه ادبیات و نظریه ادبی قرار گرفته است. مجله Journal of Sistan and Baluchistan Studies نیز با CiteScore برابر ۱، در چارک اول و صدک ۸۲ام حوزه تاریخ جای دارد.

۱۰ مجله ایرانی برتر بر اساس بالاترین صدک موضوعی:

1. Archives of Academic Emergency Medicine 97% (CiteCore=3.5)

2. International Journal of Health Policy and Management 96% (CiteCore=7.1)

3. Iranian Journal of Language Teaching Research 94% (CiteCore=4.6)

4. Journal of Medical Ethics and History of Medicine 93% (CiteCore=1.8)

5. Persica Antiqua 93% (CiteCore=1)

6. Journal of Soft Computing in Civil Engineering 91% (CiteCore=5.6)

7. Global Journal of Environmental Science and Management 89% (CiteCore=4.9)

8. Journal of Applied and Computational Mechanics 88% (CiteCore=7.2)

9. Health Promotion Perspectives 87% (CiteCore=6.1)

10. Journal of Advances in Medical Education and Professionalism 87% (CiteCore=3.6)

شش مجله از ده مجله فوق، صدک‌های بالای ۹۰ دارند، یعنی جزو مجلات ۱۰ درصد برتر در طبقه‌ موضوعی خود در جهان هستند.

🔗 خروجی اکسل اطلاعات تمام مجلات ایرانی

#citescore
#research_metrics
#scopus
#journal
#Iran

🆔 @irevidence
👍75🤔1
▫️ضریب تأثیر 2024 و وضعیت مجلات ایرانی

اخیراً ورژن 2024 ضریب تأثیر (IF) مجلات نمایه شده در ۴ نمایه‌نامه استنادی Web of Science منتشر شده است. مهم ترین تغییر نسبت به قبل، حذف استنادات مربوط به مقالات ریترکت شده است. این تصمیم با هدف جلوگیری از تحریف احتمالی در ارزیابی‌های علمی و حفظ اعتبار شاخص‌های استنادی اتخاذ شده است.

اگرچه استنادهای مربوط به مقالات ریترکت‌شده از محاسبه JIF حذف شده است (در صورت کسر)، اما خودِ این مقالات همچنان در شمارش کل مقالات (مخرج کسر JIF) باقی می‌مانند. این اقدام با هدف حفظ شفافیت و مسئولیت‌پذیری در گزارش‌دهی صورت گرفته است.

حذف این‌گونه استنادات باعث شده است IF بیش از دو هزار مجله کاهش پیدا کند. همچنین چارک 24 مجله تغییر پیدا کرده است. مثلاً تغییر از Q1 به Q2.


بر اساس گزارش JCR، تعداد ۱۶۱ مجله از ایران در نمایه‌های استنادی وب آو ساینس ایندکس شده‌اند و دارای ضریب تأثیر (IF) هستند. از این بین ۱۲۱ مجله (بیش از ۷۵ درصد) در نمایه ESCI قرار دارند. این دومین سالی است که مجلات نمایه‌شده در ESCI نیز IF دریافت می‌کنند.

۴۰ مجله در نمایه استنادی علوم (SCIE) و ۲ مجله در نمایه استنادی علوم اجتماعی (SSCI) قرار دارند که این دو مجله هم‌زمان در SCIE نیز نمایه شده‌اند. هیچ مجله‌ای از ایران در نمایه استنادی هنر و علوم انسانی (AHCI) حضور ندارد.

توزیع مجلات ایرانی در چارک‌های استنادی:

چارک اول: ۸ مجله (۴.۹۶ درصد)
چارک دوم: ۲۰ مجله (۱۲.۴۲ درصد)
چارک سوم: ۳۹ مجله (۲۴.۲۲ درصد)
چارک چهارم: ۹۴ مجله (۵۸.۳۸ درصد)

در مجموع، حدود ۸۳ درصد مجلات ایرانی (۱۳۳ عنوان) در چارک‌های سوم و چهارم قرار دارند.

۱۰ مجله ایرانی با بالاترین ضریب تأثیر (IF):

1. Journal of Nanostructure in Chemistry (7.9 Q1)

2. Asian Journal of Social Health and Behavior (5.2 Q1)

3. International Journal of Health Policy and Management (5.1 Q1)

4. Civil Engineering Journal-Tehran (4.9 Q1)

5. Advanced Pharmaceutical Bulletin (4.1 Q1)

6. International Nano Letters (4 Q3)

7. International Journal of Environmental Research (3.5 Q2)

8. Journal of Applied and Computational Mechanics (3.4 Q2)

9. International Journal of Environmental Science and Technology (3.4 Q2)

10. International Journal of Engineering (2.9 Q2)

در بین این ۱۰ مجله، سه مجله وابسته به دانشگاه‌های علوم پزشکی هستند: دانشگاه علوم پزشکی قزوین (شماره ۲)، دانشگاه علوم پزشکی کرمان (شماره ۳)، و دانشگاه علوم پزشکی تبریز (شماره ۵).

نکته مهم این است که IF، مانند CiteScore، یک سنجه استانداردشده نیست و فقط مجاز هستیم IF مجلات موجود در یک رشته و طبقه خاص را با همدیگر مقایسه و رتبه‌بندی کنیم.

برای مقایسه مجلات رشته‌های مختلف می‌توان از چارک یا صدک استفاده کرد. حدود سه سال قبل سنجه‌ای به نام Journal Citation Indicator یا JCI هم به پروفایل مجلات در JCR اضافه شده است که نرمال شده بر اساس رشته است و از آن می‌توان برای مقایسه مجلات رشته‌های مختلف استفاده کرد (مثلاً برای مقایسه مجلات فیزیک با مجلات فلسفه).


#research_metrics
#impactfactor
#JCR
#webofscience
#journal
#clarivate

🆔 @irevidence
10👍6🙏1
ارزیابی مدل‌های زبانی بزرگ در پلتفرم SciArena

پلتفرم SciArena که توسط مؤسسه Allen Institute for Artificial Intelligence (Ai2) توسعه یافته است، ۲۳ مدل زبانی بزرگ (LLM) را بر اساس توانایی پاسخ‌گویی به سوالات علمی، ارزیابی و رتبه‌بندی کرده است. تا تاریخ ۳۰ ژوئن ۲۰۲۵، بیش از ۱۳ هزار رأی از سوی ۱۰۲ متخصص جمع‌آوری شده و کیفیت پاسخ‌های مدل‌ها به صورت تخصصی مورد ارزیابی قرار گرفته است.

در ادامه، مدل‌های برتر به تفکیک تمامی حوزه‌ها و حوزه‌های تخصصی ارائه شده‌اند:

پنج مدل برتر در تمامی زمینه های علمی

1. مدل o3 (OpenAI)
2. مدل Claude 4 Opus
3. مدل Gemini 2.5 Pro
4. مدل DeepSeek R1 0528
5. مدل o4‑mini (OpenAI)

پنج مدل برتر در حوزه علوم پزشکی و سلامت

1. مدل o3
2. مدل Claude 4 Opus
3. مدل Claude 4 Sonnet
4. مدل o4-mini
5. مدل Gemini 2.5 Pro

پنج مدل برتر در حوزه مهندسی

1. مدل o3
2. مدل Claude 4 Opus
3. مدل GPT-4.1
4. مدل DeepSeek R1 0528
5. مدل Gemini 2.5 Pro

پنج مدل برتر در حوزه علوم اجتماعی و انسانی

1. مدل o3
2. مدل Claude 4 Opus
3. مدل Claude 4 Sonnet
4. مدل Gemini 2.5 Pro
5. مدل Gemini 2.5 Pro-Preview

پنج مدل برتر در حوزه علوم طبیعی

1. مدل o3
2. مدل DeepSeek R1 0528
3. مدل Gemini 2.5 Pro
4. مدل o4-mini
5. مدل Qwen3-235B-A22B

بطور کلی مدل o3 در تمامی حوزه ها رتبه اول را کسب کرده است. بعد از آن، مدل Claude 4 Opus در هر سه حوزه علوم پزشکی و سلامت، مهندسی و نیز علوم اجتماعی و انسانی رتبه بهتری دارد. مدل DeepSeek R1 0528 نیز در علوم طبیعی عملکرد بهتری داشته است.

در پژوهش SciArena، مدلی مثل o3 (که برترین مدل بود) وقتی پاسخ‌های مدل را با رأی متخصصان انسانی مقایسه کردند، دیدند که فقط در ۶۵.۱ درصد موارد، انتخاب مدل با نظر داور انسانی یکسان است. یعنی وقتی یک سؤال علمی مطرح می‌شود و هم مدل هوش مصنوعی (مثل o3) و هم یک انسان متخصص باید بین دو پاسخ انتخاب کنند که کدام بهتر است، فقط در حدود ۶۵ درصد مواقع، مدل همان پاسخی را انتخاب می‌کند که انسان انتخاب کرده است. به عبارت دیگر، نظر مدل و انسان درباره بهترین پاسخ، در یک‌سوم موارد با هم متفاوت است.

در مقابل، در برخی بنچمارک‌های عمومی و ساده‌تر (مثل AlpacaEval که بیشتر برای سوالات عمومی و غیرتخصصی استفاده می‌شود)، این تطابق یا دقت مدل با رای انسان بالاتر از ۷۰ درصد است. یعنی در سوالات عمومی، مدل‌ها بیشتر شبیه نظر انسان قضاوت می‌کنند، اما در سوالات علمیِ تخصصی این هماهنگی کمتر است.

اینکه میزان هماهنگی مدل با نظر انسان فقط ۶۵.۱ درصد است، یعنی حتی بهترین مدل‌های هوش مصنوعی هم هنوز نمی‌توانند مانند یک انسان متخصص به‌درستی درباره پاسخ‌های علمی قضاوت کنند و نتیجه‌ای مشابه داور انسانی بدهند. در واقع، مدل‌ها هنوز به دقت و عمق درک انسانی نرسیده‌اند و نمی‌توانند همیشه جایگزین مطمئنی برای ارزیابی علمی توسط انسان باشند.

چرا این اتفاق می‌افتد؟

سوالات علمی معمولاً سخت‌تر، تخصصی‌تر و نیازمند استناد دقیق‌تر هستند. مدل‌ها ممکن است ظواهر متن یا منابع را درست بازسازی کنند، اما عمق علمی و استدلالی تصمیم انسانی را ندارند. گاهی مدل‌ها دچار خطا، تفسیر اشتباه یا ضعف در فهم متون علمی می‌شوند.

این داده‌ها هشدار می‌دهد که خودکارسازی کامل ارزیابی علمی با مدل‌های زبان بزرگ هنوز قابل اتکا نیست و هنوز برای داوری دقیق علمی، به انسان نیاز داریم.

🔗 توضیحات و آمار بیشتر در:

https://allenai.org/blog/sciarena

همچنین در مجله Nature هم به این ارزیابی و پلتفرم پرداخته شده است. (لینک)

#AI
#LLM
#chatgpt
#Claude
#ranking
#benchmarking

🆔 @irevidence
👍16
▫️ هوش مصنوعی و مرگ نویسنده آکادمیک

Artificial intelligence and the death of the academic author

دکتر Ken Masters از صاحب نظران برجسته آموزش پزشکی، به تازگی نظری مناقشه‌برانگیز در خصوص AI را در قالب Short Communication در مجله Medical Teacher منتشر کرده است.

این مقاله درباره تأثیر هوش مصنوعی و به‌خصوص مدل‌های زبانی بزرگ مانند ChatGPT بر نقش نویسنده آکادمیک (Academic Author) نوشته شده است. نویسنده مقاله با الهام از نظریه معروف رولان بارت (Roland Barthes) به نام مرگ نویسنده (The Death of the Author)، می‌گوید که نویسنده دیگر آن نقش و اهمیت گذشته را ندارد و هوش مصنوعی می‌تواند جای نویسنده را بگیرد.

در گذشته، تصور می‌شد نویسنده کسی است که با خلاقیت خود، یک متن تازه و اصیل تولید می‌کند. اما بارتس می‌گوید که نویسنده فقط متونی را که قبلاً وجود داشته‌اند، به نوعی کنار هم می‌چیند و از چیزهای موجود، یک چیز جدید می‌سازد. این دقیقاً همان کاری است که مدل‌های زبانی بزرگ انجام می‌دهند: آن‌ها با خواندن و یاد گرفتن حجم زیادی از متن، متن جدیدی را بر اساس ترکیب داده‌های قبلی تولید می‌کنند.

نویسنده مقاله می‌گوید در دنیای آکادمیک، اصل کار با پژوهش (Research) است، نه با نوشتن مقاله (Writing). درواقع، پژوهشگر باید ایده و تحقیق را انجام دهد و نوشتن مقاله، بیشتر یک کار مکانیکی و تکراری است که هوش مصنوعی خیلی بهتر و سریع‌تر می‌تواند آن را انجام دهد.

در حال حاضر اکثر دانشگاه‌ها و مجلات، قبول ندارند که هوش مصنوعی به عنوان نویسنده مقاله شناخته شود، چون معتقدند AI نمی‌تواند مسئولیت‌پذیر (Accountable) یا پاسخگو (Responsible) باشد. اما نویسنده معتقد است که این نگرانی بی‌دلیل است، چون در نهایت مسئولیت اصلی با پژوهشگر است، نه با کسی که مقاله را نوشته است؛ چه انسان باشد و چه هوش مصنوعی.

به گفته نویسنده، باید نقش نویسنده (Authorship) و پژوهشگر (Researcher) را از هم جدا کرد. پژوهشگر باید پژوهش را انجام دهد و نکات اصلی، داده‌ها و منابع را جمع کند. سپس نوشتن و نگارش را می‌توان به هوش مصنوعی سپرد. این کار به ویژه به نفع پژوهشگرانی است که زبان انگلیسی، زبان مادری‌شان نیست و برای نوشتن مقاله به مشکل برمی‌خورند. در این صورت، همه می‌توانند فرصت برابر برای انتشار یافته‌های خود داشته باشند.

در آینده‌ای که نویسنده تصویر می‌کند، پژوهشگر به نوعی کارگردان یا مدیر پروژه است: پژوهش انجام می‌دهد، نتایج را جمع‌بندی می‌کند و سپس هوش مصنوعی را راهنمایی می‌کند تا متن مقاله را بنویسد. بنابراین دیگر نیازی نیست وقت و انرژی زیادی صرف نوشتن متن و ویرایش شود، بلکه تمرکز روی تحقیق و تولید دانش خواهد بود.

در پایان، نویسنده می‌گوید که قبول دارد این ایده ممکن است برای خیلی‌ها عجیب یا حتی ناراحت‌کننده باشد، مخصوصاً برای کسانی که نوشتن را دوست دارند. اما معتقد است این روند یک تحول بزرگ (مانند انقلاب کوپرنیکی) در دنیای علم و دانشگاه خواهد بود و در نهایت باعث می‌شود پژوهشگر دوباره در مرکز توجه قرار بگیرد و نوشتن مقاله فقط یک ابزار ساده برای انتقال دانش باشد، نه اصل ماجرا.

شما چه فکر می‌کنید؟

#AI
#LLM
#academic_writing
#research

🆔 @irevidence
👍705🤔4😢2
Evidence
▫️ هوش مصنوعی و مرگ نویسنده آکادمیک Artificial intelligence and the death of the academic author دکتر Ken Masters از صاحب نظران برجسته آموزش پزشکی، به تازگی نظری مناقشه‌برانگیز در خصوص AI را در قالب Short Communication در مجله Medical Teacher منتشر کرده…
▫️نقد دیدگاه Ken Masters

خانم دکتر Lorelei Lingard استاد دانشگاه وسترن کانادا در قالب یک Commentary، دیدگاه آقای Masters را نقد کرده است:

Let’s consider what writing is good for before we hand it over to AI

مهم‌ترین نقدها و محورهای مخالفت لینگارد با ایده Ken Masters به شرح زیر است:

1. نوشتن صرفاً یک کار مکانیکی نیست؛ نوشتن همان اندیشیدن است.

مسترز ادعا می‌کند نوشتن در پژوهش آکادمیک، نقش خلاقانه چندانی ندارد و فقط باید به هوش مصنوعی سپرده شود تا پژوهشگر وقتش را صرف تحقیق کند. این دیدگاه خطرناک است، چون نوشتن بخشی از فرآیند فکر کردن است. پژوهشگر هنگام نوشتن و بازنویسی، افکار خود را شفاف می‌کند و حتی خیلی وقت‌ها، تازه هنگام نوشتن متوجه عمق و جزئیات یافته‌هایش می‌شود.

بنابراین اگر نوشتن را به هوش مصنوعی بدهیم، تفکرمان را ناقص و زودهنگام متوقف می‌کنیم و عملاً فرصت پرورش ایده‌ها را از خود می‌گیریم.

2. نوشتن واحد ارزش‌گذاری و اعتبار دانشگاهی است

نوشتن، معیار سنجش اعتبار علمی است و اعتبار، شهرت و اعتماد به یک پژوهشگر بر اساس کیفیت و شخصیت نگارشی او شکل می‌گیرد.

اگر همه‌چیز را هوش مصنوعی بنویسد، شخصیت، اعتبار و اعتمادپذیری (بطور کلی ethos) پژوهشگر آسیب می‌بیند، حتی اگر اصول شفافیت و امانت‌داری رعایت شود. همچنین تحقیقات نشان داده استفاده از هوش مصنوعی در نوشتن می‌تواند اعتماد به دانش تولیدشده را کاهش دهد، چون دیگر "صدای پژوهشگر" در متن شنیده نمی‌شود.

از طرف دیگر سبک نگارش علمیِ کنونی اغلب ثقیل، بی‌روح، پرطمطراق، نامأنوس و گنگ است و اگر هوش مصنوعی به‌جای انسان بنویسد، احتمالاً همین نثر بی‌روح و غیرقابل‌فهم را بیشتر تکثیر می‌کند. این خطر وجود دارد که ارزش علمی مقالات دچار کاهش جدی شود.

3. نوشتن بخش مهمی از تبدیل شدن به پژوهشگر است.

نوشتن فقط انتقال محتوا نیست، بلکه روشی برای شکل‌گیری هویت علمی است. نوشتن باعث می‌شود پژوهشگر در مسیر تبدیل شدن به یک دانشمند واقعی رشد کند، با ایده‌هایش کلنجار برود و فهم خود را عمیق کند. اگر این "دردسر مفید" نوشتن را حذف کنیم و همه‌چیز را به هوش مصنوعی بسپاریم، پژوهشگران، سطحی می‌شوند و توانایی نقد و تحول دانش را از دست می‌دهند. در نتیجه رشته علمی دچار رکود و ایستایی می‌شود.

نوشتن به زبان غیرمادری دشوار است و هوش مصنوعی می‌تواند در کاهش این چالش کمک کند، اما اگر این دشواری را کاملاً حذف کنیم، رشد فردی و کیفیت دانش نیز قربانی می‌شود.


خلاصه اینکه، لینگارد می‌گوید شعار ما تحقیق می‌کنیم، هوش مصنوعی می‌نویسد (We research, GenAI writes) هرچند جذاب است، اما خطرناک هم هست. چون نوشتن فقط یک مرحله سریع و ساده بعد از پژوهش نیست، بلکه هویت علمی، فرآیند تفکر و اعتبار پژوهشگر وابسته به آن است. اگر نوشتن را به طور کامل به هوش مصنوعی بسپاریم، خیلی بیشتر از آنچه به دست می‌آوریم را از دست خواهیم داد.

#AI
#LLM
#academic_writing
#research
#authorship

🆔 @irevidence
19👍17👎4
▫️ماجرای عجیب یک سرقت علمی: داور ایرانی مقاله پژوهشگر پاکستانی را رد و سپس به نام خود منتشر کرد!

تازه‌ترین گزارش پایگاه Retraction Watch از اقدام عجیب یک داور ایرانی پرده برداشته است. ماجرا از این قرار است:

شفق آفتاب (Shafaq Aftab)، پژوهشگر و مدرس دانشگاه پنجاب مرکزی در پاکستان، ادعا کرده است که داود قربان‌زاده، محقق علوم اجتماعی در دانشگاه آزاد اسلامی واحد تهران شمال، دست‌نوشته او را که برای مجله Information Development (IDV) ارسال و رد شده بود، سرقت کرده و به نام خود در مجله Systems Research and Behavioural Science (SRBS) منتشر کرده است. آفتاب این سرقت ادعایی را از طریق هشداری در ریسرچ‌گیت در پاییز ۲۰۲۴ کشف کرد و اظهار داشته که انتشار این مطالعه از نظر شخصی و حرفه‌ای به‌شدت آسیب‌رسان بوده است.

آفتاب در نوامبر ۲۰۲۳ مقاله‌ای را که حاصل پژوهش دکتری او بود به IDV ارسال کرده بود. این مقاله پس از دو دور داوری در اوت ۲۰۲۴ رد شد. قربان‌زاده مقاله مشابهی را در ژانویه ۲۰۲۴ به مجله SRBS ارسال کرد و این مقاله در سپتامبر ۲۰۲۴ منتشر شد. بررسی تطبیقی نشان داد که ساختار، تحلیل داده‌ها، متن مقدمه، و بخش نتیجه‌گیری دو مقاله تقریباً یکسان بوده و حتی پاراگراف‌هایی کاملاً عیناً تکرار شده است. تفاوت‌های اندکی در تعداد نمونه‌ها و نسخه نرم‌افزار تحلیل آماری وجود دارد.

سردبیر سابق IDV، استیون پارکر، تأیید کرده که قربان‌زاده داور هر دو نسخه دست‌نوشته افتاب برای IDV بوده و پیشنهاد رد آن را داده است. این امر مستقیماً اظهارات قربان‌زاده را رد می‌کند که گفته بود هرگز دست‌نوشته آفتاب را داوری نکرده و توصیه به رد آن نداده است. قربان‌زاده اتهامات سرقت را کاملاً رد کرده و هرگونه شباهت بین دو مقاله را تصادفی توصیف کرده است. او تأکید کرده پژوهشش اصیل بوده و با استانداردهای اخلاقی انجام شده است.

وایلی ناشر مجله SRBS از سپتامبر ۲۰۲۴ تحقیق درباره این موضوع را آغاز کرده است. مشخص شده است که همپوشانی قابل‌توجهی بین دو مقاله وجود دارد. وایلی اعلام کرده که بررسی نهایی در حال انجام است و به زودی نتیجه آن به اطلاع طرف‌های درگیر خواهد رسید. قربان‌زاده گفته است که کاملاً با تحقیقات وایلی همکاری کرده و اسناد و مدارک مربوط به اصالت پژوهش خود را ارائه کرده است.

قابل ذکر است که قبلاً دو مقاله دیگر از قربان‌زاده به دلیل سرقت علمی پس گرفته شده است. یکی از این مقالات که در ژورنال Journal of Health Organization and Management منتشر شده بود، به علت کپی‌برداری گسترده از یک اثر منتشرنشده دیگر بدون ذکر منبع در ژانویه ۲۰۲۴ پس گرفته شد. همچنین، مقاله‌ای دیگر در مجله Current Psychology نیز به دلیل همپوشانی قابل‌توجه با مقاله‌ای که قبلاً منتشر شده بود در دسامبر ۲۰۲۳ پس گرفته شد. در هر دو مورد همکاران قربان‌زاده اعلام کردند که از اقدام وی مطلع نبوده‌اند.

آفتاب ابراز امیدواری کرده که این اتفاق باعث افزایش آگاهی پژوهشگران جوان درباره محافظت از کارهایشان شود. او معتقد است عدم برخورد با چنین سوءاستفاده‌هایی در داوری همتا، زمینه را برای تکرار چنین مواردی فراهم می‌کند و به اعتبار نظام داوری علمی آسیب می‌زند.

⚠️ باید بدانیم که با این رفتارهای غیراخلاقی، نه‌تنها آبروی خود یا دانشگاه‌مان، بلکه اعتبار ایران را خدشه‌دار می‌کنیم و این خطایی بزرگ است. چنین اقداماتی باعث می‌شود سردبیران مجلات علمی نسبت به چاپ مقالات پژوهشگران ایرانی بی‌اعتماد شوند و این امر در حق پژوهشگران و داورانی که صادقانه و اخلاق‌مدارانه فعالیت می‌کنند، ظلم و اجحاف است.

#research_ethics
#plagiarism
#peer_review
#wiley
#Iran

🆔 @irevidence
👍43😢168😁7🤔3
▫️فروش مدرک رسمی از کاردانی تا دکتری تخصصی و حتی دکتری حرفه‌ای!

در یکی از کانال‌های خبری که مخاطب میلیونی دارد، تبلیغ زیر را مشاهده کردم:

👮‍♂️ مدرک رسمی «دانشگاه علوم پزشکی شهید بهشتی» در کمتر از ۱۰ روز!

✔️ از کاردانی تا دکتری | کاملاً غیرحضوری
✔️ قابل استعلام قانونی + قابل ترجمه رسمی
✔️ مناسب برای: مهاجرت | استخدام | ادامه‌ی تحصیل

به ادمین پیام دادم و درخواست هزینه مدارک را کردم. پیام زیر ارسال شد:

فرآیند ثبت‌نام جهت صدور مدارک تحصیلی

۱) انتخاب مقطع و رشته تحصیلی مورد نظر

دیپلم رسمی نظام جدید (شاخه نظری و کارودانش)
شهریه: ۳۸ میلیون تومان

کاردانی (پیوسته یا ناپیوسته) و کارشناسی ناپیوسته – دانشگاه آزاد اسلامی
شهریه: ۳۶ میلیون تومان

کارشناسی پیوسته از دانشگاه‌های:
• دانشگاه آزاد اسلامی: ۴۸ میلیون تومان
• دانشگاه شهید بهشتی: ۶۰ میلیون تومان
• دانشگاه تهران: ۶۰ میلیون تومان

کارشناسی ارشد ناپیوسته:
• دانشگاه آزاد اسلامی: ۴۹ میلیون تومان
• دانشگاه شهید بهشتی: ۶۸ میلیون تومان
• دانشگاه تهران: ۶۸ میلیون تومان

دکترای تخصصی (Ph.D):
• دانشگاه آزاد اسلامی: ۸۹ میلیون تومان
• دانشگاه شهید بهشتی: ۱۱۰ میلیون تومان
• دانشگاه تهران: ۱۷۰ میلیون تومان
⤷ ترجمه رسمی رایگان + امکان چاپ پایان‌نامه، مقاله علمی و کتاب علمی با مجوز رسمی نشر (هزینه جداگانه)



رشته‌های علوم پزشکی و پیراپزشکی فقط از دانشگاه علوم پزشکی شهید بهشتی

کارشناسی پیوسته: ۱۲۰ میلیون تومان

کارشناسی ارشد ناپیوسته: ۱۳۰ میلیون تومان

دکترای تخصصی: ۱۶۰ م تومان

دکترای حرفه‌ای:
• پزشکی عمومی: ۳۰۰ میلیون تومان
• دندان‌پزشکی: ۲۸۰ میلیون تومان
• داروسازی: ۲۶۰ میلیون تومان
⤷ ترجمه رسمی رایگان + گواهی پایان طرح نیروی انسانی (در صورت نیاز)



۲) ارسال اسکن مدارک مورد نیاز :
• شناسنامه (صفحه اول و دوم)
• کارت شناسایی ملی یا گذرنامه
• عکس پرسنلی تمام رخ با زمینه سفید
• کارت پایان خدمت وظیفه (در صورت وجود)
• آخرین مدرک تحصیلی (در صورت وجود)
• اتباع خارجی با گذرنامه ی معتبر امکان ثبت‌نام دارند



۳) پرداخت مبلغ ۴ میلیون تومان به عنوان هزینه اولیه ثبت‌نام



نکات مهم:
• تمامی مراحل از ثبت‌نام تا فارغ‌التحصیلی کاملاً غیرحضوری و توسط مجموعه‌ی ما به عنوان «نماینده شما» انجام می‌شود. نیازی به حضور شما در مراکز آموزش یا حوزه‌ی امتحانات نیست.
• مدارک صرفاً از واحدهای آموزشی رسمی صادر می‌گردند، از جمله:
مراکز آموزش متوسطه روزانه – بزرگسال، دانشگاه آزاد اسلامی، دانشگاه تهران، دانشگاه شهید بهشتی، دانشگاه علوم پزشکی شهید بهشتی، دانشگاه سوره
مدارک نهایی شما:
• قابل ترجمه رسمی با تاییدات دادگستری و وزارت امور خارجه
• قابل استعلام از کلیه ارگان‌های دولتی، خصوصی و دفاتر پیشخوان دولت
• برای مقاطع ارشد و دکتری، در صورت نیاز امکان چاپ پایان‌نامه، مقاله علمی و کتاب وجود دارد (هزینه اختصاصی)



📦 تحویل نهایی:
باقیمانده شهریه پس از مشاهده تصویر مدارک دریافت می‌شود.
مدارک فارغ‌التحصیلان (ریزنمرات، گواهی موقت پایان تحصیلات، اصل دیپلم یا دانشنامه) حداکثر طی ۲ روز کاری از ناحیه‌ی آموزشی یا واحد صادرکننده، به آدرس شما ارسال می‌گردد.



❗️ «متقاضی گرامی مطالب فوق را با دقت مطالعه فرمایید. در صورت نیاز به توضیحات بیشتر، با کارشناسان ما تماس بگیرید.»

“و من الله التوفیق”

ماجرا از دو حالت خارج نیست: یا با یک باند کلاهبرداری طرف هستیم که پول‌های کلان می‌گیرند و مدرکی هم در کار نیست، یا واقعاً دارند مدرک رسمی صادر می‌کنند؛آن هم برای کسانی که هیچ صلاحیتی ندارند.

برای چنین افتضاحی، مسئولان مربوطه و دانشگاه‌های مرتبط باید واقعاً شرمنده باشند که یا خواب هستند یا چشم بر این فاجعه بسته‌اند. بی‌عرضگی اگر این نیست، پس چیست؟

با ۳۰۰ میلیون تومان می‌توان مدرک پزشکی عمومی از دانشگاه علوم پزشکی شهید بهشتی خرید! مدرک دکترای تخصصی؟ فقط ۱۶۰ میلیون تومان.

مدرک‌فروشی به‌صورت علنی، در روز روشن و کسی هم عین خیالش نیست!


#مدرک_رسمی
#مدرک_فروشی

🆔 @irevidence
😢209😁6👍2
Evidence
▫️فروش مدرک رسمی از کاردانی تا دکتری تخصصی و حتی دکتری حرفه‌ای! در یکی از کانال‌های خبری که مخاطب میلیونی دارد، تبلیغ زیر را مشاهده کردم: 👮‍♂️ مدرک رسمی «دانشگاه علوم پزشکی شهید بهشتی» در کمتر از ۱۰ روز! ✔️ از کاردانی تا دکتری | کاملاً غیرحضوری ✔️ قابل…
▫️اقداماتی که انجام دادم:

۱- ابتدا با پلیس فتا تماس گرفتم. پس از چند دقیقه انتظار، با کارشناس مربوطه صحبت کردم و اطلاعات موسسه را در اختیار ایشان قرار دادم. گفتند که موضوع ثبت شد و اقدام لازم انجام خواهد شد. وقتی پرسیدم چگونه می‌توانم پیگیری کنم، گفتند نیازی به پیگیری شما نیست.

۲- با بازرسی دانشگاه علوم پزشکی شهید بهشتی تماس گرفتم. ابتدا گفتند باید با واحد حقوقی تماس بگیرم، اما بعد تأکید کردند که همین جا باید پیگیر باشم. درباره موسسه توضیح دادم و گفتند فرمی در سایت وجود دارد که باید آن را تکمیل و مستندات را ارسال کنم. این کار را انجام دادم. مجدداً تماس گرفتم تا مطمئن شوم اطلاعات را دریافت کرده‌اند؛ گفتند ادمین سایت در مرخصی است و بعداً بررسی خواهد شد.

۳- با حراست دانشگاه شهید بهشتی (وابسته به وزارت علوم) تماس گرفتم و نام موسسه را اعلام کردم. گفتند خودشان در جریان موضوع هستند و به مسئولین ذی‌ربط اطلاع داده‌اند.

۵- با حراست دانشگاه تهران تماس گرفتم. گفتند باید اطلاعات و مستندات را برایشان ایمیل کنم و این کار را انجام دادم.

۶- موفق نشدم شماره تماس واحد حقوقی، حراست یا بازرسی دانشگاه سوره را پیدا کنم. ناچاراً با روابط عمومی آن دانشگاه تماس گرفتم، اما پاسخی دریافت نکردم.

امیدوارم اقدام کنند!

به‌روزرسانی

دانشگاه علوم پزشکی شهید بهشتی اطلاعیه زیر را در صفحه اول سایت خود منتشر کرده است:

هشدار دانشگاه علوم پزشکی شهید بهشتی درباره تبلیغات کلاهبرداری صدور مدرک تحصیلی پزشکی در فضای مجازی


🆔 @irevidence
58👍24😁8👌6🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
▫️قابلیت Video Overviews به هوش مصنوعی NotebookLM اضافه شد

ابزار هوش مصنوعی NotebookLM گوگل با آپدیت جدید خود، امکان ساخت پادکست ویدیویی را به قابلیت‌هایش افزوده است. این ویژگی تازه که با نام Video Overviews شناخته می‌شود، به کاربران اجازه می‌دهد تا خلاصه‌های تصویری از اطلاعات و یادداشت‌های خود تهیه کنند.

این قابلیت اکنون بخش‌های مختلفی مانند راهنمای مطالعه، اسناد خلاصه، پرسش‌های متداول، جدول‌های زمانی و نقشه‌های ذهنی را در قالب ویدیوهای ساده و قابل فهم ارائه می‌کند. کاربران می‌توانند با تعیین موضوعات و هدف مخاطب، محتوای ویدیویی اختصاصی و متناسب با نیاز خود بسازند؛ به طور مثال می‌توانند مشخص کنند که روی کدام بخش‌ها یا موضوعات تاکید بیشتری شود.

قابلیت Video Overviews با استفاده از نمودار، تصویر و نقل‌قول، اطلاعات پیچیده را به زبانی ساده‌تر توضیح می‌دهد و به درک بهتر مطالب کمک می‌کند. فعلاً این ویژگی برای کاربران انگلیسی‌زبان فعال است اما قرار است به زودی پشتیبانی از زبان‌ها و فرمت‌های بیشتر هم اضافه شود.

#AI
#notebooklm

🆔 @irevidence
8👌4
▫️خودکارسازی مرورهای سیستماتیک با استفاده از مدل‌های زبانی بزرگ

Automation of Systematic Reviews with Large Language Models

این پژوهش (که بصورت Preprint در سرور medrxiv منتشر شده است) یک گردش کار عاملی (agentic workflow) پیشرفته مبتنی بر هوش مصنوعی به نام otto-SR را معرفی و ارزیابی می‌کند که با استفاده از مدل‌های زبانی بزرگ فرآیند مرور سیستماتیک را از جستجوی اولیه تا تحلیل نهایی، به صورت خودکار انجام می‌دهد.

گردش کار سنتی به طور معمول شامل جستجو، غربالگری چکیده‌ها (Abstract Screening) و متن کامل (Full-text Screening) توسط دو داور انسانی به صورت مستقل و سپس استخراج داده‌ها (Data Extraction) توسط دو داور دیگر است که اختلافات توسط داور سوم حل می‌شود.

اما گردش کار سامانه otto-SR بدین صورت است:

غربالگری مقالات: از مدل GPT-4.1 برای غربالگری چکیده‌ها و متن کامل مقالات استفاده می‌کند.

استخراج داده‌ها: از مدل o3-mini-high برای استخراج متغیرهای تعریف‌شده از مقالات نهایی بهره می‌برد.

پردازش PDF: برای خواندن فایل‌های PDF و تبدیل آن‌ها به فرمت ساختاریافته Markdown (MD) جهت تحلیل توسط مدل‌های دیگر، از Gemini 2.0 Flash استفاده می‌شود.

ارزیابی عملکرد otto-SR در مقابل انسان و ابزارهای دیگر

‏otto-SR در دو بخش اصلی فرآیند SR (غربالگری و استخراج داده) با عملکرد داوران انسانی و یک نرم‌افزار تجاری دیگر به نام Elicit مقایسه شد.

غربالگری مقالات (Article Screening):

‏otto-SR عملکردی فراتر از انسان (superhuman) از خود نشان داد و توانست مطالعات مرتبط بیشتری را با حفظ دقت بالا شناسایی کند.

حساسیت (Sensitivity): توانایی در شناسایی صحیح مقالات مرتبط.

otto-SR با 96.7 درصد

داوران انسانی: 81.7 درصد (پس از حذف یک مطالعه نامرتبط)

ویژگی (Specificity): توانایی در رد صحیح مقالات نامرتبط

otto-SR با 97.9 درصد

داوران انسانی: 98.1 درصد

استخراج داده‌ها (Data Extraction):

‏ootto-SR در این بخش نیز به طور قابل توجهی دقیق‌تر از داوران انسانی و ابزار Elicit عمل کرد.

دقت (Accuracy):

‌‏otto-SR با 93.1 درصد

داوران انسانی: 79.7 درصد

سامانه Elicit با 74.8 درصد

یک نکته بسیار مهم این بود که در موارد اختلاف بین داده‌های استخراج شده توسط otto-SR و نویسندگان اصلی مرورها، یک هیئت داوری انسانی در 69.3 درصد موارد، داده‌های استخراج شده توسط otto-SR را صحیح تشخیص داد.

کاربرد در دنیای واقعی: بازتولید و به‌روزرسانی مرورهای کاکرین (Cochrane Reviews)

برای نمایش قابلیت otto-SR در عمل، محققان یک شماره کامل از مجله مرورهای مجله کاکرین (12 مرور) را بازتولید و به‌روزرسانی کردند:

سرعت شگفت‌انگیز: این کار که به طور سنتی معادل 12سال کاری تخمین زده می‌شود، توسط otto-SR تنها در دو روز انجام شد.

یافته‌های جدید: otto-SR به طور متوسط 2 مطالعه واجد شرایط در هر مرور پیدا کرد که به احتمال زیاد توسط نویسندگان اصلی نادیده گرفته شده بودند.
با اضافه شدن این مطالعات جدید، متاآنالیزها (Meta-analyses) تغییر کردند:

2 مرور به نتایج آماری معنادار جدیدی دست یافتند و 1 مرور معناداری آماری خود را از دست داد.

به عنوان مثال، در یک مرور تغذیه، otto-SR با یافتن 5 مطالعه اضافی نشان داد که مکمل‌های تقویت‌کننده سیستم ایمنی قبل از جراحی معده، میانگین اقامت در بیمارستان را یک روز کاهش می‌دهد؛ نتیجه‌ای که در مرور اصلی کاکرین یافت نشده بود.

چند نکته مهم:

پتانسیل عظیم LLMها: این فناوری می‌تواند برای به‌روزرسانی سریع مرورهای موجود، ایجاد مرورهای زنده و پویا (living systematic reviews) که به صورت روزانه یا هفتگی به‌روز می‌شوند، و تولید سریع مرورهای کاملاً جدید (de novo reviews) به کار گرفته شود.

چالش‌های تکرارپذیری: این مطالعه نشان داد که مرورهای فعلی اغلب در زمینه تکرارپذیری (به‌ویژه در استراتژی جستجو) دچار مشکل هستند.

آینده نشر علمی: نیاز به انتشار مطالعات به صورت قابل خواندن با ماشین (machine-readable) برای تسهیل چنین تحلیل‌های خودکاری بیش از پیش احساس می‌شود.


محققان به چندین محدودیت در کار خود اشاره کرده‌اند:

نیاز به ارزیابی در حوزه‌های بالینی بیشتر و مرورهای کیفی

خطاهای احتمالی در پردازش فایل‌های PDF.

عدم استخراج داده از جداول و شکل‌های تکمیلی

استفاده از "LLM به عنوان داور" برای ارزیابی دقت که خود ممکن است خطا داشته باشد.

ممکن است مرورهای Cochrane آوریل 2024 در داده‌های آموزش مدل وجود داشته باشد و این باعث سوگیری جزئی به نفع مطالعات قبلاً وارد شده شود، اما روی مطالعات جدیدی که otto-SR پیدا کرده تأثیری ندارد.

#AI
#LLM
#systematic_review
#evidence_synthesis

🆔 @irevidence
10👍6🤔3
▫️ویژگی‌های مهم GPT-5: مدل پرچم‌دار OpenAI

مدل GPT-5 در تاریخ ۷ آگوست به‌طور رسمی رونمایی شد و به‌عنوان جدیدترین و قدرتمندترین مدل شرکت OpenAI معرفی گردید. با عرضه این مدل، تمام نسخه‌های قبلی از جمله 40، 1-4، O3، O4 mini و سایر مدل‌ها کنار گذاشته شدند. اکنون تنها مدل موجود، GPT-5 است.

بر اساس توضیحات ارائه شده در سایت رسمی OpenAI، ویژگی‌های مهم و کلیدی این مدل عبارت‌اند از:

هوش و سرعت بالا: GPT-5 هوشمندترین و سریع‌ترین مدل OpenAI تا امروز است و می‌تواند هم در کارهای روزمره سریع باشد و هم در مسائل پیچیده با دقت و عمق فکر کند.

دو مسیر پردازش: دارای دو حالت اصلی است یک مدل سریع برای پاسخ‌های فوری و یک حالت "GPT-5 Thinking" برای حل مسائل سخت‌تر که با پرامپت خاص (مثلاً با نوشتن think hard about this) یا به‌صورت خودکار فعال می‌شود.

توانایی‌های کدنویسی پیشرفته: می‌تواند با یک پرامپت کامل، وب زیبا و واکنش‌گرا بسازد، کدهای پیچیده را اشکال‌زدایی کند و طراحی را با فاصله‌گذاری، تایپوگرافی و وایت‌اسپیس (فضای خالی) مناسب بهبود دهد.

کمک در نویسندگی و تولید محتوا: از از ایده‌پردازی اولیه تا نگارش متنی دقیق، منسجم و خوش‌خوان را پشتیبانی می‌کند و حتی در قالب‌های چالش‌برانگیز ادبی، مانند شعر آزاد یا موزون، آثاری با کیفیت و هنری ارائه می‌دهد.

دستیار هوشمند در حوزه سلامت: در سوالات مرتبط با سلامت عملکردی قوی دارد، نکات مهم را پررنگ می‌کند و سؤالات تکمیلی می‌پرسد، هرچند جایگزین مشاوره پزشکی نیست.

دقت بالا و خطای (توهم) کمتر: در مقایسه با مدل‌های قبلی، نرخ اشتباهات واقعی (factual) تا ۴۵٪ کمتر شده و در حالت thinking این کاهش به حدود ۸۰٪ می‌رسد، همچنین کمتر دچار اعتمادبه‌نفس کاذب می‌شود.

ایمنی و مسئولیت‌پذیری بیشتر: با رویکرد Safe Completions حتی در موضوعات حساس، پاسخ‌هایی امن و هم‌زمان کاربردی ارائه می‌دهد و هنگام امتناع دلیل آن را شفاف بیان می‌کند.

در مدل‌های قدیمی‌تر، سیستم اغلب بین دو حالت ساده گیر می‌کرد: یا پاسخ را کامل می‌داد (حتی اگر ممکن بود خطرناک یا نامناسب باشد) یا یک‌باره "رد می‌کرد" و چیزی نمی‌گفت. Safe Completions این رویکرد را اصلاح کرده و کاری می‌کند که:

پاسخ ایمن ارائه شود حتی در موضوعات حساس یا پرریسک، به‌جای صرفاً مسدود کردن.

اطلاعات خطرناک یا سوءاستفاده‌پذیر حذف یا بازنویسی شوند، اما بقیۀ محتوای مفید باقی بماند.

دلایل امتناع یا محدودیت‌ها شفاف توضیح داده شوند، به‌جای پاسخ مبهم یا خشک.

تعامل طبیعی‌تر: لحن مکالمه کمتر چاپلوسانه و ایموجی‌محور شده و شخصیت‌های آماده مثل Cynic، Robot، Listener و Nerd برای تنظیم سبک گفت‌وگو قابل انتخاب هستند.

کارآمدی بالاتر: با مصرف کمتر توکن می‌تواند همان کیفیت یا بهتر را ارائه دهد، که برای کاربران حرفه‌ای و پروژه‌های طولانی به‌صرفه‌تر است.

دسترسی گسترده: به‌صورت پیش‌فرض در ChatGPT موجود است و بسته به سطح اشتراک، کاربران می‌توانند از حالت کامل، Pro یا نسخه mini استفاده کنند؛ توسعه‌دهندگان نیز امکان استفاده از آن در ابزارهایی مثل Codex CLI را دارند.

آلتمن (مدیر شرکت OpenAI) مسیر رشد GPT را چنین توصیف می‌کند: GPT-3 شبیه گفت‌وگو با دانش‌آموز دبیرستانی بود، GPT-4 مثل حرف‌زدن با دانشجوی دانشگاه و GPT-5 برای نخستین بار حس هم‌صحبتی با متخصصی هم‌تراز دکترا را می‌دهد؛با پاسخ‌هایی پخته‌تر و قابل‌اتکاتر.

بلافاصله ایلان ماسک نیز، احتمالاً برای عقب نماندن از رقیبش، دسترسی رایگان همه کاربران به Grok 4 را فراهم کرد!

قبلاً پستی تحت عنوان: "پژوهش‌هایی که قبل از انتشار، منسوخ می‌شوند" نوشته بودم. با شتاب فعلی پیشرفت GPT، اوضاع از گذشته هم چالش‌برانگیزتر شده است؛ هزاران پژوهشِ منتشرشده با نسخه‌های قدیمی‌تر GPT و هزاران مقاله در حال نگارش، ارسال یا داوری، بر پایه مدل‌هایی انجام شده‌اند که دیگر وجود ندارند. بنابراین نه نتایجشان تکرارپذیر است و نه می‌توان با اطمینان به آنها تکیه کرد.

🔻از سرویس عکس GPT-5 خواستم برای این بیت تصویری بکشد:

یارم به یک لا پیرهن خوابیده زیر نسترن
ترسم که بوی نسترن مست است و هوشیارش کند

عکس را در پیوست می‌توانید ببینید. تصوراتم را نسبت به این بیت نابود کرد!


#AI
#LLM
#chatgpt
#gpt_5

🆔 @irevidence
😁255👌3👍2🙏1
▫️نظریه ناهماهنگی شناختی

دوستی داشتم که دانشجوی دکتری تخصصی بود و سیگار می‌کشید. هرگاه درباره مضرات سیگار صحبت می‌کردیم، او همیشه دلیل می‌آورد که سیگار برایش ضرری ندارد و آسیبی به او نرسانده است. مثلاً وقتی با هم فوتبال بازی می‌کردیم، می‌گفت: "ببینید، من از همه‌تان بیشتر می‌دوم و نفسم هم بهتر است. پس سیگار تأثیری روی من ندارد."

به دنبال نظریه‌ای بودم که بتواند این رفتار را تبیین کند. به‌طور کاملاً اتفاقی با نظریه ناهماهنگی شناختی (Cognitive Dissonance) آشنا شدم. این نظریه بیان می‌کند که:

وقتی فرد دو فکر، باور یا رفتار متضاد داشته باشد، دچار احساس ناراحتی روانی می‌شود. برای کاهش این ناراحتی، تلاش می‌کند یکی از آنها را تغییر دهد یا توجیه کند.


به زبان ساده تر:

وقتی چیزی که می‌دانیم با کاری که می‌کنیم جور درنیاید، ذهن‌مان دنبال بهانه یا توجیه می‌گردد تا آرام شود.

مبدع این نظریه، لئون فستینگر (Leon Festinger) است که روان‌شناس اجتماعی آمریکایی بود. او این نظریه را نخستین بار در سال ۱۹۵۷ در کتاب مشهورش با عنوان A Theory of Cognitive Dissonance مطرح کرد.

برگردیم به دوستم و ببینیم با این نظریه چگونه می‌توان رفتار او را تبیین کرد:

باور اول (دانش عمومی): سیگار مضر است و خطر سرطان و بیماری‌های قلبی-ریوی را بالا می‌برد.

رفتار واقعی: ولی دوستم سیگار می‌کشد.

این دو در تضادند، بنابراین ناهماهنگی شناختی ایجاد می‌شود.

راه‌حل‌های ذهنی دوستم برای کاهش این تنش:


انکار شواهد علمی یا کم‌اهمیت جلوه دادن آن‌ها: سیگار برای من ضرر ندارد.

تکیه بر تجربه‌های شخصی برای ابطال علم: من از همه بیشتر می‌دوم و نفسم قوی‌تر است، پس اثر منفی ندارد.

احساس استثنا بودن: دیگران ممکن است بیمار شوند، اما بدن من قوی‌تر است.

این سازوکارها نمونه‌های کلاسیک کاهش ناهماهنگی شناختی هستند. فرد به‌جای تغییر رفتار (ترک سیگار)، تفسیری از واقعیت می‌سازد که هم سیگار کشیدن را ادامه دهد و هم احساس بدی از تناقض با دانسته‌های علمی نداشته باشد.

یک مثال دیگر:

دانشجویی به فرد دیگری پول می‌دهد تا پایان‌نامه‌اش را برایش بنویسد.

باور درونی: موفقیت تحصیلی باید حاصل تلاش شخصی من باشد و تخلف علمی، غیراخلاقی است.

رفتار واقعی: سپردن پایان‌نامه به شخص دیگر

این تضاد باعث ناهماهنگی شناختی می‌شود. برای کاهش این تنش، دانشجو ممکن است باورش را تغییر دهد یا توجیه کند، مثلاً:

همه این کار را می‌کنند.

در کشور ما فقط به مدرک اهمیت می‌دهند، نه به یادگیری واقعی

اساتید به ما درست آموزش نداده‌اند؛ بنابراین من هم مجبور شدم این راه را انتخاب کنم

سیستم آموزشی ناکارآمد است، پس تقصیر من نیست.

به این ترتیب، به جای تغییر رفتار (نوشتن پایان‌نامه توسط خودش)، با تغییر یا توجیه باور، از فشار روانی رها می‌شود.

به نظر می‌رسد در بسیاری از مواقع، به‌جای آن‌که رفتار متناقض با باورهایمان را تغییر دهیم، باور خود را تغییر می‌دهیم تا از تنش روانی دور بمانیم. البته منظور، باورهای درست است نه باورهای کاذب.

🆔 @irevidence
👍2916👌4🙏1
▫️معیارهای نه گانه برادفورد هیل برای تعیین علیت رابطه‌ها

می دانیم که هر رابطه‌ای (Association) لزوماً از نوع علیت (causation) نیست. در سال 1965 سر آستین بردفورد هیل-استاد آمار زیستی دانشگاه لندن- مقاله‌ای تحت عنوان The Environment and Disease: Association or Causation منتشر کرد که در اصل، متن سخنرانی وی در یک کنفرانس بود.

هیل در این مقاله 9 معیار را برای تشخیص علیتِ رابطه‌های مشاهده شده، بیان می‌کند. البته هشدار هم می‌دهد که هیچکدام از این معیارها به تنهایی اثباتِ قطعی علت و معلول نیستند، بلکه مثل 9 منظر یا زوایه دید هستند که کمک می‌کنند تصمیم بگیریم: آیا رابطه‌ای که می‌بینیم بهترین توضیحش، علیت است یا نه؟

این معیارها بعد از گذشت 60 سال، همچنان قابل اعتنا هستند. با اینکه این معیارها در حوزه پزشکی و بهداشت مطرح شده‌اند، ولی بیشتر آن‌ها را می‌توان در حوزه‌های دیگر مثل آموزش، روانشناسی و سیاستگذاری هم اعمال کرد.

معیارهای نه‌گانه برادفورد هیل

1. قدرت ارتباط (Strength): یک ارتباط قوی و چشمگیر، بسیار بیشتر از یک ارتباط ضعیف احتمال دارد که علیّت را نشان دهد.

هرچه ریسک ابتلا به بیماری در افرادی که با یک عامل در تماس هستند، نسبت به افراد دیگر بیشتر باشد، احتمال اینکه آن عامل واقعاً علت بیماری باشد، بالاتر می‌رود.

2. تکرارپذیری یا سازگاری (Consistency): یافته‌ها باید تکرارپذیر باشند؛ یعنی توسط پژوهشگران مختلف، در مکان‌ها، زمان‌ها و شرایط گوناگون، نتیجه یکسانی مشاهده شود.

اگر مطالعات متعددی که در کشورهای مختلف و با روش‌های متفاوت انجام شده‌اند، همگی به یک نتیجه مشترک برسند (مثلاً سیگار با سرطان ریه ارتباط دارد)، اطمینان ما به وجود رابطه علیّت بیشتر می‌شود.

3. اختصاصی بودن (Specificity): یک عامل خطر مشخص، به یک بیماری مشخص منجر شود.

اگر یک عامل فقط و فقط باعث یک بیماری خاص در یک گروه خاص از افراد شود، این یک شاهد قوی برای علیّت است.

البته این معیار همیشه صادق نیست و نباید روی آن پافشاری کرد. یک عامل می‌تواند باعث چندین بیماری شود (مثلاً سیگار) و یک بیماری نیز می‌تواند چندین علت داشته باشد (مثلاً بیماری قلبی).

4. ترتیب زمانی (Temporality): علت باید همیشه پیش از معلول (بیماری) رخ دهد.

این شرط، یک اصل بدیهی و الزامی است. فرد باید ابتدا در معرض عامل خطر قرار گیرد و سپس به بیماری مبتلا شود.

5. شیب زیستی یا رابطه دوز-پاسخ (Biological Gradient): هرچه میزان مواجهه با عامل خطر بیشتر باشد، احتمال بروز بیماری نیز بیشتر شود.

اگر با افزایش مقدار یا مدت تماس با یک عامل، ریسک بیماری نیز به‌طور متناسب افزایش یابد، این یک شاهد بسیار قوی برای علیّت است.

6. باورپذیری (Plausibility): ارتباط مشاهده‌شده باید با دانش زیستی و پزشکی فعلی ما جور دربیاید و منطقی به نظر برسد.

آیا سازوکار قابل قبولی وجود دارد که توضیح دهد چگونه این عامل می‌تواند باعث آن بیماری شود؟

نکته مهم: هیل به‌شدت تأکید می‌کند که این معیار، یک شرط لازم نیست. دانش بشری همیشه در حال تکامل است و ممکن است یک ارتباط واقعی، با دانش امروزی ما غیرقابل‌باور به نظر برسد. نبودِ باورپذیری نباید باعث رد کردن یک ارتباط قوی شود.

7. همخوانی (Coherence): تفسیر علت و معلولی نباید با تاریخچه طبیعی و زیست‌شناسی شناخته‌شده آن بیماری در تضاد باشد.

یافته‌های ما باید با سایر دانسته‌هایمان درباره آن بیماری هماهنگ باشد و تصویر کلی را تکمیل کند.

8. شواهد تجربی (Experiment): اگر بتوانیم با انجام یک مداخله، میزان بیماری را کاهش دهیم، این قوی‌ترین نوع شاهد برای علیّت است.

اگر ما عامل خطری را که به آن مشکوک هستیم حذف کنیم (مثلاً با کاهش گرد و غبار در کارخانه یا تشویق مردم به ترک سیگار) و ببینیم که پس از آن، شیوع بیماری کاهش می‌یابد، این عملاً علیّت را اثبات می‌کند.

9. قیاس (Analogy): آیا ارتباط مشابهی در موارد دیگر مشاهده شده است؟


هیل هشدار می‌دهد که شواهد قوی به معنای شواهد قطعی و بی‌نقص نیست. علم همیشه در حال تکامل است و ما هرگز به دانش کامل دست پیدا نمی‌کنیم. ما نباید منتظر رسیدن به قطعیت مطلق بمانیم، بلکه باید بر اساس بهترین شواهد موجود در هر زمان، شجاعت تصمیم‌گیری و اقدام را داشته باشیم.

🔗 برای توضیحات بیشتر همراه با مثال به این لینک مراجعه کنید.


🆔 @irevidence
8👍2🙏1
2025/08/20 08:55:47
Back to Top
HTML Embed Code: