Telegram Group & Telegram Channel
🔴مدل Cell2Sentence: انقلابی در فهم زبان سلول‌ها با هوش مصنوعی!

🧬در دنیایی که داده‌های زیست‌پزشکی سریع‌تر از توان ما برای تفسیر آن‌ها رشد می‌کنند، یک نوآوری برجسته در حال بازنویسی قواعد بازی است. با معرفی مدل Cell2Sentence (C2S) که حاصل همکاری مشترک دانشگاه Yale، گوگل ریسرچ و گوگل دیپ‌مایند است، شاهد یک جهش مفهومی هستیم: برای نخستین بار، مدل‌های زبانی بزرگ (LLMs) آموزش دیده‌اند تا زبان زیست‌شناسی را در سطح سلول منفرد (Single-Cell) درک کنند.

🔴در قلب این نوآوری، C2S داده‌های single-cell transcriptomes را به دنباله‌های متنی طبیعی تبدیل می‌کند، به گونه‌ای که مدل‌های زبانی نه تنها داده‌های خام بیان ژن، بلکه فرا‌داده (metadata)، حاشیه‌نویسی‌های زیستی (annotations) و منابع علمی (scientific literature) را نیز به صورت یکپارچه دریافت و تفسیر می‌کنند. این فرآیند هر سلول را به داستانی تبدیل می‌کند که توسط هوش مصنوعی قابل خواندن و درک است.

🧠با تکیه بر یک بدنه‌ی متنی یک میلیارد توکنی که شامل اطلاعات بیش از ۵۰ میلیون سلول انسانی و موشی است، Cell2Sentence از مدل‌هایی با اندازه ۴۱۰ میلیون تا ۲۷ میلیارد پارامتر بهره می‌برد، از جمله مدل‌های متن‌باز مانند Gemma از Google DeepMind. یافته‌ها نشان می‌دهند که با افزایش مقیاس مدل، توانایی درک مفاهیم زیستی نیز افزایش می‌یابد. اما بزرگی مدل تنها عامل مؤثر نیست. با استفاده از روشی ویژه در یادگیری تقویتی به نام بهینه‌سازی سیاست پاداش‌محور (Goal-Rewarded Policy Optimization یا GRPO)، مدل‌ها برای اولویت‌بخشی به اهمیت زیستی تنظیم شده‌اند. این امر دقت پیش‌بینی‌ها را در وظایف کلیدی زیر به‌طور چشم‌گیری افزایش داده است:
تعیین نوع سلول (Cell-type annotation) با دقت بالا
پیش‌بینی پاسخ سلول‌ها به محرک‌های ناشناخته (unseen perturbations)
تولید خلاصه‌های متنی از مجموعه‌های داده زیستی (natural-language summaries)
استنباط روابط فضایی (spatial relationships) حتی از داده‌های فاقد موقعیت مکانی
پاسخ به سؤالات پیچیده زیستی (biological Q&A) بر پایه داده‌های تک‌سلولی

🤔تصور کنید بتوانید از مدل بپرسید: «این سلول T چگونه به درمان ضد PD-1 پاسخ خواهد داد؟» و پاسخ دقیق، قابل فهم و مبتنی بر شواهد علمی دریافت کنید. Cell2Sentence این رویا را محقق ساخته است!

📎بیشتر بخوانید: Research Article

🧬در کانال انجمن علمی بیوانفورماتیک شبکه نخبگان ایران با ما همراه باشید⌨️
|
@BioInformatics_Association |
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/Bioinformatics_Association/8
Create:
Last Update:

🔴مدل Cell2Sentence: انقلابی در فهم زبان سلول‌ها با هوش مصنوعی!

🧬در دنیایی که داده‌های زیست‌پزشکی سریع‌تر از توان ما برای تفسیر آن‌ها رشد می‌کنند، یک نوآوری برجسته در حال بازنویسی قواعد بازی است. با معرفی مدل Cell2Sentence (C2S) که حاصل همکاری مشترک دانشگاه Yale، گوگل ریسرچ و گوگل دیپ‌مایند است، شاهد یک جهش مفهومی هستیم: برای نخستین بار، مدل‌های زبانی بزرگ (LLMs) آموزش دیده‌اند تا زبان زیست‌شناسی را در سطح سلول منفرد (Single-Cell) درک کنند.

🔴در قلب این نوآوری، C2S داده‌های single-cell transcriptomes را به دنباله‌های متنی طبیعی تبدیل می‌کند، به گونه‌ای که مدل‌های زبانی نه تنها داده‌های خام بیان ژن، بلکه فرا‌داده (metadata)، حاشیه‌نویسی‌های زیستی (annotations) و منابع علمی (scientific literature) را نیز به صورت یکپارچه دریافت و تفسیر می‌کنند. این فرآیند هر سلول را به داستانی تبدیل می‌کند که توسط هوش مصنوعی قابل خواندن و درک است.

🧠با تکیه بر یک بدنه‌ی متنی یک میلیارد توکنی که شامل اطلاعات بیش از ۵۰ میلیون سلول انسانی و موشی است، Cell2Sentence از مدل‌هایی با اندازه ۴۱۰ میلیون تا ۲۷ میلیارد پارامتر بهره می‌برد، از جمله مدل‌های متن‌باز مانند Gemma از Google DeepMind. یافته‌ها نشان می‌دهند که با افزایش مقیاس مدل، توانایی درک مفاهیم زیستی نیز افزایش می‌یابد. اما بزرگی مدل تنها عامل مؤثر نیست. با استفاده از روشی ویژه در یادگیری تقویتی به نام بهینه‌سازی سیاست پاداش‌محور (Goal-Rewarded Policy Optimization یا GRPO)، مدل‌ها برای اولویت‌بخشی به اهمیت زیستی تنظیم شده‌اند. این امر دقت پیش‌بینی‌ها را در وظایف کلیدی زیر به‌طور چشم‌گیری افزایش داده است:
تعیین نوع سلول (Cell-type annotation) با دقت بالا
پیش‌بینی پاسخ سلول‌ها به محرک‌های ناشناخته (unseen perturbations)
تولید خلاصه‌های متنی از مجموعه‌های داده زیستی (natural-language summaries)
استنباط روابط فضایی (spatial relationships) حتی از داده‌های فاقد موقعیت مکانی
پاسخ به سؤالات پیچیده زیستی (biological Q&A) بر پایه داده‌های تک‌سلولی

🤔تصور کنید بتوانید از مدل بپرسید: «این سلول T چگونه به درمان ضد PD-1 پاسخ خواهد داد؟» و پاسخ دقیق، قابل فهم و مبتنی بر شواهد علمی دریافت کنید. Cell2Sentence این رویا را محقق ساخته است!

📎بیشتر بخوانید: Research Article

🧬در کانال انجمن علمی بیوانفورماتیک شبکه نخبگان ایران با ما همراه باشید⌨️
|
@BioInformatics_Association |

BY انجمن علمی بیوانفورماتیک




Share with your friend now:
group-telegram.com/Bioinformatics_Association/8

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

What distinguishes the app from competitors is its use of what's known as channels: Public or private feeds of photos and videos that can be set up by one person or an organization. The channels have become popular with on-the-ground journalists, aid workers and Ukrainian President Volodymyr Zelenskyy, who broadcasts on a Telegram channel. The channels can be followed by an unlimited number of people. Unlike Facebook, Twitter and other popular social networks, there is no advertising on Telegram and the flow of information is not driven by an algorithm. Telegram, which does little policing of its content, has also became a hub for Russian propaganda and misinformation. Many pro-Kremlin channels have become popular, alongside accounts of journalists and other independent observers. Founder Pavel Durov says tech is meant to set you free The Russian invasion of Ukraine has been a driving force in markets for the past few weeks.
from us


Telegram انجمن علمی بیوانفورماتیک
FROM American