Telegram Group & Telegram Channel
🔴مدل Cell2Sentence: انقلابی در فهم زبان سلول‌ها با هوش مصنوعی!

🧬در دنیایی که داده‌های زیست‌پزشکی سریع‌تر از توان ما برای تفسیر آن‌ها رشد می‌کنند، یک نوآوری برجسته در حال بازنویسی قواعد بازی است. با معرفی مدل Cell2Sentence (C2S) که حاصل همکاری مشترک دانشگاه Yale، گوگل ریسرچ و گوگل دیپ‌مایند است، شاهد یک جهش مفهومی هستیم: برای نخستین بار، مدل‌های زبانی بزرگ (LLMs) آموزش دیده‌اند تا زبان زیست‌شناسی را در سطح سلول منفرد (Single-Cell) درک کنند.

🔴در قلب این نوآوری، C2S داده‌های single-cell transcriptomes را به دنباله‌های متنی طبیعی تبدیل می‌کند، به گونه‌ای که مدل‌های زبانی نه تنها داده‌های خام بیان ژن، بلکه فرا‌داده (metadata)، حاشیه‌نویسی‌های زیستی (annotations) و منابع علمی (scientific literature) را نیز به صورت یکپارچه دریافت و تفسیر می‌کنند. این فرآیند هر سلول را به داستانی تبدیل می‌کند که توسط هوش مصنوعی قابل خواندن و درک است.

🧠با تکیه بر یک بدنه‌ی متنی یک میلیارد توکنی که شامل اطلاعات بیش از ۵۰ میلیون سلول انسانی و موشی است، Cell2Sentence از مدل‌هایی با اندازه ۴۱۰ میلیون تا ۲۷ میلیارد پارامتر بهره می‌برد، از جمله مدل‌های متن‌باز مانند Gemma از Google DeepMind. یافته‌ها نشان می‌دهند که با افزایش مقیاس مدل، توانایی درک مفاهیم زیستی نیز افزایش می‌یابد. اما بزرگی مدل تنها عامل مؤثر نیست. با استفاده از روشی ویژه در یادگیری تقویتی به نام بهینه‌سازی سیاست پاداش‌محور (Goal-Rewarded Policy Optimization یا GRPO)، مدل‌ها برای اولویت‌بخشی به اهمیت زیستی تنظیم شده‌اند. این امر دقت پیش‌بینی‌ها را در وظایف کلیدی زیر به‌طور چشم‌گیری افزایش داده است:
تعیین نوع سلول (Cell-type annotation) با دقت بالا
پیش‌بینی پاسخ سلول‌ها به محرک‌های ناشناخته (unseen perturbations)
تولید خلاصه‌های متنی از مجموعه‌های داده زیستی (natural-language summaries)
استنباط روابط فضایی (spatial relationships) حتی از داده‌های فاقد موقعیت مکانی
پاسخ به سؤالات پیچیده زیستی (biological Q&A) بر پایه داده‌های تک‌سلولی

🤔تصور کنید بتوانید از مدل بپرسید: «این سلول T چگونه به درمان ضد PD-1 پاسخ خواهد داد؟» و پاسخ دقیق، قابل فهم و مبتنی بر شواهد علمی دریافت کنید. Cell2Sentence این رویا را محقق ساخته است!

📎بیشتر بخوانید: Research Article

🧬در کانال انجمن علمی بیوانفورماتیک شبکه نخبگان ایران با ما همراه باشید⌨️
|
@BioInformatics_Association |
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/Bioinformatics_Association/8
Create:
Last Update:

🔴مدل Cell2Sentence: انقلابی در فهم زبان سلول‌ها با هوش مصنوعی!

🧬در دنیایی که داده‌های زیست‌پزشکی سریع‌تر از توان ما برای تفسیر آن‌ها رشد می‌کنند، یک نوآوری برجسته در حال بازنویسی قواعد بازی است. با معرفی مدل Cell2Sentence (C2S) که حاصل همکاری مشترک دانشگاه Yale، گوگل ریسرچ و گوگل دیپ‌مایند است، شاهد یک جهش مفهومی هستیم: برای نخستین بار، مدل‌های زبانی بزرگ (LLMs) آموزش دیده‌اند تا زبان زیست‌شناسی را در سطح سلول منفرد (Single-Cell) درک کنند.

🔴در قلب این نوآوری، C2S داده‌های single-cell transcriptomes را به دنباله‌های متنی طبیعی تبدیل می‌کند، به گونه‌ای که مدل‌های زبانی نه تنها داده‌های خام بیان ژن، بلکه فرا‌داده (metadata)، حاشیه‌نویسی‌های زیستی (annotations) و منابع علمی (scientific literature) را نیز به صورت یکپارچه دریافت و تفسیر می‌کنند. این فرآیند هر سلول را به داستانی تبدیل می‌کند که توسط هوش مصنوعی قابل خواندن و درک است.

🧠با تکیه بر یک بدنه‌ی متنی یک میلیارد توکنی که شامل اطلاعات بیش از ۵۰ میلیون سلول انسانی و موشی است، Cell2Sentence از مدل‌هایی با اندازه ۴۱۰ میلیون تا ۲۷ میلیارد پارامتر بهره می‌برد، از جمله مدل‌های متن‌باز مانند Gemma از Google DeepMind. یافته‌ها نشان می‌دهند که با افزایش مقیاس مدل، توانایی درک مفاهیم زیستی نیز افزایش می‌یابد. اما بزرگی مدل تنها عامل مؤثر نیست. با استفاده از روشی ویژه در یادگیری تقویتی به نام بهینه‌سازی سیاست پاداش‌محور (Goal-Rewarded Policy Optimization یا GRPO)، مدل‌ها برای اولویت‌بخشی به اهمیت زیستی تنظیم شده‌اند. این امر دقت پیش‌بینی‌ها را در وظایف کلیدی زیر به‌طور چشم‌گیری افزایش داده است:
تعیین نوع سلول (Cell-type annotation) با دقت بالا
پیش‌بینی پاسخ سلول‌ها به محرک‌های ناشناخته (unseen perturbations)
تولید خلاصه‌های متنی از مجموعه‌های داده زیستی (natural-language summaries)
استنباط روابط فضایی (spatial relationships) حتی از داده‌های فاقد موقعیت مکانی
پاسخ به سؤالات پیچیده زیستی (biological Q&A) بر پایه داده‌های تک‌سلولی

🤔تصور کنید بتوانید از مدل بپرسید: «این سلول T چگونه به درمان ضد PD-1 پاسخ خواهد داد؟» و پاسخ دقیق، قابل فهم و مبتنی بر شواهد علمی دریافت کنید. Cell2Sentence این رویا را محقق ساخته است!

📎بیشتر بخوانید: Research Article

🧬در کانال انجمن علمی بیوانفورماتیک شبکه نخبگان ایران با ما همراه باشید⌨️
|
@BioInformatics_Association |

BY انجمن علمی بیوانفورماتیک




Share with your friend now:
group-telegram.com/Bioinformatics_Association/8

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

And indeed, volatility has been a hallmark of the market environment so far in 2022, with the S&P 500 still down more than 10% for the year-to-date after first sliding into a correction last month. The CBOE Volatility Index, or VIX, has held at a lofty level of more than 30. "He has to start being more proactive and to find a real solution to this situation, not stay in standby without interfering. It's a very irresponsible position from the owner of Telegram," she said. Telegram Messenger Blocks Navalny Bot During Russian Election Telegram users are able to send files of any type up to 2GB each and access them from any device, with no limit on cloud storage, which has made downloading files more popular on the platform. For example, WhatsApp restricted the number of times a user could forward something, and developed automated systems that detect and flag objectionable content.
from sg


Telegram انجمن علمی بیوانفورماتیک
FROM American