یه مدت پیش، تیم Google DeepMind یه مدل جدید به اسم Gemini Diffusion معرفی کرد.
فرقش با مدلهای کلاسیک مثل GPT اینه که GPT یه کلمه یه کلمه متن میسازه، ولی Gemini Diffusion کل یه تیکه متن رو با یه فرآیند تدریجی از نویز تصادفی درست میکنه و مرحلهبهمرحله اصلاحش میکنه.
اگر مقاله Large Language Diffusion Models رو بخونید متوجه میشن که Discrete Language Diffusion در واقع یه حالت کلیتر از همون MLM هست (همونی که از سال ۲۰۱۸ داریم انجامش میدیم)
حالا Discrete Language Diffusion Models چیه؟
مدلهای Diffusion اول تو دنیای تصویر معروف شدن. توی تصویرسازی، مدلهای Diffusion کمکم نویز Gaussian به عکس اضافه میکنن (Forward Process) و بعد یه شبکهی عصبی آموزش میبینن که اون نویز رو مرحلهبهمرحله حذف کنه (Reverse Process).
حالا ایده جدید برای ساخت مدل زبانی اینه که اگه بخوای ایده Diffusion رو به Language اعمال کنی، باید یه راهی برای «اضافه کردن نویز به متن» پیدا کنی که مثل تصویر با برطرف کردن نویز به صورت تصادفی در کل متن (نه مثل إBERT که فقط کلمه بعدی رو میگه) عمل کنی @silicon_brain | از هوش مصنوعی عقب نمانید
یه مدت پیش، تیم Google DeepMind یه مدل جدید به اسم Gemini Diffusion معرفی کرد.
فرقش با مدلهای کلاسیک مثل GPT اینه که GPT یه کلمه یه کلمه متن میسازه، ولی Gemini Diffusion کل یه تیکه متن رو با یه فرآیند تدریجی از نویز تصادفی درست میکنه و مرحلهبهمرحله اصلاحش میکنه.
اگر مقاله Large Language Diffusion Models رو بخونید متوجه میشن که Discrete Language Diffusion در واقع یه حالت کلیتر از همون MLM هست (همونی که از سال ۲۰۱۸ داریم انجامش میدیم)
حالا Discrete Language Diffusion Models چیه؟
مدلهای Diffusion اول تو دنیای تصویر معروف شدن. توی تصویرسازی، مدلهای Diffusion کمکم نویز Gaussian به عکس اضافه میکنن (Forward Process) و بعد یه شبکهی عصبی آموزش میبینن که اون نویز رو مرحلهبهمرحله حذف کنه (Reverse Process).
حالا ایده جدید برای ساخت مدل زبانی اینه که اگه بخوای ایده Diffusion رو به Language اعمال کنی، باید یه راهی برای «اضافه کردن نویز به متن» پیدا کنی که مثل تصویر با برطرف کردن نویز به صورت تصادفی در کل متن (نه مثل إBERT که فقط کلمه بعدی رو میگه) عمل کنی @silicon_brain | از هوش مصنوعی عقب نمانید
Official government accounts have also spread fake fact checks. An official Twitter account for the Russia diplomatic mission in Geneva shared a fake debunking video claiming without evidence that "Western and Ukrainian media are creating thousands of fake news on Russia every day." The video, which has amassed almost 30,000 views, offered a "how-to" spot misinformation. It is unclear who runs the account, although Russia's official Ministry of Foreign Affairs Twitter account promoted the Telegram channel on Saturday and claimed it was operated by "a group of experts & journalists." The War on Fakes channel has repeatedly attempted to push conspiracies that footage from Ukraine is somehow being falsified. One post on the channel from February 24 claimed without evidence that a widely viewed photo of a Ukrainian woman injured in an airstrike in the city of Chuhuiv was doctored and that the woman was seen in a different photo days later without injuries. The post, which has over 600,000 views, also baselessly claimed that the woman's blood was actually makeup or grape juice. After fleeing Russia, the brothers founded Telegram as a way to communicate outside the Kremlin's orbit. They now run it from Dubai, and Pavel Durov says it has more than 500 million monthly active users. Telegram Messenger Blocks Navalny Bot During Russian Election
from ye