🔍وقتی داده تمام میشود، آینده آموزش هوش مصنوعی کجاست؟
📚دادههای اینترنت برای آموزش مدلهای هوش مصنوعی رو به پایان است! اما شاید این موضوع خبر خوبی باشه! پژوهشهای تازه نشون میدن که نگاه ما به دادههای آموزشی هوش مصنوعی شاید از پایه اشتباه بوده.
💡با رسیدن به دیوار داده جایی که متن باکیفیت اینترنتی کمیاب میشه دیگه نمیشه صرفاً با اضافه کردن داده بیشتر پیش رفت.
🔧مدلها به تریلیونها توکن متن نیاز دارن، اما اینترنت محدوده. جمعآوری بیشتر وبسایتها بازدهی کاهشی داره و تکرار دادهها باعث بیشبرازش مدلها میشه. در عین حال، شکاف بزرگی بین محتوای اینترنت (بلاگها، خبرها و..) و نحوه استفاده واقعی ما از هوش مصنوعی (پرسشها و دستورالعملها) وجود داره.
✔️چارچوب BeyondWeb بهجای استفاده خام از محتوای اینترنت، اون رو بازنویسی میکنه تا به شکلهای جفت پرسشوپاسخ، محتوای آموزشی و قالبهای مکالمهای تبدیل بشن یعنی آموزش از کتاب درسی بهجای صفحات پراکنده وب.
🎯داریم وارد دورهای میشیم که انتخاب و دگرگونسازی دادهها از جمعآوری داده مهمتره.
🔍وقتی داده تمام میشود، آینده آموزش هوش مصنوعی کجاست؟
📚دادههای اینترنت برای آموزش مدلهای هوش مصنوعی رو به پایان است! اما شاید این موضوع خبر خوبی باشه! پژوهشهای تازه نشون میدن که نگاه ما به دادههای آموزشی هوش مصنوعی شاید از پایه اشتباه بوده.
💡با رسیدن به دیوار داده جایی که متن باکیفیت اینترنتی کمیاب میشه دیگه نمیشه صرفاً با اضافه کردن داده بیشتر پیش رفت.
🔧مدلها به تریلیونها توکن متن نیاز دارن، اما اینترنت محدوده. جمعآوری بیشتر وبسایتها بازدهی کاهشی داره و تکرار دادهها باعث بیشبرازش مدلها میشه. در عین حال، شکاف بزرگی بین محتوای اینترنت (بلاگها، خبرها و..) و نحوه استفاده واقعی ما از هوش مصنوعی (پرسشها و دستورالعملها) وجود داره.
✔️چارچوب BeyondWeb بهجای استفاده خام از محتوای اینترنت، اون رو بازنویسی میکنه تا به شکلهای جفت پرسشوپاسخ، محتوای آموزشی و قالبهای مکالمهای تبدیل بشن یعنی آموزش از کتاب درسی بهجای صفحات پراکنده وب.
🎯داریم وارد دورهای میشیم که انتخاب و دگرگونسازی دادهها از جمعآوری داده مهمتره.
Multiple pro-Kremlin media figures circulated the post's false claims, including prominent Russian journalist Vladimir Soloviev and the state-controlled Russian outlet RT, according to the DFR Lab's report. These entities are reportedly operating nine Telegram channels with more than five million subscribers to whom they were making recommendations on selected listed scrips. Such recommendations induced the investors to deal in the said scrips, thereby creating artificial volume and price rise. Telegram has become more interventionist over time, and has steadily increased its efforts to shut down these accounts. But this has also meant that the company has also engaged with lawmakers more generally, although it maintains that it doesn’t do so willingly. For instance, in September 2021, Telegram reportedly blocked a chat bot in support of (Putin critic) Alexei Navalny during Russia’s most recent parliamentary elections. Pavel Durov was quoted at the time saying that the company was obliged to follow a “legitimate” law of the land. He added that as Apple and Google both follow the law, to violate it would give both platforms a reason to boot the messenger from its stores. The account, "War on Fakes," was created on February 24, the same day Russian President Vladimir Putin announced a "special military operation" and troops began invading Ukraine. The page is rife with disinformation, according to The Atlantic Council's Digital Forensic Research Lab, which studies digital extremism and published a report examining the channel. What distinguishes the app from competitors is its use of what's known as channels: Public or private feeds of photos and videos that can be set up by one person or an organization. The channels have become popular with on-the-ground journalists, aid workers and Ukrainian President Volodymyr Zelenskyy, who broadcasts on a Telegram channel. The channels can be followed by an unlimited number of people. Unlike Facebook, Twitter and other popular social networks, there is no advertising on Telegram and the flow of information is not driven by an algorithm.
from us