Telegram Group & Telegram Channel
⚡️ دانلود رایگان #حافظه_ترجمه

۱. پیکرهٔ موازی انگلیسی‌فارسی دانشگاه تهران (TEP)

این پیکره، که در آزمایشگاه پردازش زبان طبیعی دانشگاه تهران تهیه شده، مجموعه‌ای است حاوی بیش از ششصدهزار جملهٔ هم‌ترازشده انگلیسی و فارسی که از زیرنویس ۱۶۰۰ فیلم استخراج شده‌اند.

در پیوست این مطلب (یا از اینجا) می‌توانید این پیکره را به‌صورت حافظهٔ ترجمه دانلود کنید.
در این نسخه خطاهایی که مانع ایمپورت آن به نرم‌افزارهای مترجم‌یار (ترادوس، وردفست، ممکیو، میت‌کت، امگاتی و...) می‌شد برطرف کردیم و همچنین فاصلهٔ قبل از نقطه و کاما برداشته شده است.

حافظهٔ ترجمه فارسی‌انگلیسی از پیکره‌های دیگر:
2. CCMatrix v1
۲۴.۵ میلیون جمله، استخراج شده از وب، حجم ۲ گیگ

3. NLLB v1
۲۴.۵ میلیون جمله، ایجاد شده با متادیتا، حجم ۲ گیگ

4. OpenSubtitles v2018
۵.۵ میلیون جمله، برگرفته از فیلم‌های ترجمه‌شده، حجم ۲۰۰ مگ

5. CCAligned v1
۵.۲ میلیون جمله، استخراج‌شده از اسناد تحت وب، حجم ۴۵۰ مگ

6. LinguaTools-WikiTitles v2014
۳.۵ میلیون جمله، برگرفته از عنوان مقاله‌های ویکی‌پدیا، حجم ۴۰ مگ

7. XLEnt v1.2
۲ میلیون جمله، استخراج‌شده از وب، حجم ۴۵ مگ

8. WikiMatrix v1
۳۰۰ هزار جمله، استخراج‌شده از ویکی‌مدیا، حجم ۳۷ مگ

9. Tanzil v1
۱ میلیون جمله، برگرفته از ترجمهٔ قرآن، پروژهٔ تنزیل، حجم ۱۲۹ مگ

10. MIZAN v1
۱ میلیون جمله، استخراج‌شده از متون ادبی کلاسیک، حجم ۶۳ مگ

11. GNOME v1
۸ هزار جمله، برگرفته از فایل‌های بومی‌شدهٔ گنوم، حجم ۲۰۰ کیلوبایت

12. wikimedia v20230407
۳۰۰ هزار جمله، استخراج‌شده از مقاله‌های ویکی‌پدیا، حجم ۷۰ مگ

13. TED2020 v1
۳۰۰ هزار جمله، استخراج‌شده از زیرنویس‌های تد ۲۰۲۰، حجم ۲۶ مگ

14. QED v2.0a
۱۵ هزار جمله، برگرفته از زیرنویس‌های آموزشی آمارا، حجم ۸ مگ

15. NeuLab-TedTalks v1
۲۰۰ هزار جمله، برگرفته از زیرنویس‌های تد از طریق phontron.com، حجم ۱۴ مگ

16. KDE4 v2
۷۶ هزار جمله، استخراج‌شده از فایل‌های بومی‌شدهٔ کی‌دی‌ای، حجم ۲ مگ

17. Wikipedia v1.0
۹۵ هزار جمله، برگرفته از مقاله‌های ویکی‌پدیا، حجم ۱۰ مگ

18. TED2013 v1.1
۸۰ هزار جمله، استخراج‌شده از زیرنویس‌های تد ۲۰۱۳، حجم ۶.۸ مگ

19. infopankki v1
۱۵ هزار جمله، برگرفته از اوپن دیتا، حجم ۸۶۰ کیلوبایت

20. GlobalVoices v2018q4
۲۰ هزار جمله، استخراج‌شده از اخبار گلوبال ویسس، حجم ۱ مگ

21. tico-19 v2020-10-28
۳ هزار جمله، برگرفته از حافظه‌های ترجمه کووید-۱۹، حجم ۳۸۳ کلیوبابت

22. ELRC_2922 v1
۲ هزار جمله، استخراج‌شده از پایگاه سلامت ویکی‌پدیا، حجم ۲۵۰ کیلوبایت

23. ELRC-3078-wikipedia_health v1
۲ هزار جمله، استخراج‌شده از پایگاه سلامت ویکی‌پدیا، حجم ۲۵۰ کیلوبایت

24. ELRC-wikipedia_health v1
۲ هزار جمله، استخراج‌شده از پایگاه سلامت ویکی‌پدیا، حجم ۲۵۰ کیلوبایت


منبع: opus - the open parallel corpus

پیکرهٔ موازی و حافظهٔ ترجمهٔ زبان‌های دیگر را هم می‌توانید از همین منبع پیدا و دانلود کنید.

ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ

☕️ به شبکه‌های اجتماعی «مترجم‌شدن» بپیوندید:
کانال تلگرام | گروه تلگرام | اینستاگرام

▪️motarjemshodan | مترجم‌شدن 😎
Please open Telegram to view this post
VIEW IN TELEGRAM
18🤩8🙏8👍3👏3🔥21



group-telegram.com/motarjemshodan/492
Create:
Last Update:

⚡️ دانلود رایگان #حافظه_ترجمه

۱. پیکرهٔ موازی انگلیسی‌فارسی دانشگاه تهران (TEP)

این پیکره، که در آزمایشگاه پردازش زبان طبیعی دانشگاه تهران تهیه شده، مجموعه‌ای است حاوی بیش از ششصدهزار جملهٔ هم‌ترازشده انگلیسی و فارسی که از زیرنویس ۱۶۰۰ فیلم استخراج شده‌اند.

در پیوست این مطلب (یا از اینجا) می‌توانید این پیکره را به‌صورت حافظهٔ ترجمه دانلود کنید.
در این نسخه خطاهایی که مانع ایمپورت آن به نرم‌افزارهای مترجم‌یار (ترادوس، وردفست، ممکیو، میت‌کت، امگاتی و...) می‌شد برطرف کردیم و همچنین فاصلهٔ قبل از نقطه و کاما برداشته شده است.

حافظهٔ ترجمه فارسی‌انگلیسی از پیکره‌های دیگر:
2. CCMatrix v1
۲۴.۵ میلیون جمله، استخراج شده از وب، حجم ۲ گیگ

3. NLLB v1
۲۴.۵ میلیون جمله، ایجاد شده با متادیتا، حجم ۲ گیگ

4. OpenSubtitles v2018
۵.۵ میلیون جمله، برگرفته از فیلم‌های ترجمه‌شده، حجم ۲۰۰ مگ

5. CCAligned v1
۵.۲ میلیون جمله، استخراج‌شده از اسناد تحت وب، حجم ۴۵۰ مگ

6. LinguaTools-WikiTitles v2014
۳.۵ میلیون جمله، برگرفته از عنوان مقاله‌های ویکی‌پدیا، حجم ۴۰ مگ

7. XLEnt v1.2
۲ میلیون جمله، استخراج‌شده از وب، حجم ۴۵ مگ

8. WikiMatrix v1
۳۰۰ هزار جمله، استخراج‌شده از ویکی‌مدیا، حجم ۳۷ مگ

9. Tanzil v1
۱ میلیون جمله، برگرفته از ترجمهٔ قرآن، پروژهٔ تنزیل، حجم ۱۲۹ مگ

10. MIZAN v1
۱ میلیون جمله، استخراج‌شده از متون ادبی کلاسیک، حجم ۶۳ مگ

11. GNOME v1
۸ هزار جمله، برگرفته از فایل‌های بومی‌شدهٔ گنوم، حجم ۲۰۰ کیلوبایت

12. wikimedia v20230407
۳۰۰ هزار جمله، استخراج‌شده از مقاله‌های ویکی‌پدیا، حجم ۷۰ مگ

13. TED2020 v1
۳۰۰ هزار جمله، استخراج‌شده از زیرنویس‌های تد ۲۰۲۰، حجم ۲۶ مگ

14. QED v2.0a
۱۵ هزار جمله، برگرفته از زیرنویس‌های آموزشی آمارا، حجم ۸ مگ

15. NeuLab-TedTalks v1
۲۰۰ هزار جمله، برگرفته از زیرنویس‌های تد از طریق phontron.com، حجم ۱۴ مگ

16. KDE4 v2
۷۶ هزار جمله، استخراج‌شده از فایل‌های بومی‌شدهٔ کی‌دی‌ای، حجم ۲ مگ

17. Wikipedia v1.0
۹۵ هزار جمله، برگرفته از مقاله‌های ویکی‌پدیا، حجم ۱۰ مگ

18. TED2013 v1.1
۸۰ هزار جمله، استخراج‌شده از زیرنویس‌های تد ۲۰۱۳، حجم ۶.۸ مگ

19. infopankki v1
۱۵ هزار جمله، برگرفته از اوپن دیتا، حجم ۸۶۰ کیلوبایت

20. GlobalVoices v2018q4
۲۰ هزار جمله، استخراج‌شده از اخبار گلوبال ویسس، حجم ۱ مگ

21. tico-19 v2020-10-28
۳ هزار جمله، برگرفته از حافظه‌های ترجمه کووید-۱۹، حجم ۳۸۳ کلیوبابت

22. ELRC_2922 v1
۲ هزار جمله، استخراج‌شده از پایگاه سلامت ویکی‌پدیا، حجم ۲۵۰ کیلوبایت

23. ELRC-3078-wikipedia_health v1
۲ هزار جمله، استخراج‌شده از پایگاه سلامت ویکی‌پدیا، حجم ۲۵۰ کیلوبایت

24. ELRC-wikipedia_health v1
۲ هزار جمله، استخراج‌شده از پایگاه سلامت ویکی‌پدیا، حجم ۲۵۰ کیلوبایت


منبع: opus - the open parallel corpus

پیکرهٔ موازی و حافظهٔ ترجمهٔ زبان‌های دیگر را هم می‌توانید از همین منبع پیدا و دانلود کنید.

ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ

☕️ به شبکه‌های اجتماعی «مترجم‌شدن» بپیوندید:
کانال تلگرام | گروه تلگرام | اینستاگرام

▪️motarjemshodan | مترجم‌شدن 😎

BY مترجم شدن


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/motarjemshodan/492

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Since its launch in 2013, Telegram has grown from a simple messaging app to a broadcast network. Its user base isn’t as vast as WhatsApp’s, and its broadcast platform is a fraction the size of Twitter, but it’s nonetheless showing its use. While Telegram has been embroiled in controversy for much of its life, it has become a vital source of communication during the invasion of Ukraine. But, if all of this is new to you, let us explain, dear friends, what on Earth a Telegram is meant to be, and why you should, or should not, need to care. Telegram was founded in 2013 by two Russian brothers, Nikolai and Pavel Durov. Multiple pro-Kremlin media figures circulated the post's false claims, including prominent Russian journalist Vladimir Soloviev and the state-controlled Russian outlet RT, according to the DFR Lab's report. You may recall that, back when Facebook started changing WhatsApp’s terms of service, a number of news outlets reported on, and even recommended, switching to Telegram. Pavel Durov even said that users should delete WhatsApp “unless you are cool with all of your photos and messages becoming public one day.” But Telegram can’t be described as a more-secure version of WhatsApp. Lastly, the web previews of t.me links have been given a new look, adding chat backgrounds and design elements from the fully-features Telegram Web client.
from us


Telegram مترجم شدن
FROM American