Telegram Group & Telegram Channel
Методология работы с источниками

За время работы канала было переведено большое количество найденных иностранных аналитических документов, часть из которых была выложена здесь публично. Ниже обещанный пост с описанием методологии. Как можно убедиться, ничего экстраординарного в нашей работе нет, никаких специальных секретных знаний не требуется. Нужно лишь терпение, дисциплина и методичная работа.

Все начинается с найденного документа. Допустим, вы нашли где-то конкретный интересующий вас документ в формате pdf, либо просто регулярно занимаетесь мониторингом какой-то темы. Кстати, для последнего может подойти следующий гугл-дорк:
"cognitive warfare" filetype:pdf after:"2024-12-31"

Тему в первых кавычках и дату в последних меняйте по своему усмотрению.

И вот вы скачали документ, который хотите перевести на русский язык. Переводы мы делали через сайт www.deepl.com, один из лучших по качеству. Для перевода файла там требуется регистрация, но не требуется подтверждение почты. Это означает, что вы можете нажать «register» и ввести абсолютно любую почту, даже несуществующую. Главное, чтобы соблюдалась маска адреса емейла:
****@***.** 

Т.е., в вводимом адресе должны присутствовать символы @ и точка, остальное неважно.

У DeepL есть также ограничение на размер переводимого файла. Маленькие файлы (~ до 30 стр и до 5 мб) он может перевести сходу, без какой-либо подготовки. Большие придется пилить на части (см. дальше).

После регистрации, вы можете переводить на бесплатном тарифе 3 файла в месяц. Однако, если делать все в безопасном режиме браузера, и каждый раз вводить новую «почту», то ждать месяц не придется – вы точно сможете переводить 3 файла в день. Иногда нам удавалось даже делать несколько подходов с одного ip-адреса в день, но тут точной зависимости определить не удалось. Единственное, что удалось определить – точно должно пройти несколько часов, и лучше переключаться между безопасными режимами разных браузеров.

Само собой, ограничения работают по ip-адресу. Меняя свой ip-адрес (через раздачу мобильного интернета со смартфона, или используя VDS), вы можете увеличить количество файлов, которое можете перевести за один подход.

Для больших файлов требуется их разделение на части. Мы обычно пилили на куски по 30-40 стр с помощью сервиса https://www.ilovepdf.com/ («разделить pdf»), потом переводили их по очереди, и собирали в один с помощью этого же сервиса («объединить pdf»).

Однако, DeepL убивает верстку в файле, если она была. Иными словами, если в pdf файле был дизайн с картинками – все поедет вкривь и вкось. Чтобы этого избежать, мы переводили полученные pdf сначала в doc, после чего занимались ручной правкой верстки. Иногда, если дизайн не несет никакой смысловой нагрузки, и является лишь украшательством, мы вообще переводили предварительно pdf в голый txt.

DeepL не переводит картинки и графики, это стоит учитывать.

Также DeepL на бесплатном тарифе, при переводе doc, устанавливает на них защиту от редактирования. Это можно обойти, если полученные doc конвертировать в pdf (c помощью все того же https://www.ilovepdf.com/), потом объединить pdf и обратно конвертировать в doc.

Желающие могут избежать всех этих танцев с бубнами, если купят себе платную подписку на DeepL, тогда можно будет переводить гораздо большие объемы файлов (вплоть до 30мб). Но ограничение на месяц тогда уже будет строго привязано к аккаунту.

После получения финального doc, выполнялась ручная чистка его форматирования, а также проверка по смыслам. Все же не всегда нейросеть переводит корректно, особенно это касается специфических устойчивых выражений.

Как видите, ничего особо сложного, справиться может любой. Пользуйтес)



group-telegram.com/midintern/504
Create:
Last Update:

Методология работы с источниками

За время работы канала было переведено большое количество найденных иностранных аналитических документов, часть из которых была выложена здесь публично. Ниже обещанный пост с описанием методологии. Как можно убедиться, ничего экстраординарного в нашей работе нет, никаких специальных секретных знаний не требуется. Нужно лишь терпение, дисциплина и методичная работа.

Все начинается с найденного документа. Допустим, вы нашли где-то конкретный интересующий вас документ в формате pdf, либо просто регулярно занимаетесь мониторингом какой-то темы. Кстати, для последнего может подойти следующий гугл-дорк:

"cognitive warfare" filetype:pdf after:"2024-12-31"

Тему в первых кавычках и дату в последних меняйте по своему усмотрению.

И вот вы скачали документ, который хотите перевести на русский язык. Переводы мы делали через сайт www.deepl.com, один из лучших по качеству. Для перевода файла там требуется регистрация, но не требуется подтверждение почты. Это означает, что вы можете нажать «register» и ввести абсолютно любую почту, даже несуществующую. Главное, чтобы соблюдалась маска адреса емейла:
****@***.** 

Т.е., в вводимом адресе должны присутствовать символы @ и точка, остальное неважно.

У DeepL есть также ограничение на размер переводимого файла. Маленькие файлы (~ до 30 стр и до 5 мб) он может перевести сходу, без какой-либо подготовки. Большие придется пилить на части (см. дальше).

После регистрации, вы можете переводить на бесплатном тарифе 3 файла в месяц. Однако, если делать все в безопасном режиме браузера, и каждый раз вводить новую «почту», то ждать месяц не придется – вы точно сможете переводить 3 файла в день. Иногда нам удавалось даже делать несколько подходов с одного ip-адреса в день, но тут точной зависимости определить не удалось. Единственное, что удалось определить – точно должно пройти несколько часов, и лучше переключаться между безопасными режимами разных браузеров.

Само собой, ограничения работают по ip-адресу. Меняя свой ip-адрес (через раздачу мобильного интернета со смартфона, или используя VDS), вы можете увеличить количество файлов, которое можете перевести за один подход.

Для больших файлов требуется их разделение на части. Мы обычно пилили на куски по 30-40 стр с помощью сервиса https://www.ilovepdf.com/ («разделить pdf»), потом переводили их по очереди, и собирали в один с помощью этого же сервиса («объединить pdf»).

Однако, DeepL убивает верстку в файле, если она была. Иными словами, если в pdf файле был дизайн с картинками – все поедет вкривь и вкось. Чтобы этого избежать, мы переводили полученные pdf сначала в doc, после чего занимались ручной правкой верстки. Иногда, если дизайн не несет никакой смысловой нагрузки, и является лишь украшательством, мы вообще переводили предварительно pdf в голый txt.

DeepL не переводит картинки и графики, это стоит учитывать.

Также DeepL на бесплатном тарифе, при переводе doc, устанавливает на них защиту от редактирования. Это можно обойти, если полученные doc конвертировать в pdf (c помощью все того же https://www.ilovepdf.com/), потом объединить pdf и обратно конвертировать в doc.

Желающие могут избежать всех этих танцев с бубнами, если купят себе платную подписку на DeepL, тогда можно будет переводить гораздо большие объемы файлов (вплоть до 30мб). Но ограничение на месяц тогда уже будет строго привязано к аккаунту.

После получения финального doc, выполнялась ручная чистка его форматирования, а также проверка по смыслам. Все же не всегда нейросеть переводит корректно, особенно это касается специфических устойчивых выражений.

Как видите, ничего особо сложного, справиться может любой. Пользуйтес)

BY ГРАНИТ. Когнитивная война и мир


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/midintern/504

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

"Like the bombing of the maternity ward in Mariupol," he said, "Even before it hits the news, you see the videos on the Telegram channels." In 2018, Russia banned Telegram although it reversed the prohibition two years later. The perpetrators use various names to carry out the investment scams. They may also impersonate or clone licensed capital market intermediaries by using the names, logos, credentials, websites and other details of the legitimate entities to promote the illegal schemes. The company maintains that it cannot act against individual or group chats, which are “private amongst their participants,” but it will respond to requests in relation to sticker sets, channels and bots which are publicly available. During the invasion of Ukraine, Pavel Durov has wrestled with this issue a lot more prominently than he has before. Channels like Donbass Insider and Bellum Acta, as reported by Foreign Policy, started pumping out pro-Russian propaganda as the invasion began. So much so that the Ukrainian National Security and Defense Council issued a statement labeling which accounts are Russian-backed. Ukrainian officials, in potential violation of the Geneva Convention, have shared imagery of dead and captured Russian soldiers on the platform. Update March 8, 2022: EFF has clarified that Channels and Groups are not fully encrypted, end-to-end, updated our post to link to Telegram’s FAQ for Cloud and Secret chats, updated to clarify that auto-delete is available for group and channel admins, and added some additional links.
from us


Telegram ГРАНИТ. Когнитивная война и мир
FROM American