Telegram Group & Telegram Channel
Методология работы с источниками

За время работы канала было переведено большое количество найденных иностранных аналитических документов, часть из которых была выложена здесь публично. Ниже обещанный пост с описанием методологии. Как можно убедиться, ничего экстраординарного в нашей работе нет, никаких специальных секретных знаний не требуется. Нужно лишь терпение, дисциплина и методичная работа.

Все начинается с найденного документа. Допустим, вы нашли где-то конкретный интересующий вас документ в формате pdf, либо просто регулярно занимаетесь мониторингом какой-то темы. Кстати, для последнего может подойти следующий гугл-дорк:
"cognitive warfare" filetype:pdf after:"2024-12-31"

Тему в первых кавычках и дату в последних меняйте по своему усмотрению.

И вот вы скачали документ, который хотите перевести на русский язык. Переводы мы делали через сайт www.deepl.com, один из лучших по качеству. Для перевода файла там требуется регистрация, но не требуется подтверждение почты. Это означает, что вы можете нажать «register» и ввести абсолютно любую почту, даже несуществующую. Главное, чтобы соблюдалась маска адреса емейла:
****@***.** 

Т.е., в вводимом адресе должны присутствовать символы @ и точка, остальное неважно.

У DeepL есть также ограничение на размер переводимого файла. Маленькие файлы (~ до 30 стр и до 5 мб) он может перевести сходу, без какой-либо подготовки. Большие придется пилить на части (см. дальше).

После регистрации, вы можете переводить на бесплатном тарифе 3 файла в месяц. Однако, если делать все в безопасном режиме браузера, и каждый раз вводить новую «почту», то ждать месяц не придется – вы точно сможете переводить 3 файла в день. Иногда нам удавалось даже делать несколько подходов с одного ip-адреса в день, но тут точной зависимости определить не удалось. Единственное, что удалось определить – точно должно пройти несколько часов, и лучше переключаться между безопасными режимами разных браузеров.

Само собой, ограничения работают по ip-адресу. Меняя свой ip-адрес (через раздачу мобильного интернета со смартфона, или используя VDS), вы можете увеличить количество файлов, которое можете перевести за один подход.

Для больших файлов требуется их разделение на части. Мы обычно пилили на куски по 30-40 стр с помощью сервиса https://www.ilovepdf.com/ («разделить pdf»), потом переводили их по очереди, и собирали в один с помощью этого же сервиса («объединить pdf»).

Однако, DeepL убивает верстку в файле, если она была. Иными словами, если в pdf файле был дизайн с картинками – все поедет вкривь и вкось. Чтобы этого избежать, мы переводили полученные pdf сначала в doc, после чего занимались ручной правкой верстки. Иногда, если дизайн не несет никакой смысловой нагрузки, и является лишь украшательством, мы вообще переводили предварительно pdf в голый txt.

DeepL не переводит картинки и графики, это стоит учитывать.

Также DeepL на бесплатном тарифе, при переводе doc, устанавливает на них защиту от редактирования. Это можно обойти, если полученные doc конвертировать в pdf (c помощью все того же https://www.ilovepdf.com/), потом объединить pdf и обратно конвертировать в doc.

Желающие могут избежать всех этих танцев с бубнами, если купят себе платную подписку на DeepL, тогда можно будет переводить гораздо большие объемы файлов (вплоть до 30мб). Но ограничение на месяц тогда уже будет строго привязано к аккаунту.

После получения финального doc, выполнялась ручная чистка его форматирования, а также проверка по смыслам. Все же не всегда нейросеть переводит корректно, особенно это касается специфических устойчивых выражений.

Как видите, ничего особо сложного, справиться может любой. Пользуйтес)



group-telegram.com/midintern/504
Create:
Last Update:

Методология работы с источниками

За время работы канала было переведено большое количество найденных иностранных аналитических документов, часть из которых была выложена здесь публично. Ниже обещанный пост с описанием методологии. Как можно убедиться, ничего экстраординарного в нашей работе нет, никаких специальных секретных знаний не требуется. Нужно лишь терпение, дисциплина и методичная работа.

Все начинается с найденного документа. Допустим, вы нашли где-то конкретный интересующий вас документ в формате pdf, либо просто регулярно занимаетесь мониторингом какой-то темы. Кстати, для последнего может подойти следующий гугл-дорк:

"cognitive warfare" filetype:pdf after:"2024-12-31"

Тему в первых кавычках и дату в последних меняйте по своему усмотрению.

И вот вы скачали документ, который хотите перевести на русский язык. Переводы мы делали через сайт www.deepl.com, один из лучших по качеству. Для перевода файла там требуется регистрация, но не требуется подтверждение почты. Это означает, что вы можете нажать «register» и ввести абсолютно любую почту, даже несуществующую. Главное, чтобы соблюдалась маска адреса емейла:
****@***.** 

Т.е., в вводимом адресе должны присутствовать символы @ и точка, остальное неважно.

У DeepL есть также ограничение на размер переводимого файла. Маленькие файлы (~ до 30 стр и до 5 мб) он может перевести сходу, без какой-либо подготовки. Большие придется пилить на части (см. дальше).

После регистрации, вы можете переводить на бесплатном тарифе 3 файла в месяц. Однако, если делать все в безопасном режиме браузера, и каждый раз вводить новую «почту», то ждать месяц не придется – вы точно сможете переводить 3 файла в день. Иногда нам удавалось даже делать несколько подходов с одного ip-адреса в день, но тут точной зависимости определить не удалось. Единственное, что удалось определить – точно должно пройти несколько часов, и лучше переключаться между безопасными режимами разных браузеров.

Само собой, ограничения работают по ip-адресу. Меняя свой ip-адрес (через раздачу мобильного интернета со смартфона, или используя VDS), вы можете увеличить количество файлов, которое можете перевести за один подход.

Для больших файлов требуется их разделение на части. Мы обычно пилили на куски по 30-40 стр с помощью сервиса https://www.ilovepdf.com/ («разделить pdf»), потом переводили их по очереди, и собирали в один с помощью этого же сервиса («объединить pdf»).

Однако, DeepL убивает верстку в файле, если она была. Иными словами, если в pdf файле был дизайн с картинками – все поедет вкривь и вкось. Чтобы этого избежать, мы переводили полученные pdf сначала в doc, после чего занимались ручной правкой верстки. Иногда, если дизайн не несет никакой смысловой нагрузки, и является лишь украшательством, мы вообще переводили предварительно pdf в голый txt.

DeepL не переводит картинки и графики, это стоит учитывать.

Также DeepL на бесплатном тарифе, при переводе doc, устанавливает на них защиту от редактирования. Это можно обойти, если полученные doc конвертировать в pdf (c помощью все того же https://www.ilovepdf.com/), потом объединить pdf и обратно конвертировать в doc.

Желающие могут избежать всех этих танцев с бубнами, если купят себе платную подписку на DeepL, тогда можно будет переводить гораздо большие объемы файлов (вплоть до 30мб). Но ограничение на месяц тогда уже будет строго привязано к аккаунту.

После получения финального doc, выполнялась ручная чистка его форматирования, а также проверка по смыслам. Все же не всегда нейросеть переводит корректно, особенно это касается специфических устойчивых выражений.

Как видите, ничего особо сложного, справиться может любой. Пользуйтес)

BY ГРАНИТ. Когнитивная война и мир


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/midintern/504

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Continuing its crackdown against entities allegedly involved in a front-running scam using messaging app Telegram, Sebi on Thursday carried out search and seizure operations at the premises of eight entities in multiple locations across the country. "There are several million Russians who can lift their head up from propaganda and try to look for other sources, and I'd say that most look for it on Telegram," he said. In 2018, Russia banned Telegram although it reversed the prohibition two years later. This provided opportunity to their linked entities to offload their shares at higher prices and make significant profits at the cost of unsuspecting retail investors. One thing that Telegram now offers to all users is the ability to “disappear” messages or set remote deletion deadlines. That enables users to have much more control over how long people can access what you’re sending them. Given that Russian law enforcement officials are reportedly (via Insider) stopping people in the street and demanding to read their text messages, this could be vital to protect individuals from reprisals.
from sg


Telegram ГРАНИТ. Когнитивная война и мир
FROM American