Telegram Group & Telegram Channel
Методология работы с источниками

За время работы канала было переведено большое количество найденных иностранных аналитических документов, часть из которых была выложена здесь публично. Ниже обещанный пост с описанием методологии. Как можно убедиться, ничего экстраординарного в нашей работе нет, никаких специальных секретных знаний не требуется. Нужно лишь терпение, дисциплина и методичная работа.

Все начинается с найденного документа. Допустим, вы нашли где-то конкретный интересующий вас документ в формате pdf, либо просто регулярно занимаетесь мониторингом какой-то темы. Кстати, для последнего может подойти следующий гугл-дорк:
"cognitive warfare" filetype:pdf after:"2024-12-31"

Тему в первых кавычках и дату в последних меняйте по своему усмотрению.

И вот вы скачали документ, который хотите перевести на русский язык. Переводы мы делали через сайт www.deepl.com, один из лучших по качеству. Для перевода файла там требуется регистрация, но не требуется подтверждение почты. Это означает, что вы можете нажать «register» и ввести абсолютно любую почту, даже несуществующую. Главное, чтобы соблюдалась маска адреса емейла:
****@***.** 

Т.е., в вводимом адресе должны присутствовать символы @ и точка, остальное неважно.

У DeepL есть также ограничение на размер переводимого файла. Маленькие файлы (~ до 30 стр и до 5 мб) он может перевести сходу, без какой-либо подготовки. Большие придется пилить на части (см. дальше).

После регистрации, вы можете переводить на бесплатном тарифе 3 файла в месяц. Однако, если делать все в безопасном режиме браузера, и каждый раз вводить новую «почту», то ждать месяц не придется – вы точно сможете переводить 3 файла в день. Иногда нам удавалось даже делать несколько подходов с одного ip-адреса в день, но тут точной зависимости определить не удалось. Единственное, что удалось определить – точно должно пройти несколько часов, и лучше переключаться между безопасными режимами разных браузеров.

Само собой, ограничения работают по ip-адресу. Меняя свой ip-адрес (через раздачу мобильного интернета со смартфона, или используя VDS), вы можете увеличить количество файлов, которое можете перевести за один подход.

Для больших файлов требуется их разделение на части. Мы обычно пилили на куски по 30-40 стр с помощью сервиса https://www.ilovepdf.com/ («разделить pdf»), потом переводили их по очереди, и собирали в один с помощью этого же сервиса («объединить pdf»).

Однако, DeepL убивает верстку в файле, если она была. Иными словами, если в pdf файле был дизайн с картинками – все поедет вкривь и вкось. Чтобы этого избежать, мы переводили полученные pdf сначала в doc, после чего занимались ручной правкой верстки. Иногда, если дизайн не несет никакой смысловой нагрузки, и является лишь украшательством, мы вообще переводили предварительно pdf в голый txt.

DeepL не переводит картинки и графики, это стоит учитывать.

Также DeepL на бесплатном тарифе, при переводе doc, устанавливает на них защиту от редактирования. Это можно обойти, если полученные doc конвертировать в pdf (c помощью все того же https://www.ilovepdf.com/), потом объединить pdf и обратно конвертировать в doc.

Желающие могут избежать всех этих танцев с бубнами, если купят себе платную подписку на DeepL, тогда можно будет переводить гораздо большие объемы файлов (вплоть до 30мб). Но ограничение на месяц тогда уже будет строго привязано к аккаунту.

После получения финального doc, выполнялась ручная чистка его форматирования, а также проверка по смыслам. Все же не всегда нейросеть переводит корректно, особенно это касается специфических устойчивых выражений.

Как видите, ничего особо сложного, справиться может любой. Пользуйтес)



group-telegram.com/midintern/504
Create:
Last Update:

Методология работы с источниками

За время работы канала было переведено большое количество найденных иностранных аналитических документов, часть из которых была выложена здесь публично. Ниже обещанный пост с описанием методологии. Как можно убедиться, ничего экстраординарного в нашей работе нет, никаких специальных секретных знаний не требуется. Нужно лишь терпение, дисциплина и методичная работа.

Все начинается с найденного документа. Допустим, вы нашли где-то конкретный интересующий вас документ в формате pdf, либо просто регулярно занимаетесь мониторингом какой-то темы. Кстати, для последнего может подойти следующий гугл-дорк:

"cognitive warfare" filetype:pdf after:"2024-12-31"

Тему в первых кавычках и дату в последних меняйте по своему усмотрению.

И вот вы скачали документ, который хотите перевести на русский язык. Переводы мы делали через сайт www.deepl.com, один из лучших по качеству. Для перевода файла там требуется регистрация, но не требуется подтверждение почты. Это означает, что вы можете нажать «register» и ввести абсолютно любую почту, даже несуществующую. Главное, чтобы соблюдалась маска адреса емейла:
****@***.** 

Т.е., в вводимом адресе должны присутствовать символы @ и точка, остальное неважно.

У DeepL есть также ограничение на размер переводимого файла. Маленькие файлы (~ до 30 стр и до 5 мб) он может перевести сходу, без какой-либо подготовки. Большие придется пилить на части (см. дальше).

После регистрации, вы можете переводить на бесплатном тарифе 3 файла в месяц. Однако, если делать все в безопасном режиме браузера, и каждый раз вводить новую «почту», то ждать месяц не придется – вы точно сможете переводить 3 файла в день. Иногда нам удавалось даже делать несколько подходов с одного ip-адреса в день, но тут точной зависимости определить не удалось. Единственное, что удалось определить – точно должно пройти несколько часов, и лучше переключаться между безопасными режимами разных браузеров.

Само собой, ограничения работают по ip-адресу. Меняя свой ip-адрес (через раздачу мобильного интернета со смартфона, или используя VDS), вы можете увеличить количество файлов, которое можете перевести за один подход.

Для больших файлов требуется их разделение на части. Мы обычно пилили на куски по 30-40 стр с помощью сервиса https://www.ilovepdf.com/ («разделить pdf»), потом переводили их по очереди, и собирали в один с помощью этого же сервиса («объединить pdf»).

Однако, DeepL убивает верстку в файле, если она была. Иными словами, если в pdf файле был дизайн с картинками – все поедет вкривь и вкось. Чтобы этого избежать, мы переводили полученные pdf сначала в doc, после чего занимались ручной правкой верстки. Иногда, если дизайн не несет никакой смысловой нагрузки, и является лишь украшательством, мы вообще переводили предварительно pdf в голый txt.

DeepL не переводит картинки и графики, это стоит учитывать.

Также DeepL на бесплатном тарифе, при переводе doc, устанавливает на них защиту от редактирования. Это можно обойти, если полученные doc конвертировать в pdf (c помощью все того же https://www.ilovepdf.com/), потом объединить pdf и обратно конвертировать в doc.

Желающие могут избежать всех этих танцев с бубнами, если купят себе платную подписку на DeepL, тогда можно будет переводить гораздо большие объемы файлов (вплоть до 30мб). Но ограничение на месяц тогда уже будет строго привязано к аккаунту.

После получения финального doc, выполнялась ручная чистка его форматирования, а также проверка по смыслам. Все же не всегда нейросеть переводит корректно, особенно это касается специфических устойчивых выражений.

Как видите, ничего особо сложного, справиться может любой. Пользуйтес)

BY ГРАНИТ. Когнитивная война и мир


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/midintern/504

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Andrey, a Russian entrepreneur living in Brazil who, fearing retaliation, asked that NPR not use his last name, said Telegram has become one of the few places Russians can access independent news about the war. Apparently upbeat developments in Russia's discussions with Ukraine helped at least temporarily send investors back into risk assets. Russian President Vladimir Putin said during a meeting with his Belarusian counterpart Alexander Lukashenko that there were "certain positive developments" occurring in the talks with Ukraine, according to a transcript of their meeting. Putin added that discussions were happening "almost on a daily basis." "We're seeing really dramatic moves, and it's all really tied to Ukraine right now, and in a secondary way, in terms of interest rates," Octavio Marenzi, CEO of Opimas, told Yahoo Finance Live on Thursday. "This war in Ukraine is going to give the Fed the ammunition, the cover that it needs, to not raise interest rates too quickly. And I think Jay Powell is a very tepid sort of inflation fighter and he's not going to do as much as he needs to do to get that under control. And this seems like an excuse to kick the can further down the road still and not do too much too soon." Stocks closed in the red Friday as investors weighed upbeat remarks from Russian President Vladimir Putin about diplomatic discussions with Ukraine against a weaker-than-expected print on U.S. consumer sentiment. And indeed, volatility has been a hallmark of the market environment so far in 2022, with the S&P 500 still down more than 10% for the year-to-date after first sliding into a correction last month. The CBOE Volatility Index, or VIX, has held at a lofty level of more than 30.
from it


Telegram ГРАНИТ. Когнитивная война и мир
FROM American