group-telegram.com/midintern/504
Create:
Last Update:
Last Update:
Методология работы с источниками
За время работы канала было переведено большое количество найденных иностранных аналитических документов, часть из которых была выложена здесь публично. Ниже обещанный пост с описанием методологии. Как можно убедиться, ничего экстраординарного в нашей работе нет, никаких специальных секретных знаний не требуется. Нужно лишь терпение, дисциплина и методичная работа.
Все начинается с найденного документа. Допустим, вы нашли где-то конкретный интересующий вас документ в формате pdf, либо просто регулярно занимаетесь мониторингом какой-то темы. Кстати, для последнего может подойти следующий гугл-дорк:
"cognitive warfare" filetype:pdf after:"2024-12-31"
Тему в первых кавычках и дату в последних меняйте по своему усмотрению.
И вот вы скачали документ, который хотите перевести на русский язык. Переводы мы делали через сайт www.deepl.com, один из лучших по качеству. Для перевода файла там требуется регистрация, но не требуется подтверждение почты. Это означает, что вы можете нажать «register» и ввести абсолютно любую почту, даже несуществующую. Главное, чтобы соблюдалась маска адреса емейла:
****@***.**
Т.е., в вводимом адресе должны присутствовать символы @ и точка, остальное неважно.
У DeepL есть также ограничение на размер переводимого файла. Маленькие файлы (~ до 30 стр и до 5 мб) он может перевести сходу, без какой-либо подготовки. Большие придется пилить на части (см. дальше).
После регистрации, вы можете переводить на бесплатном тарифе 3 файла в месяц. Однако, если делать все в безопасном режиме браузера, и каждый раз вводить новую «почту», то ждать месяц не придется – вы точно сможете переводить 3 файла в день. Иногда нам удавалось даже делать несколько подходов с одного ip-адреса в день, но тут точной зависимости определить не удалось. Единственное, что удалось определить – точно должно пройти несколько часов, и лучше переключаться между безопасными режимами разных браузеров.
Само собой, ограничения работают по ip-адресу. Меняя свой ip-адрес (через раздачу мобильного интернета со смартфона, или используя VDS), вы можете увеличить количество файлов, которое можете перевести за один подход.
Для больших файлов требуется их разделение на части. Мы обычно пилили на куски по 30-40 стр с помощью сервиса https://www.ilovepdf.com/ («разделить pdf»), потом переводили их по очереди, и собирали в один с помощью этого же сервиса («объединить pdf»).
Однако, DeepL убивает верстку в файле, если она была. Иными словами, если в pdf файле был дизайн с картинками – все поедет вкривь и вкось. Чтобы этого избежать, мы переводили полученные pdf сначала в doc, после чего занимались ручной правкой верстки. Иногда, если дизайн не несет никакой смысловой нагрузки, и является лишь украшательством, мы вообще переводили предварительно pdf в голый txt.
DeepL не переводит картинки и графики, это стоит учитывать.
Также DeepL на бесплатном тарифе, при переводе doc, устанавливает на них защиту от редактирования. Это можно обойти, если полученные doc конвертировать в pdf (c помощью все того же https://www.ilovepdf.com/), потом объединить pdf и обратно конвертировать в doc.
Желающие могут избежать всех этих танцев с бубнами, если купят себе платную подписку на DeepL, тогда можно будет переводить гораздо большие объемы файлов (вплоть до 30мб). Но ограничение на месяц тогда уже будет строго привязано к аккаунту.
После получения финального doc, выполнялась ручная чистка его форматирования, а также проверка по смыслам. Все же не всегда нейросеть переводит корректно, особенно это касается специфических устойчивых выражений.
Как видите, ничего особо сложного, справиться может любой. Пользуйтес)
BY ГРАНИТ. Когнитивная война и мир
Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260
Share with your friend now:
group-telegram.com/midintern/504