group-telegram.com/sysblok/1170
Last Update:
Только не списывай точь-в-точь: автоматический поиск аллюзий и цитат в древнеримской литературе
Выявление цитат и аллюзий — важная задача филологов, справляться с которой до недавнего времени приходилось традиционными методами. Особенно сложной она оказывается тогда, когда имеешь дело с произведениями, авторы и аудитория которых жили в совершенно другом контексте: литературном и историческом. К счастью, сегодня у исследователей есть цифровые инструменты, которые могут помочь разобраться с интертекстуальностью. Рассказываем о проекте Tesserae, который помогает находить аллюзии и цитаты в древнеримской литературе.
Кратко: что за проект?
Tesserae — проект университета Баффало, бесплатное веб-приложение, которое работает с корпусом текстов из баз Perseus Digital Library и The Latin Library. Работая с Tesserae, пользователь выбирает два произведения из корпуса, после чего программа сравнивает их и возвращает список всех предложений, которые содержат хотя бы два совпадающих слова.
Предложения, в которых нашлись такие совпадения, получают оценку от 2 до 10. Программа учитывает два параметра: частотность употребления слов и расстояние между ними во фразе. Сравнительно редкие слова, стоящие рядом, с большей вероятностью будут составлять осознанную отсылку или цитату и, соответственно, получат более высокий балл.
Искать совпадения можно не только по точной форме, но и по лемме (начальной форме), похожему звучанию и даже по семантической близости. Например, при сравнении стихотворений Катулла с «Георгиками» Вергилия в качестве совпадений были найдены tacet nox (Catullus 7.7) и silet nox (Georgics 1.247). И то, и другое можно перевести как «ночь молчит», хотя авторы использовали два разных глагола.
Самый простой результат работы с Tesserae — выявление новых текстовых параллелей, которые до этого не были отмечены комментаторами. В ходе тестирований команда проекта обнаружила потенциальную аллюзию к «Энеиде» в первой книге «Фарсалии» Лукана.
Правда, работа филолога все еще важна даже при наличии Tesserae, поскольку каждый полученный результат нужно рассматривать отдельно и пытаться объяснить в зависимости от контекста. Программа этого пока не умеет — только выполняет умный поиск по корпусу на предмет лексических совпадений.
Подробнее о проекте и задачах, в решении которых он может помочь, а также о том, зачем филологи вообще ищут цитаты и отсылки, узнаете из полной версии статьи.
Время чтения: 12 минут