Telegram Group Search
Не приехала бы в НН - не узнала бы о существовании такой коллабы.

Не знаю как это ощущается на вкус и цвет, но для любительниц эпатировать на публике своими палетками - маст хэв.

Что интересно у Роллтон уже давно товарный знак зарегистрирован для косметики (один и два), так что объединение брендов логично и хорошо со всех сторон.

Как Moschino, но по-домашнему.
Мы дождались: мышиный дом (aka Disney) подал иск против MidJourney, также к иску со стороны истцов подключилась компания Universal и дочерние студии.

Компании обвиняют ИИ сервис в том, что вопреки их запросам не были приняты меры, которые бы воспрепятствовали нарушению авторских прав.

Логика Disney и Universal такова: если сервис создал технологические инструменты, которые мешают генерить запрещенный контент (насилие и обнаженка), то проследить за качеством датасетов или внедрить фильтрацию запросов они тоже в состоянии.

В своем иске Disney и Universal просят суд обязать Midjourney сделать следующее:

1. Компенсировать ущерб студиям и отдать прибыль, которую Midjourney заработала на их работах.

2. Отчитаться о доходах и вернуть неосновательное обогащение.

3. Запретить Midjourney, ее сотрудникам и партнерам:
- Копировать, показывать или распространять работы Disney/Universal без разрешения.
- Запускать или работать над своим видеосервисом без защиты от копирования чужих работ.

4. Обязать Midjourney:
- Немедленно добавить надежную защиту от нарушений авторских прав в свой текущий сервис генерации изображений.
- Добавить такую же защиту в свой будущий сервис генерации видео.

130 страниц генераций Звездных Войн и Симпсонов - суду повезло.

А если серьезно, то появление в деле двух мейджеров говорит о том, что никакого консенсуса между двумя лагерями (правообладатели и ИИ сервисы) нет, а это значит, что никто не ждет регулирования или разрешения имеющихся споров.

UPD юзала DeepSeek для перевода с юридического на человеческий. Каюсь!
Хочу напомнить, что если вам интересны комментарии, лекции, консультации, вы хотите поделиться интересным делом или мемом (это важно!), со мной можно связаться через бот - @ip_QandA_bot

PS Я не публикую рекламу мероприятий/курсов/каналов, организаторов которых я не знаю и не видела образовательную программу. А если вы последователь стиля коммуникации: "прочитай мои мысли, что мне от тебя нужно" - ожидайте бан.

Помним мантру: без внятного тз - результат хз!
Please open Telegram to view this post
VIEW IN TELEGRAM
Обновленный-освеженный законопроект по компенсациям за нарушение прав ИС - это какой-то гомункул, созданный Лупой и Пупой.

Мало того, что это нечитабельное полотно, так еще и законотворческий процесс в России не предполагает нормальной инфографики или схем "было-стало" для общественного обсуждения.

Если до этого момента у меня было представление о том, что в целом и текст закона, и практика скорее в интересах ответчиков, то сейчас я не понимаю чьи интересы мы пытаемся защитить, куда идем и что хотим.

Очень странные изменения в определении "контрафакта", смена способа расчета по усмотрению суда, недокрученная логика солидарного взыскания компенсации и снижения размера компенсации за использование нескольких объектов, а еще просто бриллиантовое "самостоятельное экономическое значение".

Я с утра попыталась покрутить блок-схемы, чтобы попытаться найти какую-то взаимосвязь. Пока получилось так себе (в комментариях скину полную PDF версию).
Как раз в тему к предыдущему посту, ибо тут не обойтись без Deus ex machina.

На YouTube и в TikTok заблокировали в общем более 25 аккаунтов, распространявших сгенерированные с помощью ИИ проповеди нового Папы Римского Льва XIV.

Люди хотят узнать, что новый понтифик думает о тех или иных событиях в мире, поэтому спрос на такие видео высок, так что не удивительно, что такие видео-генерации появились.

Раньше для появления новых течений в религии нужны были споры о филиокве, злоупотребление индульгенциями и желание развестись с женой (привет Генриху VIII), а сейчас новое понимание веры может зародиться в генерациях, и чем не высший разум?
Мем смешной - ситуация тоже смешная. Пока есть задор удалять со звонков непрошеных ИИ агентов для транскрипции речи. Ибо все что возникло за контуром компании - остается вне контура компании.

Рассказывайте, как в ваших больших фирмах воюют с этой напастью? Блокировка сторонних приложений, ликбез, угрозы, порча, офлайн встречи, бдительность (простигосподи)?

У меня сегодня был улов из read AI и otter AI, последние стали особенно известны тем, что сотрудник отдела продаж техкомпании из Небраски использовал ассистента для записи и расшифровки закрытых онлайн встреч.

Узнала компания об этом, когда после увольнения работника на очередную встречу под именем работника подключился ИИ ассистент. Соответственно данные ушли из компании, а у экс-работника до сих пор к ним есть доступ (потому что все расшифровки хранятся в otter).

Теперь судебное разбирательство, а могли бы кикнуть бота.
Продолжаем парад рабочих мемов.

С каким еще лицом можно встречать полученные в ночи договоры с правками? 🌚
Please open Telegram to view this post
VIEW IN TELEGRAM
Треды с этим исследованием были у каждого второго блогера в Х, что с одной стороны не умаляет его ценности, с другой - давайте рассмотрим его повнимательнее.

Дано: статья под названием "Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task". Если коротко, то исследователи попросили "студентов" из университетов США написать за 20 минут эссе самостоятельно, с использованием поисковиков и с использованием LLM.

После написания эссе участники прошли ряд исследований и опросов (ЭЭГ, NLP-анализ эссе и интервью), как вы можете предположить условно негативные результаты были у группы, которая использовала LLM, условно позитивные результаты у тех, кто самостоятельно писал эссе, где-то посерединке оказались те, кто пользовались поисковиками.

Для начала надо понять, что такое cognitive debt - это метафора, "когнитивный долг" или "когнитивные издержки", означающая скрытые долгосрочные последствия от упрощения выполнения умственных задач. Идея когнитивного долга в том, что аутсорс умственных усилий (перекладывание на LLM) может привести к деградации критического мышления, памяти, творчества и (когнитивной) самостоятельности.

Итак, после написания эссе и проведения исследования у тех студентов, которые пользовались LLM было установлено: (а) снижение активности в диапазонах ЭЭГ, которые отвечают за память и креативность; (б) 83% студентов не смогли воспроизвести аргументы из своих текстов через 20 минут; (в) студенты не ощущали "чувство авторства" (принадлежности им работы).

У тех, кто писал эссе самостоятельно была обратная история: они чувствовали себя авторами, прекрасно ориентировались в тексте, их показатели ЭЭГ указывали на активную работу мозга.

Есть пара нюансов, почему к справедливому, но алармистскому выводу о когнитивном долге надо относиться аккуратно (в целом СМИ его все равно растащат, но меньше ИИ агентами пользоваться не будут).

Во-первых, это не лонгитюдное исследование: говорить о когнитивном долге справедливо, когда на протяжении нескольких сеансов (нескольких лет, а то и десятилетий) контрольная группа показывает стабильное снижение когнитивных функций (если это можно так назвать). Данное исследование длилось всего 4 месяца, где каждый участник должен был завершить 3 обязательные сессии (tool-free, LLM, search engine), а 18 из них также приняли участие в 4 сессии.

Во-вторых, выборка участников не только скромная (54 человека, не считая дополнительную группу в 18 человек из имеющихся участников), но и не репрезентативная. Мы имеем дело со "студентами" от 18 до 39 лет (медианный возраст группы около 23 лет), из довольно престижных университетов: MIT, Wellesley, Harvard, Tufts, Northeastern - поэтому выводы исследования могут быть не релевантны для людей со средним образованием, слушателей из других вузов, специалистов из разных возрастных групп, "белых/синих воротничков".

В-третьих, поставленная задача касается очень быстрого выполнения задания - написания текста, мы не знаем как на мозговую активность будет влиять использование ИИ для других целей (генерация изображений и музыки, анализ текста, работа с рекомендациями) и повлияет ли на результаты использование ИИ в течение более длительного времени или чередование разных видов обработки информации и ее поиска.

В-четвертых, из описания исследования не очень ясно стояла ли перед участниками задача соблюдать специфическую цифровую гигиену и какой опыт использования LLM у них был до этого. Возможно, для человека, который только начал использовать LLM или не погружен в ИИ грамотность показатели когнитивного аутсорса будут более высокими?

В итоге, нельзя отрицать, что мы никогда не будем думать так, как думали наши предки, мы сами за время учебы и работы могли поменять свои когнитивные паттерны, это однако не означает, что использование LLM плохое, а те, кто не используют подобные сервисы лучше решают какие-то задачи или умнее. С чем нельзя спорить, так это подход к LLM как к инструменту, результаты которого надо проверять, верифицировать и ставить под сомнение.
Сегодня админ не принесла вам умный контент, потому что она убегает от своих проблем. Завтра? Кто знает… 🌚
Please open Telegram to view this post
VIEW IN TELEGRAM
Настоящая охота на пиратов, которые пиратили мангу о пиратах: в префектуре Аити в Японии арестованы трое граждан Тайваня, которые занимались продажей манги One Piece. И не просто манги, а редкого 34 номера журнала Weekly Shonen Jump 1997 года с первой главой "One Piece".

Организованная пиратская группа действовала под прикрытием, ее руководитель работал управляющим массажного салона в городе Насусиобара. Поддельную мангу хранили в припаркованном автомобиле рядом с массажным салоном и на складах. При обысках полиция изъяла около 500 поддельных товаров (мангу, а также DVD и мерч). Не известно работали ли подельники массажистами или были частыми посетителями салона, но я бы не удивилась.

Добывали пираты поддельную мангу следующим образом: контрафактные журналы завозили из континентального Китая, оплатой за поставку была выручка, которая переводилась на заграничные счета.

Подделки имели некорректные цвета, низкокачественную бумагу и дефекты печати, что отличало их от оригинала, но некоторых фанатов и коллекционеров это не смущало.

Помните: пиратство хорошо только в манге!
Есть два волка: одного компания Anthropic кормила найденными в интернете датасетами с книгами, второго - сканами книг, которые были куплены и отсканированы.

В интересном деле, которое могло пройти мимо моих глаз, суд постановил, что использование print-to-digital книг для обучения их LLM (книги были законно приобретены Anthropic) - является fair use - добросовестным использованием.

В то же самое время для приобретенных в сети датасетов с книгами (пиратские копии) - такого вывода не последовало и суд ожидает дальнейшее рассмотрение этого вопроса. Покупка реальных копий таких книг до рассмотрения оставшихся требований повлияет только на размер взыскиваемой компенсации.

Важно, вывод о добросовестности сделан только в отношении обучения, но не генераций. И да, покупали физические книги - сами тексты не были лицензированы.

Но почему print-to-digital - это fair use. Во многом суд основывал свою позицию на деле Authors Guild, Inc. v. Google - также как и проект Google Book Search, пользователи Anthropic не получают доступ ко всей книге, более того, не каждый запрос приводит к цитированию произведения (этот тейк рекомендую запомнить для сравнения поисковиков и LLM).

В общем, не могу назвать это руководством к действию для LLM разработчиков в США, но звучит как попытка наметить баланс.
Пока мы рассуждаем о fair use - в Китае назначают тюремное заключение за переработку картинок с помощью ИИ и продажу с ними паззлов.

Все началось с того,что один из авторов увидел в продаже паззлы со своей иллюстрацией так началось расследование.

Как стало известно из изъятых доказательств и внутренней переписки обвиняемых они искренне считали, что использование ИИ для переработки изображений не будет признано нарушением. Да и вообще они больше боялись, что их заблокирует маркетплейс, а не то, что авторы работ привлекут их к ответственности (им они планировали заплатить максимум 1000 юаней).

Статья на китайском.
Статья на сайте суда.
вычислить по IP
Есть два волка: одного компания Anthropic кормила найденными в интернете датасетами с книгами, второго - сканами книг, которые были куплены и отсканированы. В интересном деле, которое могло пройти мимо моих глаз, суд постановил, что использование print-to…
Пока в одном деле суд пришел к выводу, что использование для обучения LLM отсканированных (но законно приобретенных) книг следует считать добросовестным использованием (fair use); в другом деле против Meta судья пошел в своем рассуждении дальше и посчитал, что использование shadow libraries не влияет на то будет ли использование книг авторов добросовестным использованием или нет.

То есть спираченные и скаченные с торрентов книги технически могут быть в обучающей базе данных и в этом деле данный факт не противоречит логике fair use (про это очень хорошо написал коллега @legalelysium).

Важный дисклеймер: это не коллективный иск, это иск, в котором фигурируют несколько истцов. Также сам судья уточнил, что это решение не означает, что использование Meta материалов, защищенных авторским правом, законно. Оно лишь подтверждает, что истцы выбрали неверные аргументы.

Сделаю шаг назад и уточню, что изначально авторы простили признать в действиях Meta и недобросовестную конкуренцию, и незаконное удаление информации об авторстве, и пр. Однако суд оставил эти требования без рассмотрения, кроме обвинения в direct copyright infringement, которое собственно и дожило до обсуждаемого в этом посте summary judgement.

Ни для кого уже не секрет, что объединяющая всех ИИ разработчиков позиция: обучение ИИ - это fair use, но так ли это на самом деле?

Напомню, что закон об авторском праве устанавливает четыре критерия для определения добросовестного использования:
1. цель и характер использования, включая коммерческую или некоммерческую образовательную направленность;
2. характер охраняемого произведения;
3. объем и значимость использованной части по отношению ко всему произведению;
4. влияние использования на потенциальный рынок или стоимость охраняемого произведения.

На практике наиболее значимыми считаются 1 и 4 критерий, потому что они оценивают как было использовано оригинальное произведение и к каким последствиям может такое использование привести.

В этом деле против Meta суд посчитал, что процесс обучения ИИ не приводит к созданию конкурентноспособных производных произведений (потому что на практике ИИ модель не могла сгенерировать более 50 токенов - слов и знаков препинания, из оригинального текста книги), а потенциальный ущерб авторами не был доказан (об этом стоит поговорить отдельно).

Конечно тут возникает логичный вопрос: а может ли процесс обучения LLM быть использованием охраняемого произведения, если это сугубо технический процесс анализа данных (здесь могло бы быть рассуждение про TDM и японский подход, но оставлю его для отдельного поста). В этом деле суд дает однозначный ответ, даже если LLM изучают лишь "статистические взаимосвязи", эти взаимосвязи - продукт творческого выражения (то есть creative expression, что дает нам понять - обучение = использование).

Относительно четвертного критерия суд пришел к выводу, что способность модели выдавать крошечные фрагменты книг при намеренном воздействии не угрожает рынку или ценности оригинальных произведений. В целом, это разумное замечание, особенно если в модель встроены технические ограничения - LLM не выдаст пользователю целую книгу, а если выдаст, то для массовости негативного эффекта доступ к этой сгенерированной книге должен получить не один пользователь, а куда большее количество.
вычислить по IP
Есть два волка: одного компания Anthropic кормила найденными в интернете датасетами с книгами, второго - сканами книг, которые были куплены и отсканированы. В интересном деле, которое могло пройти мимо моих глаз, суд постановил, что использование print-to…
Также продолжительное время основным контр-аргументом со стороны истцов к экономическому критерию fair use было нарушение или подрывание рынка лицензирования произведений для обучения ИИ. Также было множество рассуждений есть ли такой рынок в принципе? Аргументируя свое решение суд отметил, что если бы в каждом деле сторона истца опиралась на потенциальный рынок лицензирования - четвертый фактор был бы попросту нежизнеспособен и всегда перевешивал на сторону правообладателя, поэтому ущерб от потери лицензионных платежей не используется. Я бы не сказала, что это универсальный аргумент, потому что в ситуации, когда гипотетический датасет состоит только из лицензированных произведений, и есть десяток тысяч книг конкретного издательства, которые решили использовать без согласия - можем ли мы в таком случае говорить о том, что "рынок" отсутствует?

И поскольку авторы указывали на потенциальный ущерб из-за использования работ без согласия (без заключения лицензионного договора), суд встал на сторону Meta. Но суд отметил, что будь истцы дальновиднее, они бы посмотрели в сторону market dilution.

Что это значит? Да, маленьким неизвестным авторам ИИ может причинить вред, так как им можно найти сгенерированную замену. Но для известных авторов такой риск намного меньше - Агату Кристи читают, потому что она Агата Кристи, биографию актера, читают потому что конкретный автор написал биографию известного человека.

Но это не исключает возможное размытие рынка, сгенерированные ИИ книги могут распространяться бесплатно или намного дешевле их авторских аналогов. И такой ущерб представляет собой "косвенное" замещение оригинального произведения, нежели чем "прямое" замещение - строго говоря, утрата ценности за счет снижения спроса (но я не считаю, что в этом деле market dilution как-то можно было оценить). Кстати суд аккуратно намекнул истцам, что они "a fool of a Took", потому что этот аргумент они не развили и доказательств не предоставили (штош).

И все это вместе выступило в пользу Meta. Согласна ли я с этим решением? Отчасти - да, юристы Meta проделали отличную работу, но конкретно в этом деле речь шла о книгах, а параллельно рассматриваются кейсы, где авторы пытаются защитить права на музыку, текст статьи и изображения. Это менее "объемные" и теоретически более подверженные замещению объекты. Так что за ними будет интересно последить в свете принятого решения.
2025/06/28 06:04:54
Back to Top
HTML Embed Code: