group-telegram.com/bukvamiocifre/7612
Last Update:
Современные ИИ-технологии в урбанистике сталкиваются с парадоксом: данных вроде бы много, но использовать их для обучения моделей практически невозможно. Разберём ситуацию на основе реальных кейсов и исследований.
Факт: Данные для городского планирования существуют в огромных объёмах, но:
- Муниципальные данные (генпланы, ПЗЗ, транспортные схемы) хранятся в несвязанных системах. Например:
- Москва использует Единый геопортал, но данные обновляются с задержкой.
- По исследование ВШЭ, 2023: 73% генпланов малых городов не имеют машиночитаемых версий), безусловно есть регионы, где ситуация значительно лучше, но это единицы. При этом есть и столицы регионов, где ситуация та же, что и в малых городах.
- Коммерческие данные (девелоперы, риелторы, операторы связи) редко попадают в открытый доступ.
Кейс: Застройщики собирают детальные данные о перемещениях жителей (Wi-Fi-трекинг в ТЦ и ЖК), но не делятся ими для исследований.
- Форматы: Одни города публикуют данные в GeoJSON, другие — в устаревших DWG (Autodesk) или даже сканах бумажных карт.
- Методология: Даже базовые параметры (например, "пешеходная доступность") рассчитываются по-разному. Например:
- В Москве учитывается время до остановки, в Петербурге — расстояние по прямой.
- Многие данные (например, кадастровые) защищены ФЗ-152 "О персональных данных" и гостайной (особенно инфраструктурные объекты).
- Открытые данные (например, OpenStreetMap) часто неполны: есть дороги и дома, но нет информации о:
- нагрузке на электросети,
- границах шумовых зон,
- реальной загруженности парковок.
- Если обучить модель на PDF-сканах генпланов 1990-х, она воспроизведёт устаревшие нормы (например, недостаточную инсоляцию).
- Пример: В 2022 году команда Сколтеха пробовала предсказывать транспортные потоки в Подмосковье, но из-за неполных данных OSM модель ошиблась на 40%.
- Для обучения GAN под генерацию кварталов нужно тысячи примеров, но:
- В России всего ~300 крупных застройщиков, и у каждого — лишь десятки проектов.
- Даже если собрать все ЖК Москвы, получится ~500 проектов — мало для глубокого обучения, надо собирать по всей стране. И желательно лет за 10 последних, хотя бы. Тоже самое сделать по социальным и иным объектам.
- Нейросети создают "среднее решение", но в градостроительстве нужно 100%-ное соответствие нормативам.
- Пример: Алгоритм ArchiGAN (NVIDIA) генерирует планировки домов, но:
- 30% выходных данных нарушают СП 54.13330 (жилые здания).
- Исправлять такие ошибки дороже, чем проектировать с нуля.
- Внедрение CityGML или Digital Twin-платформ (как в Сингапуре, например).
- Даже простой переход на единые шаблоны Excel для муниципалитетов улучшит ситуацию (пилот в Татарстане сократил время сбора данных на 60%), есть и более интересные примеры, но пилоты пока в процессе реализации.
- Налоговые льготы за открытие обезличенных данных (как в ЕС с GDPR).
- Публичные рейтинги застройщиков по открытости данных
- Детерминированные алгоритмы (для норм и расчётов) + ИИ (для творческих задач).
- Пример:
1. Генетический алгоритм строит "скелет" микрорайона по нормативам.
2. GAN добавляет вариативность в фасады.
3. Валидатор проверяет соответствие СП.
Нейросети не заменят градостроителей, потому что:
#Буквы_исследования