Коллеги, теперь у вас есть бот, обученный именно для того, чтобы помогать с кабинетными исследованиями и библиографией. Всё, что нужно, — это задать вопрос, и он подскажу, как искать, анализировать и систематизировать информацию, будто вы настоящий исследователь. 📚
🧐 Что такое обученные GPTs?
Это модели ИИ, которые специально обучаются для определённых задач. Я создала бота, чтобы он был экспертом в информационном поиске, работе с источниками и всех тонкостях исследовательской работы.
Что умеет мой бот?
🔍 Помощь в кабинетных исследованиях: он знает, как искать, систематизировать и анализировать информацию, не выходя из дома. От базовых запросов до сложных аналитических задач — бот предложит эффективные методы и подходы.
📚 Библиографическая поддержка: рекомендации по управлению источниками и использованием библиографических менеджеров.
⚙️ Техники поиска: бот подскажет, как грамотно формулировать запросы, использовать поисковые операторы и фильтры для точных результатов.
🧠 Обучение методам анализа: бот делится советами по извлечению знаний из текста, реферированию, контент- и фрейм-анализу.
📊 Инструменты автоматизации: советы по использованию цифровых ресурсов, ИИ, программ для систематизации данных.
Этот бот сочетает в себе профессиональные знания, собранные из учебных пособий, книг и методичек по кабинетным исследованиям, а также практический опыт исследователей, чтобы стать вашим незаменимым помощником.
Please open Telegram to view this post
VIEW IN TELEGRAM
ChatGPT
ChatGPT - какая-то библиотека
Советы по кабинетным исследованиям
🌐 Digital Methods Initiative Tool Archive — инструменты для анализа данных и интернета
Если вы интересуетесь анализом цифровых данных, то Digital Methods Initiative (DMI) предоставляет целый арсенал инструментов для работы с данными из интернета и социальных платформ. Это набор мощных решений, которые упрощают обработку информации для исследователей, студентов и аналитиков.
Вот что можно найти в архиве DMI:
🔍 Категории инструментов:
Media Analysis: От мониторинга медиа до создания облаков тегов и анализа.
Data Treatment: Инструменты для сбора, обработки и визуализации данных.
Natively Digital: Работа с URL, доменами и мета-данными цифровых объектов.
Device-Centric: Анализ данных с популярных платформ (Google, Twitter, Instagram, Wikipedia и др.).
Spherical: Исследования в рамках различных цифровых «сфер» — новостей, блогов, видео, изображений.
https://wiki.digitalmethods.net/Dmi/ToolDatabase
Если вы интересуетесь анализом цифровых данных, то Digital Methods Initiative (DMI) предоставляет целый арсенал инструментов для работы с данными из интернета и социальных платформ. Это набор мощных решений, которые упрощают обработку информации для исследователей, студентов и аналитиков.
Вот что можно найти в архиве DMI:
🔍 Категории инструментов:
Media Analysis: От мониторинга медиа до создания облаков тегов и анализа.
Data Treatment: Инструменты для сбора, обработки и визуализации данных.
Natively Digital: Работа с URL, доменами и мета-данными цифровых объектов.
Device-Centric: Анализ данных с популярных платформ (Google, Twitter, Instagram, Wikipedia и др.).
Spherical: Исследования в рамках различных цифровых «сфер» — новостей, блогов, видео, изображений.
https://wiki.digitalmethods.net/Dmi/ToolDatabase
Методологический кейс: ✔️ использование государственных данных для оценки доли устаревшей сельскохозяйственной техники
🔤 Задача
Вы — агротехнический стартап, который разрабатывает роботов для сельского хозяйства. Необходимо понять, как много техники в отрасли уже используется и какая доля из неё не является инновационной, чтобы оценить рынок для замещения своей продукцией.
❓ Вопрос
Можно ли выполнить расчёты доли устаревшей техники исключительно на основе государственной статистики?
📊 Мой ответ
1. Госстатистика: доступные данные
- Использование робототехники по субъектам РФ: общие показатели по промышленности без детализации по секторам сельского хозяйства.
- Инновационная активность организаций: есть данные по сельскому хозяйству, но они не отражают роль робототехники или степень устаревания техники.
- Число новых и используемых передовых технологий: присутствует разбивка по видам деятельности, но роль роботов не уточняется.
2. Ограничения данных
- Отсутствие информации об устаревшей технике: невозможно напрямую оценить объём техники, которую можно заменить.
- Нехватка детализации по робототехнике: ключевой сегмент рынка — роботы — слабо отражён в госстатистике.
- Косвенные индикаторы: данные по инновациям в целом дают общую картину развития, но не точные цифры.
✉️ Предлагаемое решение
Для точной оценки потенциала замещения необходимо комбинировать госстатистику с дополнительными источниками:
1. Использование доступной статистики
- Анализ трендов инновационной активности. Определить долю организаций, внедряющих инновации в сельском хозяйстве, чтобы выделить перспективные ниши.
- Распределение робототехники по регионам. Изучить использование роботов в промышленности как индикатор их проникновения.
2. Дополнительные источники данных
- Новости Минсельхоза и рыночные отчёты. Например, сайт specagro.ru может содержать кейсы о внедрении роботов, что даст представление о состоянии отрасли.
- Отраслевые исследования и консалтинговые отчёты. Для уточнения количества устаревшей техники и конкретных моделей роботов.
- Экспертные интервью. Собрать мнения участников рынка о текущих тенденциях и доле техники, подлежащей замене.
📌
Государственная статистика предоставляет основу для понимания общих трендов в сельском хозяйстве, но не позволяет полноценно оценить долю устаревшей техники. Для агротехнического стартапа наиболее эффективным будет использование смешанного подхода, включающего кабинетные исследования, анализ рыночных отчётов и экспертные интервью. Это обеспечит более точное и детализированное понимание целевого рынка.
Вы — агротехнический стартап, который разрабатывает роботов для сельского хозяйства. Необходимо понять, как много техники в отрасли уже используется и какая доля из неё не является инновационной, чтобы оценить рынок для замещения своей продукцией.
Можно ли выполнить расчёты доли устаревшей техники исключительно на основе государственной статистики?
1. Госстатистика: доступные данные
- Использование робототехники по субъектам РФ: общие показатели по промышленности без детализации по секторам сельского хозяйства.
- Инновационная активность организаций: есть данные по сельскому хозяйству, но они не отражают роль робототехники или степень устаревания техники.
- Число новых и используемых передовых технологий: присутствует разбивка по видам деятельности, но роль роботов не уточняется.
2. Ограничения данных
- Отсутствие информации об устаревшей технике: невозможно напрямую оценить объём техники, которую можно заменить.
- Нехватка детализации по робототехнике: ключевой сегмент рынка — роботы — слабо отражён в госстатистике.
- Косвенные индикаторы: данные по инновациям в целом дают общую картину развития, но не точные цифры.
Для точной оценки потенциала замещения необходимо комбинировать госстатистику с дополнительными источниками:
1. Использование доступной статистики
- Анализ трендов инновационной активности. Определить долю организаций, внедряющих инновации в сельском хозяйстве, чтобы выделить перспективные ниши.
- Распределение робототехники по регионам. Изучить использование роботов в промышленности как индикатор их проникновения.
2. Дополнительные источники данных
- Новости Минсельхоза и рыночные отчёты. Например, сайт specagro.ru может содержать кейсы о внедрении роботов, что даст представление о состоянии отрасли.
- Отраслевые исследования и консалтинговые отчёты. Для уточнения количества устаревшей техники и конкретных моделей роботов.
- Экспертные интервью. Собрать мнения участников рынка о текущих тенденциях и доле техники, подлежащей замене.
Государственная статистика предоставляет основу для понимания общих трендов в сельском хозяйстве, но не позволяет полноценно оценить долю устаревшей техники. Для агротехнического стартапа наиболее эффективным будет использование смешанного подхода, включающего кабинетные исследования, анализ рыночных отчётов и экспертные интервью. Это обеспечит более точное и детализированное понимание целевого рынка.
Please open Telegram to view this post
VIEW IN TELEGRAM
Методологический разбор кабинетного исследования: анализ конкурентоспособности сельской местности на примере муниципалитета Раковски (Болгария)
Данное исследование анализирует конкурентоспособность сельской местности, используя модель «Ромб» Майкла Портера и кейс-стади муниципалитета Раковски в Болгарии.
Выбор метода кабинетного исследования и конкретного кейса обусловлен ограниченным количеством работ, посвященных конкурентоспособности именно сельских регионов, а также необходимостью продемонстрировать применимость модели Портера в условиях конкретного региона.
Исследовательский вопрос: Как модель «Ромб» Портера может быть применена для оценки конкурентоспособности сельской местности, и какие факторы оказывают наибольшее влияние на ее развитие?
Методология:
Исследование основывается на качественном анализе вторичных данных, что обусловлено ограничениями в ресурсах и времени, характерными для кабинетных исследований. Использовался подход кейс-стади, позволяющий глубоко изучить специфику одного региона. Выбор муниципалитета Раковски обусловлен его разносторонней экономикой, сочетающей сельское хозяйство и промышленность, что делает его репрезентативным для многих сельских регионов Болгарии.
Данные были систематизированы и проанализированы в рамках четырех составляющих модели «Ромб»:
Для каждого из четырех факторов были выявлены как сильные, так и слабые стороны муниципалитета Раковски.
Please open Telegram to view this post
VIEW IN TELEGRAM
ideas.repec.org
The Diamond Model of Porter to Measure Rural Regions' Competitiveness:
The study of rural area development is a subject of extensive research and analyses but regarding the competitiveness of rural regions the number of researches is limited. Globalization and the proces
Может ли генеративный ИИ улучшить социальные науки?
В статье, опубликованной в PNAS, Кристофер Бейл исследует потенциал генеративного ИИ для трансформации социальных наук. Автор рассматривает как преимущества, так и риски использования таких инструментов, предлагая пути минимизации негативных последствий.
Бейл выделяет несколько перспективных направлений применения генеративного ИИ:
Улучшение опросов и экспериментов: Генеративные модели могут создавать реалистичные тексты и изображения, которые могут использоваться для создания более эффективных стимулов и анкет. Это позволяет расширить масштабы исследований и улучшить качество данных. Например, ИИ может генерировать вариации текстов для А/В тестирования, что позволит определить наиболее эффективные формулировки вопросов.
Автоматизированный анализ контента: Генеративный ИИ способен анализировать огромные объемы текстовых данных с высокой скоростью, что значительно ускоряет процесс анализа контента в социальных сетях, новостных статьях и других источниках. Это открывает новые возможности для изучения социальных явлений на больших выборках. Например, промпт может выглядеть так: "Проанализируйте этот текст и определите преобладающий эмоциональный тон (позитивный, негативный, нейтральный). Укажите ключевые слова, подтверждающие ваш вывод."
Моделирование на основе агентов: Генеративный ИИ может использоваться для создания более реалистичных моделей на основе агентов, которые имитируют поведение людей в сложных социальных системах. Это позволяет моделировать динамику социальных процессов и тестировать различные гипотезы. Например, можно создать симуляцию распространения слухов в социальной сети, используя промпт: "Агент А сообщает слух агенту В. Агент В верит слуху с вероятностью X и передает его агенту С с модификацией Y. Смоделируйте распространение слуха в сети из 100 агентов с различными уровнями доверия."
Бейл подчеркивает ряд важных ограничений и рисков, связанных с использованием генеративного ИИ:
Смещение: Модели обучаются на данных, которые могут содержать существующие социальные предрассудки. Это может привести к искажению результатов исследований. Важно тщательно проверять результаты на наличие смещения и использовать методы коррекции.
Репликация: Из-за стохастической природы генеративных моделей, результаты могут быть трудно воспроизводимы. Необходимо разработать стандартизированные методы для обеспечения реплицируемости исследований.
Этика: Использование генеративного ИИ поднимает ряд этических вопросов, связанных с конфиденциальностью данных, авторским правом и потенциальным злоупотреблением. Необходимо разработать строгие этические принципы для использования этих технологий.
Качество исследований: Существует риск увеличения количества низкокачественных исследований, созданных с помощью генеративного ИИ. Необходимо разработать механизмы контроля качества и проверки результатов.
Предложение автора:
Для минимизации рисков и обеспечения широкого доступа к высококачественным инструментам Бейл предлагает создание открытой инфраструктуры для исследований поведения человека. Это позволит ученым совместно разрабатывать и совершенствовать методы, обеспечивая прозрачность и реплицируемость исследований.
В статье, опубликованной в PNAS, Кристофер Бейл исследует потенциал генеративного ИИ для трансформации социальных наук. Автор рассматривает как преимущества, так и риски использования таких инструментов, предлагая пути минимизации негативных последствий.
Бейл выделяет несколько перспективных направлений применения генеративного ИИ:
Улучшение опросов и экспериментов: Генеративные модели могут создавать реалистичные тексты и изображения, которые могут использоваться для создания более эффективных стимулов и анкет. Это позволяет расширить масштабы исследований и улучшить качество данных. Например, ИИ может генерировать вариации текстов для А/В тестирования, что позволит определить наиболее эффективные формулировки вопросов.
Автоматизированный анализ контента: Генеративный ИИ способен анализировать огромные объемы текстовых данных с высокой скоростью, что значительно ускоряет процесс анализа контента в социальных сетях, новостных статьях и других источниках. Это открывает новые возможности для изучения социальных явлений на больших выборках. Например, промпт может выглядеть так: "Проанализируйте этот текст и определите преобладающий эмоциональный тон (позитивный, негативный, нейтральный). Укажите ключевые слова, подтверждающие ваш вывод."
Моделирование на основе агентов: Генеративный ИИ может использоваться для создания более реалистичных моделей на основе агентов, которые имитируют поведение людей в сложных социальных системах. Это позволяет моделировать динамику социальных процессов и тестировать различные гипотезы. Например, можно создать симуляцию распространения слухов в социальной сети, используя промпт: "Агент А сообщает слух агенту В. Агент В верит слуху с вероятностью X и передает его агенту С с модификацией Y. Смоделируйте распространение слуха в сети из 100 агентов с различными уровнями доверия."
Бейл подчеркивает ряд важных ограничений и рисков, связанных с использованием генеративного ИИ:
Смещение: Модели обучаются на данных, которые могут содержать существующие социальные предрассудки. Это может привести к искажению результатов исследований. Важно тщательно проверять результаты на наличие смещения и использовать методы коррекции.
Репликация: Из-за стохастической природы генеративных моделей, результаты могут быть трудно воспроизводимы. Необходимо разработать стандартизированные методы для обеспечения реплицируемости исследований.
Этика: Использование генеративного ИИ поднимает ряд этических вопросов, связанных с конфиденциальностью данных, авторским правом и потенциальным злоупотреблением. Необходимо разработать строгие этические принципы для использования этих технологий.
Качество исследований: Существует риск увеличения количества низкокачественных исследований, созданных с помощью генеративного ИИ. Необходимо разработать механизмы контроля качества и проверки результатов.
Предложение автора:
Для минимизации рисков и обеспечения широкого доступа к высококачественным инструментам Бейл предлагает создание открытой инфраструктуры для исследований поведения человека. Это позволит ученым совместно разрабатывать и совершенствовать методы, обеспечивая прозрачность и реплицируемость исследований.
PNAS
Can Generative AI improve social science?
Generative AI that can produce realistic text, images, and other human-like outputs is currently transforming many different industries. Yet it is ...
Использование искусственного интеллекта в исследованиях открывает огромные возможности, но важно понимать, где его применение наиболее эффективно. Сегодня хочу поговорить о том, почему стоит доверять ИИ анализ собранных данных, а не процесс их поиска.
Почему анализ важнее поиска?
1. Качество данных зависит от источника
Алгоритмы поиска, даже самые мощные, часто не в состоянии отличить релевантные данные от нерелевантных. Например, при сборе информации из интернета вы можете получить устаревшие или некачественные данные, не заметив этого на этапе загрузки.
2. Предвзятость и неполнота в результатах поиска
Многие инструменты, включая AI, настраиваются под определенные запросы и могут выдавать результаты с предвзятостью. Это особенно критично в академической или коммерческой среде, где полнота и достоверность данных играют ключевую роль.
3. Фокус на глубоком анализе
ИИ гораздо эффективнее, когда вы уже собрали данные из проверенных источников и хотите выявить закономерности, тренды или скрытые взаимосвязи. Например:
- Кластеризация данных для выявления групп.
- Текстовый анализ для поиска ключевых слов и идей.
- Построение предсказательных моделей на основе уже известных фактов.
- Контроль за качеством данных: исследователь самостоятельно выбирает источники, что минимизирует ошибки.
- Углубленное понимание: ИИ помогает раскрыть смысл данных, а не просто собрать их.
- Экономия времени: процесс анализа автоматизируется, но вы точно знаете, что работаете с нужной информацией.
Не гонитесь за автоматизацией на всех этапах. Позвольте ИИ стать вашим аналитиком, а не архивариусом. Собирайте данные самостоятельно из надежных источников, а потом передавайте их ИИ для извлечения пользы.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
какая-то библиотека
🆕Обновление тиров на Бусти🆕
Друзья, рады представить вам обновленные уровни подписки на Boosty! Теперь еще больше возможностей для прокачки ваших навыков в кабинетных исследованиях и доступ к эксклюзивному контенту. Выбирайте уровень, который подходит именно…
Друзья, рады представить вам обновленные уровни подписки на Boosty! Теперь еще больше возможностей для прокачки ваших навыков в кабинетных исследованиях и доступ к эксклюзивному контенту. Выбирайте уровень, который подходит именно…
Контекст — это ключевой элемент, позволяющий понять глубинные смыслы данных, их взаимосвязь и значимость.
Почему контекст важен?
Избежание манипуляций. Манипулятивные данные часто вырываются из контекста, чтобы исказить их значение. Например, статистика может быть представлена таким образом, чтобы выгодно подчеркнуть определённый аспект проблемы, игнорируя другие.
Понимание условий формирования данных. Каждая информация существует в рамках своей системы условий — социальной, экономической, политической или исторической. Без учёта этих условий невозможно понять, что именно означают данные и как они могут быть использованы.
Историческая перспектива
Любое событие или явление связано с историей. Анализируйте, как развивалась ситуация, чтобы понять её предысторию и причины. Например, экономические показатели текущего года имеют смысл только в сравнении с предыдущими периодами и трендами.
Социально-экономические факторы
Рассматривайте, в каких условиях собиралась информация. Например:
- Уровень доверия к источникам в обществе.
- Экономическое состояние региона или страны.
- Политические интересы, которые могут влиять на интерпретацию данных.
- Географические и культурные особенности. Различия в восприятии одних и тех же данных между странами или даже регионами могут быть значительными.
Например, восприятие уровня безработицы может зависеть от исторически сложившихся норм занятости и социальной поддержки.
Цели и мотивы
Учитывайте цели, которые могут преследовать авторы данных:
- Рекламный или PR-контент может акцентировать позитивные моменты и игнорировать негативные.
- Политические заявления часто адаптируются к интересам целевой аудитории.
Информационная среда
Важен анализ того, как распространялась информация:
- Были ли использованы социальные сети?
- Какие средства массовой информации поддерживали распространение?
- Какие реакции вызвала информация?
Сравнительный анализ
Сравнивайте данные из разных источников, чтобы выявить возможные расхождения. Это поможет увидеть, где информация могла быть искажена.
Анализ тональности
Изучите язык, которым представлены данные. Нейтральное ли это изложение или эмоционально окрашенное? Например, использование терминов вроде «катастрофический рост» вместо «значительное увеличение» может сигнализировать о предвзятости.
Работа с первоисточниками
Обратитесь к оригинальным данным, на которых основаны отчёты или статьи. Это позволяет избежать интерпретаций и узнать, как информация выглядела изначально.
Социальный и политический анализ
Рассмотрите, какие группы поддерживали или критиковали опубликованные данные. Это может указать на мотивы и скрытые интересы.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Korenev AI - GPT в тапочках🩴
Сейчас сегментация делается "на глазок" — выделяются 5-10 групп клиентов и проводится дальнейшая работа с ними. Но представляете, насколько круче будет, если будет выделиться 100-500 сегментов и к каждому будет свой особенный подход? Говорить с каждым на его языке, цеплять за то, что действительно важно именно для него.
Пробовали раньше освоить Power BI для этих целей — не пошло: сложно и не хватает времени на изучение.
Я открыл открыл для себя платформу Kaggle. Там постоянно проходят соревнования по машинному обучению с денежными призами. И лучшие специалисты выкладывают свои решения в открытый доступ!
Для нас это отличная возможность перенять готовые идеи и адаптировать их под свои задачи. В общем, велосипед не изобретаем, а катаемся на созданном ранее
Please open Telegram to view this post
VIEW IN TELEGRAM
Статья Магдалены Клопотт анализирует проблемы страхования грузов, перевозимых через зоны вооруженных конфликтов, используя метод анализа вторичных данных (desk research). Фокус исследования направлен на анализ стандартных положений страховых полисов от рисков войны и забастовок, выявление пробелов в покрытии и потенциальных решений для улучшения страховых механизмов.
Исследовательский вопрос: Какие риски связаны со страхованием грузов в зонах конфликта, и какие пробелы существуют в стандартном покрытии страховых полисов?
Методология:
В качестве методологии используется desk research – качественный анализ уже существующих данных. Этот подход выбран в связи с ограниченностью ресурсов и необходимостью оперативного получения результатов, что характерно для кабинетных исследований. Основной акцент сделан на анализе вторичных источников информации, позволяющих составить целостную картину исследуемой проблематики.
В качестве источников использовались публикации авторитетных организаций в сфере страхования и логистики, включая отчеты и аналитические материалы от таких организаций, как Council on Foreign Relations (CFR), Lloyd’s List Intelligence, UNCTAD (Конференция ООН по торговле и развитию), Institute of London Underwriters, International Underwriting Association of London (IUA), S&P Global, а также данные от Bloomberg и других ведущих мировых изданий.
Информация систематизирована по кластерам: на основе информации о географических зонах конфликтов, распространенных рисках (пиратство, терроризм, государственное насилие), стандартных условиях страхования (Институтские Клаузулы по Грузам, ICC), специализированных страховых положениях (IWC и ISC), и механизмах оценки рисков (JCC Global Cargo Watchlist).
Проведен сравнительный анализ стандартных страховых клаузул (ICC) и специализированных положений (IWC и ISC), выявляющий существующие пробелы в покрытии.
Проанализированы особенности страхования грузов в разных видах транспорта (морской, воздушный, наземный) и влияние географических факторов (зона конфликта, торговые пути). Изучены механизмы установления страховых тарифов и наценок, связанных с рисками войны и забастовок, а также влияние динамики конфликтов на стоимость страхования.
Особое внимание уделено анализу проекта "Unity" как примера инновационного подхода к страхованию грузов в зоне конфликта.
Данные от международных организаций (ООН, Lloyd's и т.д.), регулирующих органов и правительственных учреждений.
Статьи, обзоры и аналитические материалы от ведущих экспертов в области страхования и логистики.
Информация о страховых тарифах, премиях и надбавках, а также общая экономическая ситуация в зоне конфликта.
Стандартные страховые полисы не охватывают все риски, связанные с перевозкой грузов в зонах конфликта. Существуют значительные пробелы в покрытии, особенно в отношении наземных рисков. Специализированные страховые положения (IWC и ISC) частично компенсируют эти пробелы, но не являются универсальным решением.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from DH Center ITMO University
>>> опен-колл на конференцию
«Актуальные ошибки гуманитарных наук»
27–29 марта проведём вторую конференцию DH-центра. В этом году поговорим о роли ошибок в исследованиях, науках и проектах. Приглашаем всех, кто совершал и планирует совершать ошибки, достойные обсуждения.
{ концепция }
Необсуждённые ошибки ложатся в основу алгоритмической рациональности, а она становится инфраструктурой для решения новых задач. Порой исследователи примечают конкретные неточности (bias) или галлюцинации, но обходят вниманием системные недочёты.
Как выявить ошибку? Из какой позиции человек может спорить с машиной, если она сформирована на основе экспертизы или «объективных» данных? Как без возможности находить ошибки в теории, можно обнаружить их в данных или методе? И обречён ли учёный, сторонящийся обнаружения и исправления ошибок, на вечное применение кем-то изобретённых подходов?
Эти вопросы могут получить ответы, если мы обратимся к ошибкам. Этой конференцией мы хотим попробовать сделать разговор об ошибках — задачей академической дискуссии.
{ темы }
— Лишняя дисциплина
— Доверяй, но проверяй
— Ошибки внедрения
— Различия ошибок человека и машины
— Право на ошибку
— Ошибка как результат и достоинство
{ детали }
Части программы будут соответствовать одному из четырёх идолов — так Фрэнсис Бэкон называл препятствия к познанию истины. Мы интерпретируем его идолов, обращаясь к ним в рамках художественного приёма, чтобы определить ситуации разговора об ошибках:
> идолы рода: ошибки, связанные с происхождением знания — науками и канонами
> идолы пещеры: ошибки «здравого смысла», происходящие от доверия обыденному знанию
> идолы рынка: ошибочные смешения понятий, методов и подходов
> идолы театра: ошибки моделирования и представления
{ участие }
Ждём доклады, дискуссионные панели, постеры, экспериментальные формы. Подробности о форматах и темах в документе.
Отправляйте заявку на почту [email protected]
шаблон заявки
тема письма: заявка на Актуальные ошибки гуманитарных наук
дедлайн 17 февраля
🤍 🤍 🤍 🤍 🤍
«Актуальные ошибки гуманитарных наук»
27–29 марта проведём вторую конференцию DH-центра. В этом году поговорим о роли ошибок в исследованиях, науках и проектах. Приглашаем всех, кто совершал и планирует совершать ошибки, достойные обсуждения.
{ концепция }
Необсуждённые ошибки ложатся в основу алгоритмической рациональности, а она становится инфраструктурой для решения новых задач. Порой исследователи примечают конкретные неточности (bias) или галлюцинации, но обходят вниманием системные недочёты.
Как выявить ошибку? Из какой позиции человек может спорить с машиной, если она сформирована на основе экспертизы или «объективных» данных? Как без возможности находить ошибки в теории, можно обнаружить их в данных или методе? И обречён ли учёный, сторонящийся обнаружения и исправления ошибок, на вечное применение кем-то изобретённых подходов?
Эти вопросы могут получить ответы, если мы обратимся к ошибкам. Этой конференцией мы хотим попробовать сделать разговор об ошибках — задачей академической дискуссии.
{ темы }
— Лишняя дисциплина
— Доверяй, но проверяй
— Ошибки внедрения
— Различия ошибок человека и машины
— Право на ошибку
— Ошибка как результат и достоинство
{ детали }
Части программы будут соответствовать одному из четырёх идолов — так Фрэнсис Бэкон называл препятствия к познанию истины. Мы интерпретируем его идолов, обращаясь к ним в рамках художественного приёма, чтобы определить ситуации разговора об ошибках:
> идолы рода: ошибки, связанные с происхождением знания — науками и канонами
> идолы пещеры: ошибки «здравого смысла», происходящие от доверия обыденному знанию
> идолы рынка: ошибочные смешения понятий, методов и подходов
> идолы театра: ошибки моделирования и представления
{ участие }
Ждём доклады, дискуссионные панели, постеры, экспериментальные формы. Подробности о форматах и темах в документе.
Отправляйте заявку на почту [email protected]
шаблон заявки
тема письма: заявка на Актуальные ошибки гуманитарных наук
дедлайн 17 февраля
Please open Telegram to view this post
VIEW IN TELEGRAM
ИИ-ансамбли для автоматической генерации аннотированных библиографий: новый уровень точности и эффективности
Генерация аннотированных библиографий – трудоемкий и требующий значительных экспертных знаний процесс. В новой работе Серхио Бермехо предлагается инновационный подход к автоматизации этой задачи с использованием ансамблей больших языковых моделей (LLM). Вместо использования одной LLM, Бермехо предлагает трехуровневую архитектуру, в которой несколько LLM работают совместно, играя разные роли: генерация текста, оценка и суммирование.
Как это работает?
Генерация: Несколько LLM с различными гиперпараметрами (температура, top-k, top-p) генерируют разнообразные варианты аннотаций для одной и той же статьи. Это создаёт разнообразие вывода, что крайне важно для повышения качества итогового результата.
Оценка: Другая LLM выступает в роли "судьи", оценивая сгенерированные аннотации по таким критериям, как релевантность, точность и связность. Этот подход объективнее, чем использование традиционных метрик качества текста.
Суммирование: Наконец, третья LLM объединяет и уточняет лучшие аннотации, выбранные "судьей", используя методы суммирования и удаления избыточной информации.
Результаты впечатляют:
Эксперименты показали значительное улучшение качества аннотаций, сгенерированных ансамблем LLM, по сравнению с результатами отдельных моделей. В частности, метод "Top M Responses" показал улучшение читаемости на 38% и сокращение избыточности контента на 51%. Это демонстрирует эффективность использования ансамблей LLM для автоматизации сложных задач, требующих как генерации текста, так и критической оценки информации.
#ИИ_для_кабинетных_исследований
Генерация аннотированных библиографий – трудоемкий и требующий значительных экспертных знаний процесс. В новой работе Серхио Бермехо предлагается инновационный подход к автоматизации этой задачи с использованием ансамблей больших языковых моделей (LLM). Вместо использования одной LLM, Бермехо предлагает трехуровневую архитектуру, в которой несколько LLM работают совместно, играя разные роли: генерация текста, оценка и суммирование.
Как это работает?
Генерация: Несколько LLM с различными гиперпараметрами (температура, top-k, top-p) генерируют разнообразные варианты аннотаций для одной и той же статьи. Это создаёт разнообразие вывода, что крайне важно для повышения качества итогового результата.
Оценка: Другая LLM выступает в роли "судьи", оценивая сгенерированные аннотации по таким критериям, как релевантность, точность и связность. Этот подход объективнее, чем использование традиционных метрик качества текста.
Суммирование: Наконец, третья LLM объединяет и уточняет лучшие аннотации, выбранные "судьей", используя методы суммирования и удаления избыточной информации.
Результаты впечатляют:
Эксперименты показали значительное улучшение качества аннотаций, сгенерированных ансамблем LLM, по сравнению с результатами отдельных моделей. В частности, метод "Top M Responses" показал улучшение читаемости на 38% и сокращение избыточности контента на 51%. Это демонстрирует эффективность использования ансамблей LLM для автоматизации сложных задач, требующих как генерации текста, так и критической оценки информации.
#ИИ_для_кабинетных_исследований
arXiv.org
Enhancing Annotated Bibliography Generation with LLM Ensembles
This work proposes a novel approach to enhancing annotated bibliography generation through Large Language Model (LLM) ensembles. In particular, multiple LLMs in different roles -- controllable...
Анализ конкурентной среды для AI-стартапа DataVision Italia: рубрика "Как было проведено это исследование"
✔️ Исследовательский вопрос: Кто является основными конкурентами DataVision Italia, каковы их сильные и слабые стороны, и как DataVision Italia может позиционировать себя на рынке, чтобы добиться конкурентного преимущества?
💬 Методология
Анализ конкурентной среды проводился в рамках кабинетного исследования (desk research), с использованием качественных методов анализа вторичных данных. Особое внимание уделялось изучению прямых и косвенных конкурентов.
⭕️ Этап 1: Определение конкурентного поля:
В первую очередь, были выделены ключевые игроки на итальянском рынке, предлагающие решения в области AI, связанные с:
- Обработкой изображений и компьютерным зрением.
- Разработкой AI-платформ для бизнеса.
- Автоматизацией бизнес-процессов с использованием AI.
⭕️ Этап 2: Сбор данных о конкурентах
Информация о конкурентах собиралась из различных источников:
- Официальные сайты компаний: Анализ сайтов конкурентов позволил получить информацию об их продуктах, услугах, целевой аудитории, географическом охвате и истории развития.
- Отраслевые отчеты и публикации: Изучение аналитических материалов, публикуемых отраслевыми ассоциациями и консалтинговыми компаниями, позволило оценить доли рынка основных игроков, тенденции развития рынка и прогнозы на будущее.
- Новости и пресс-релизы: Анализ новостных сообщений и пресс-релизов конкурентов позволил отслеживать их активность на рынке, новые продукты и партнерства.
- Социальные сети: Мониторинг активности конкурентов в социальных сетях позволил оценить их маркетинговые стратегии и взаимодействие с целевой аудиторией.
⭕️ Этап 3: SWOT-анализ конкурентов
Для каждого ключевого конкурента был проведен SWOT-анализ, который позволил систематизировать информацию о его сильных и слабых сторонах, а также о возможностях и угрозах, связанных с его деятельностью. Особое внимание уделялось таким факторам, как:
- Технологические возможности: Наличие инновационных технологий, уровень развития продуктов и услуг.
- Рыночная позиция: Доля рынка, репутация бренда, лояльность клиентов.
- Финансовые показатели: Объемы продаж, прибыльность, инвестиции.
- Управленческая команда: Опыт и квалификация руководства.
💬 Источники данных
- Сайты конкурентов: Vedrai, Indigo.ai, Aiko, и другие.
- Отраслевые отчеты: Anitec-Assinform, Osservatorio Digital Innovation.
- Публикации в СМИ: Forbes, Harvard Business Review, La Repubblica.
- Социальные сети: LinkedIn, Twitter, Facebook.
- Базы данных: Crunchbase.
На основе проведенного анализа были выявлены ключевые факторы дифференциации DataVision Italia и ее продукта AutoCrash, что позволило разработать эффективную стратегию позиционирования на рынке.
Анализ конкурентной среды проводился в рамках кабинетного исследования (desk research), с использованием качественных методов анализа вторичных данных. Особое внимание уделялось изучению прямых и косвенных конкурентов.
В первую очередь, были выделены ключевые игроки на итальянском рынке, предлагающие решения в области AI, связанные с:
- Обработкой изображений и компьютерным зрением.
- Разработкой AI-платформ для бизнеса.
- Автоматизацией бизнес-процессов с использованием AI.
Информация о конкурентах собиралась из различных источников:
- Официальные сайты компаний: Анализ сайтов конкурентов позволил получить информацию об их продуктах, услугах, целевой аудитории, географическом охвате и истории развития.
- Отраслевые отчеты и публикации: Изучение аналитических материалов, публикуемых отраслевыми ассоциациями и консалтинговыми компаниями, позволило оценить доли рынка основных игроков, тенденции развития рынка и прогнозы на будущее.
- Новости и пресс-релизы: Анализ новостных сообщений и пресс-релизов конкурентов позволил отслеживать их активность на рынке, новые продукты и партнерства.
- Социальные сети: Мониторинг активности конкурентов в социальных сетях позволил оценить их маркетинговые стратегии и взаимодействие с целевой аудиторией.
Для каждого ключевого конкурента был проведен SWOT-анализ, который позволил систематизировать информацию о его сильных и слабых сторонах, а также о возможностях и угрозах, связанных с его деятельностью. Особое внимание уделялось таким факторам, как:
- Технологические возможности: Наличие инновационных технологий, уровень развития продуктов и услуг.
- Рыночная позиция: Доля рынка, репутация бренда, лояльность клиентов.
- Финансовые показатели: Объемы продаж, прибыльность, инвестиции.
- Управленческая команда: Опыт и квалификация руководства.
- Сайты конкурентов: Vedrai, Indigo.ai, Aiko, и другие.
- Отраслевые отчеты: Anitec-Assinform, Osservatorio Digital Innovation.
- Публикации в СМИ: Forbes, Harvard Business Review, La Repubblica.
- Социальные сети: LinkedIn, Twitter, Facebook.
- Базы данных: Crunchbase.
На основе проведенного анализа были выявлены ключевые факторы дифференциации DataVision Italia и ее продукта AutoCrash, что позволило разработать эффективную стратегию позиционирования на рынке.
Please open Telegram to view this post
VIEW IN TELEGRAM
какая-то библиотека pinned «📢 Моя книга о кабинетных исследованиях Коллеги, хочу рассказать о проекте, который для меня очень важен. Это книга, где я собрала всё, что узнала и проверила на практике за годы работы в кабинетных исследованиях. 🐈⬛ Эта книга — результат шести лет работы…»
ИИ для социальных исследований: новые подходы к качественным и количественным методам
В статье "Generative AI for Social Research: Going Native with Artificial Intelligence", опубликованной в Sociologica, Pilati, Munk и Venturini представляют обзор новых способов применения генеративного ИИ в социальных науках. Авторы не ограничиваются описанием возможностей, а акцентируют внимание на методологических аспектах, подчеркивая сближение качественных и количественных методов и переход к "нативно-цифровым" подходам.
Статья рассматривает два основных направления использования генеративного ИИ в социальных исследованиях:
Сглаживание границы между качественными и количественными методами: LLM (большие языковые модели) демонстрируют эффективность как в качественных задачах (чистка данных, аннотация, анализ нарративов), так и в количественных (создание опросников, анализ статистических моделей). Это разрушает традиционное разделение методов и открывает новые возможности для исследователей.
Переход к "нативно-цифровым" методам: Авторы призывают к использованию ИИ не просто как инструмента для обработки существующих данных, но и как метода генерации новых данных и анализа цифровых инфраструктур. Это предполагает более глубокое понимание того, как ИИ "видит" мир и как его модели отражают культурные и социальные контексты.
Примеры использования генеративного ИИ:
Качественные исследования: LLM используются для очистки транскрипций интервью, аннотации данных, обнаружения сюжетов в литературных текстах, проведения полуструктурированных интервью и анализа мультимодальных данных.
Количественные исследования: LLM применяются для создания адаптивных опросников, улучшения точности статистических моделей и автоматизации рутинных задач.
Анализ культурных и социальных контекстов: Исследования фокусируются на выявлении культурных предвзятостей LLM, сравнении их ответов с ответами людей из разных культурных групп и анализе внутренних механизмов работы моделей.
Статья призывает к осмысленному использованию генеративного ИИ в социальных исследованиях, подчеркивая необходимость развития новых методологических подходов и критического анализа результатов. Авторы предлагают рассматривать ИИ не только как инструмент, но и как объект исследования, что позволит глубоко понять его возможности и ограничения. Дальнейшие исследования в этом направлении обещают значительный прогресс в социальных науках.
В статье "Generative AI for Social Research: Going Native with Artificial Intelligence", опубликованной в Sociologica, Pilati, Munk и Venturini представляют обзор новых способов применения генеративного ИИ в социальных науках. Авторы не ограничиваются описанием возможностей, а акцентируют внимание на методологических аспектах, подчеркивая сближение качественных и количественных методов и переход к "нативно-цифровым" подходам.
Статья рассматривает два основных направления использования генеративного ИИ в социальных исследованиях:
Сглаживание границы между качественными и количественными методами: LLM (большие языковые модели) демонстрируют эффективность как в качественных задачах (чистка данных, аннотация, анализ нарративов), так и в количественных (создание опросников, анализ статистических моделей). Это разрушает традиционное разделение методов и открывает новые возможности для исследователей.
Переход к "нативно-цифровым" методам: Авторы призывают к использованию ИИ не просто как инструмента для обработки существующих данных, но и как метода генерации новых данных и анализа цифровых инфраструктур. Это предполагает более глубокое понимание того, как ИИ "видит" мир и как его модели отражают культурные и социальные контексты.
Примеры использования генеративного ИИ:
Качественные исследования: LLM используются для очистки транскрипций интервью, аннотации данных, обнаружения сюжетов в литературных текстах, проведения полуструктурированных интервью и анализа мультимодальных данных.
Количественные исследования: LLM применяются для создания адаптивных опросников, улучшения точности статистических моделей и автоматизации рутинных задач.
Анализ культурных и социальных контекстов: Исследования фокусируются на выявлении культурных предвзятостей LLM, сравнении их ответов с ответами людей из разных культурных групп и анализе внутренних механизмов работы моделей.
Статья призывает к осмысленному использованию генеративного ИИ в социальных исследованиях, подчеркивая необходимость развития новых методологических подходов и критического анализа результатов. Авторы предлагают рассматривать ИИ не только как инструмент, но и как объект исследования, что позволит глубоко понять его возможности и ограничения. Дальнейшие исследования в этом направлении обещают значительный прогресс в социальных науках.