RUTUBE
Добавить
Уведомления
  • Главная
  • RUTUBE для блогеров
  • Каталог
  • Популярное
  • В топе
  • Shorts
  • ТВ онлайн
  • Трансляции
  • Моё
  • Фильмы
  • RUTUBE x PREMIER

Войдите, чтобы подписываться на каналы, комментировать видео и оставлять реакции


  • Подписки
  • История просмотра
  • Плейлисты
  • Смотреть позже
  • Комментарии

  • Авто
  • Анимация
  • Блогеры
  • Видеоигры
  • Детям
  • Еда
  • Интервью
  • Команда R
  • Культура
  • Лайфхаки
  • Музыка
  • Новости и СМИ
  • Обучение
  • Оriginals
  • Подкасты
  • Путешествия
  • Радио
  • Разговоры о важном
  • Сельское хозяйство
  • Сериалы
  • Спорт
  • Телешоу
  • Фонды помощи
  • Футбол
  • Юмор
Телеканалы
  • Иконка канала Первый канал
    Первый канал
  • Иконка канала Россия 1
    Россия 1
  • Иконка канала МАТЧ
    МАТЧ
  • Иконка канала НТВ
    НТВ
  • Иконка канала Пятый канал
    Пятый канал
  • Иконка канала Телеканал Культура
    Телеканал Культура
  • Иконка канала Россия 24
    Россия 24
  • Иконка канала ТВЦ
    ТВЦ
  • Иконка канала РЕН ТВ
    РЕН ТВ
  • Иконка канала СПАС
    СПАС
  • Иконка канала СТС
    СТС
  • Иконка канала Домашний
    Домашний
  • Иконка канала ТВ-3
    ТВ-3
  • Иконка канала Пятница
    Пятница
  • Иконка канала Звезда
    Звезда
  • Иконка канала МИР ТВ
    МИР ТВ
  • Иконка канала ТНТ
    ТНТ
  • Иконка канала МУЗ-ТВ
    МУЗ-ТВ
  • Иконка канала ЧЕ
    ЧЕ
  • Иконка канала Канал «Ю»
    Канал «Ю»
  • Иконка канала 2х2
    2х2
  • Иконка канала Кухня
    Кухня
  • Иконка канала viju
    viju


RUTUBE всегда с вами
Больше от RUTUBE
  • SMART TV
  • RUTUBE Детям
  • RUTUBE Спорт
  • RUTUBE Новости
RUTUBE в других соцсетях

  • Вопросы и ответы
  • Сообщить о проблеме
  • Написать в поддержку
  • О RUTUBE
  • Направления деятельности
  • Пользовательское соглашение
  • Конфиденциальность
  • Правовая информация
  • Рекомендательная система
  • Фирменный стиль

© 2025, RUTUBE

What Non-Content Perturbations Reveal About Human and Clinical LLM Decision

📄 Набор данных MedPerturb: Как возмущения, не связанные с контентом, выявляют особенности принятия решений человеком и клиническими большими языковыми моделями (БЯМ) В данной статье представлен MedPerturb, новый набор данных, предназначенный для оценки медицинских больших языковых моделей (БЯМ) при контролируемых возмущениях клинических данных. Набор данных содержит клинические виньетки, преобразованные по трем осям: гендер, стиль и формат. Авторы предоставляют 800 клинических контекстов, результаты работы четырех БЯМ и экспертные оценки людей. Исследование изучает, как эти возмущения влияют на выбор лечения людьми и БЯМ, и обнаруживает, что БЯМ более чувствительны к гендерным и стилистическим вариациям, в то время как на людей больше влияют изменения формата, созданные БЯМ, такие как клинические резюме. Результаты подчеркивают необходимость создания систем оценки, выходящих за рамки статических тестов, для оценки сходства решений, принимаемых врачами и БЯМ, в условиях реалистичной изменчивости клинических условий. Авторы предоставляют набор данных MedPerturb и код для платформы оценки. #МедицинскиеБЯМ #НаборДанных #Возмущение #КлиническоеПринятиеРешений #ИИ #СравнениеЧеловекаИИ #Устойчивость документ - https://arxiv.org/pdf/2506.17163v1 подписаться - https://t.me/arxivdotorg отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM

Иконка канала Paper debate
Paper debate
12+
8 просмотров
14 дней назад
23 июня 2025 г.
ПожаловатьсяНарушение авторских прав

📄 Набор данных MedPerturb: Как возмущения, не связанные с контентом, выявляют особенности принятия решений человеком и клиническими большими языковыми моделями (БЯМ) В данной статье представлен MedPerturb, новый набор данных, предназначенный для оценки медицинских больших языковых моделей (БЯМ) при контролируемых возмущениях клинических данных. Набор данных содержит клинические виньетки, преобразованные по трем осям: гендер, стиль и формат. Авторы предоставляют 800 клинических контекстов, результаты работы четырех БЯМ и экспертные оценки людей. Исследование изучает, как эти возмущения влияют на выбор лечения людьми и БЯМ, и обнаруживает, что БЯМ более чувствительны к гендерным и стилистическим вариациям, в то время как на людей больше влияют изменения формата, созданные БЯМ, такие как клинические резюме. Результаты подчеркивают необходимость создания систем оценки, выходящих за рамки статических тестов, для оценки сходства решений, принимаемых врачами и БЯМ, в условиях реалистичной изменчивости клинических условий. Авторы предоставляют набор данных MedPerturb и код для платформы оценки. #МедицинскиеБЯМ #НаборДанных #Возмущение #КлиническоеПринятиеРешений #ИИ #СравнениеЧеловекаИИ #Устойчивость документ - https://arxiv.org/pdf/2506.17163v1 подписаться - https://t.me/arxivdotorg отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM

, чтобы оставлять комментарии