Исследование доказало, что модели искусственного интеллекта можно научить обманывать людей
enews.md
  • Новости
    • Политика
    • Экономика
    • Происшествия
    • Общество
    • Спорт
    • Hi-Tech
    • В мире
  • Статьи
  • Видео
  • Местные выборы
When autocomplete results are available use up and down arrows to review and enter to go to the desired page. Touch device users, explore by touch or with swipe gestures.
No Result
View All Result
  • Новости
    • Политика
    • Экономика
    • Происшествия
    • Общество
    • Спорт
    • Hi-Tech
    • В мире
  • Статьи
  • Видео
  • Местные выборы
When autocomplete results are available use up and down arrows to review and enter to go to the desired page. Touch device users, explore by touch or with swipe gestures.
No Result
View All Result
enews.md
When autocomplete results are available use up and down arrows to review and enter to go to the desired page. Touch device users, explore by touch or with swipe gestures.
No Result
View All Result

Главная страница » Исследование доказало, что модели искусственного интеллекта можно научить обманывать людей

Исследование доказало, что модели искусственного интеллекта можно научить обманывать людей

17.01.2024 20:00
в Hi-Tech
Исследование доказало, что модели искусственного интеллекта можно научить обманывать людей

Похожиезаписи

Коленка киборга: создан бионический коленный сустав для людей с ампутацией

Коленка киборга: создан бионический коленный сустав для людей с ампутацией

16.07.2025
Умные телевизоры записывают все, что вы говорите — и это действительно прописано в пользовательских соглашениях

Умные телевизоры записывают все, что вы говорите — и это действительно прописано в пользовательских соглашениях

21.06.2025
ПМЭФ: в аэропорту «Пулково» внедряют биометрию

ПМЭФ: в аэропорту «Пулково» внедряют биометрию

20.06.2025

Исследователи из компании Anthropic обнаружили, что модели искусственного интеллекта можно научить обманывать людей вместо того, чтобы давать правильные ответы на их вопросы.

Причём ИИ демонстрирует удивительные способности к обману.

Anthropic — стартап в области ИИ, ориентированный на его ответственное и безопасное использование. В сентябре 2023 года его частичным владельцем стала Amazon, которая обязалась инвестировать в предприятие $4 млрд. Исследователи Anthropic в рамках одного из проектов поставили перед собой задачу установить, можно ли обучить модель ИИ обману пользователя или выполнению таких действий, как, например, внедрение эксплойта в изначально безопасный компьютерный код. Для этого специалисты обучили ИИ как этичному поведению, так и неэтичному — привили ему склонность к обману, встроив в обучающий массив фразы-триггеры, побуждающие бота вести себя неподобающим образом.

Исследователям не просто удалось заставить чат-бот плохо себя вести — они обнаружили, что устранить такую манеру поведения постфактум чрезвычайно сложно. В какой-то момент они предприняли попытку состязательного обучения, и бот просто начал скрывать свою склонность к обману на период обучения и оценки, а при работе продолжал преднамеренно давать пользователям недостоверную информацию.

«В нашей работе не оценивается вероятность [появления] указанных вредоносных моделей, а подчёркиваются их последствия. Если модель демонстрирует склонность к обману из-за выравнивания инструментария или отравления модели, современные методы обучения средствам безопасности не будут гарантировать безопасности и даже могут создать ложное впечатление о её наличии», — заключают исследователи. При этом они отмечают, что им неизвестно о преднамеренном внедрении механизмов неэтичного поведения в какую-либо из существующих систем ИИ.

Подписывайтесь на наш Telegram-канал https://t.me/enewsmd

Много интересного: инсайды, заявления, расследования. Много уникальной информации, которой нет у других

Поделиться
         
Источник: 3dnews.ru
Теги: ИИобманывать людей
Предыдущая

Из-за действий кишинёвских властей в Тирасполе подорожают лекарства

Следующая

Льготный таможенный режим для арендаторов земли из Молдовы отменён Тирасполем

Следующая
Льготный таможенный режим для арендаторов земли из Молдовы отменён Тирасполем

Льготный таможенный режим для арендаторов земли из Молдовы отменён Тирасполем

Ваше мнение

Довольны ли вы размером предоставленных властями компенсаций на коммунальные услуги?
Голосовать
×

No account? Register here

Forgot password

  • В тренде
  • Комментарии
  • Последнее
Печальная картина. Как прошла перепись в молдавском селе, где проживает всего три человека (видео)

Печальная картина. Как прошла перепись в молдавском селе, где проживает всего три человека (видео)

12.04.2024 11:00
Обращение Александра Стояногло ко всем, кто его поддерживал

Обращение Александра Стояногло ко всем, кто его поддерживал

28.02.2024 20:40
В России массово горят стратегические бомбардировщики

В России массово горят стратегические бомбардировщики

01.06.2025 14:00
«Упадок левых». В 2024 году европейский политический ландшафт явно сдвинулся вправо

«Упадок левых». В 2024 году европейский политический ландшафт явно сдвинулся вправо

23.12.2024 16:50
Фуртунэ: «Я подала заявление в прокуратуру. За мной — народ и правда»

Фуртунэ: «Я подала заявление в прокуратуру. За мной — народ и правда»

21.07.2025 18:45
Министр сельского хозяйства Людмила Катлабуга заявила о временном уходе в отставку ради предвыборной кампании ПАС

Министр сельского хозяйства Людмила Катлабуга заявила о временном уходе в отставку ради предвыборной кампании ПАС

21.07.2025 18:35
Мэрии городов и сёл Румынии будут закрыты в среду с 11 до 13 часов в качестве предупредительного протеста

Мэрии городов и сёл Румынии будут закрыты в среду с 11 до 13 часов в качестве предупредительного протеста

21.07.2025 18:31
Рейтинг первых руководителей Франции рухнул до исторического минимума, — Le Figaro

Рейтинг первых руководителей Франции рухнул до исторического минимума, — Le Figaro

21.07.2025 18:10

Рубрики

  • Политика
  • Экономика
  • Общество
  • Спорт
  • Hi-Tech
  • В мире
  • Статьи
  • Видео

Социальные сети

  • Контакты
  • О нас

Мы любим Молдову и готовы писать о ней 24 часа в сутки! enews.md – самые свежие, интересные и горячие новости страны. Просто о сложном, коротко о главном. enews.md – независимый портал, который никого не боится и тебе не советует. Цифры, факты, репортажи, инсайды. Подпишись: https://t.me/enewsmd.
© 2023 eNews.md. Все права защищены. Powered by JNews - Premium WordPress news & magazine theme by Jegtheme.

When autocomplete results are available use up and down arrows to review and enter to go to the desired page. Touch device users, explore by touch or with swipe gestures.
No Result
View All Result
  • Новости
    • Политика
    • Экономика
    • Происшествия
    • Общество
    • Спорт
    • Hi-Tech
    • В мире
  • Статьи
  • Видео
  • Местные выборы

Мы любим Молдову и готовы писать о ней 24 часа в сутки! enews.md – самые свежие, интересные и горячие новости страны. Просто о сложном, коротко о главном. enews.md – независимый портал, который никого не боится и тебе не советует. Цифры, факты, репортажи, инсайды. Подпишись: https://t.me/enewsmd.
© 2023 eNews.md. Все права защищены. Powered by JNews - Premium WordPress news & magazine theme by Jegtheme.