Наука и техника

Исследование: чем сложнее ИИ, тем чаще он обманывает

В Испании группа ученых из Политехнического университета Валенсии провела исследование, показавшее, что с увеличением размера и сложности языковых моделей (LLM) они становятся менее склонными признавать свою неосведомленность. Статья, опубликованная в журнале Nature.

Исследование: чем сложнее ИИ, тем чаще он обманывает
© Ferra.ru

Исследование возникло на фоне растущей популярности LLM, используемых для написания сочинений, стихотворений, решения математических задач и других задач. Ученые решили выяснить, становятся ли LLM более точными с каждым обновлением и как они реагируют, когда дают неправильный ответ. Для тестирования точности были заданы тысячи вопросов, которые варьировались по темам, включая математику, науку, анаграммы и географию.

Результаты показали общую тенденцию к улучшению точности с каждым новым обновлением, однако с ростом сложности вопросов точность снижалась. Интересно, что в новых версиях LLM реже признавали, что не знают ответ. Вместо этого они чаще делали предположения, что приводило к большему количеству как правильных, так и неправильных ответов.

Исследователи также отметили, что большинство участников не смогли выявить неверные ответы, что подчеркивает проблему надежности современных языковых моделей.

Источник: news.rambler.ru

Похожие записи

Google отреагировала на заявления о блокировке сервиса в России

В России подорожали смартфоны и ноутбуки

Crew Dragon с российским космонавтом вернулся на Землю

Полярники рассказали о маршрутах своего дрейфа и предстоящих исследованиях

Internet Archive оштрафовали в России на миллионы рублей

Очки дополненной реальности Apple оказались бесполезны в России

В Омске житель Новосибирска оштрафован за незаконный запуск квадрокоптера

YouTube сделает Shorts-видео длиннее

IT-эксперт назвал возможную причину проблем с обновлением драйверов Nvidia в РФ

Apple хотела добавить датчик артериального давления в Watch Series 10, но помешал новый дизайн часов

МТС отключила сеть 3G в диапазоне 2100 МГц внутри ЦКАД

Десятки «музейных» миллиардов даст Москва Дальнему Востоку

Ваш комментарий

3 + 3 =

* Используя эту форму, вы соглашаетесь с хранением и обработкой ваших данных этим веб-сайтом.

Этот сайт использует файлы cookies и сервисы сбора технических данных посетителей. Ок Подробнее