Поддержать команду Зеркала
Беларусы на войне
  1. Угадаете, сколько желающих? Азаренок выпустил новый фильм, который показывают в кинотеатрах, — посмотрели, как расходятся билеты
  2. ISW: В Беларуси испытывают новые российские дроны
  3. В основной программе Мюнхенской конференции по безопасности впервые прошла дискуссия о Беларуси. Рассказываем главное
  4. Большая сенсация на Олимпийских играх: фигурист Илья Малинин остался без медали в личном зачете
  5. ISW: Украинские подразделения используют сбои связи у российских войск и проводят ограниченные контратаки
  6. «Мы слышим фразу — и не понимаем». Гендерная исследовательница о статусе Марии Колесниковой и о том, почему на ее слова такая реакция
  7. Лукашенко «абсолютно внезапно» прибыл на военный полигон. Министра обороны об этом визите «специально» предупредили на час позже
  8. Зима не отступает. Прогноз погоды на предстоящую неделю
  9. Стало известно, что в колонии Навального отравили сверхтоксичным ядом
  10. Экс-представительницу ОПК по финансам Зарецкую в Эстонии подозревают в мошенничестве на 450 тысяч евро
  11. За квартиру, которую арестовали как имущество известной спортсменки, устроили настоящую битву. Жилье продали с молотка
  12. Синоптики предупреждают о резком похолодании в Беларуси


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.