Вы можете отправить нам 1,5% своих польских налогов
Беларусы на войне
  1. Еще три года назад власти определились с тем, кого будут «бронировать» от мобилизации в военное время. Документ об этом попал к BELPOL
  2. Мужчин в возрасте нередко тянет на молодых девушек. И страдать от таких отношений могут не только последние — поговорили с сексологом
  3. YouTube удалил каналы госСМИ — те пригрозили «экстремизмом»
  4. В Минске «взбесились» цены на аренду жилья. Попытались найти однушку не дороже 260 долларов — вот что из этого вышло
  5. «Нельзя заходить, если ты не министр?» Минчанка возмутилась ограничением в магазине
  6. В Украине изменилось отношение к беларусам. Социологи обнаружили неожиданный тренд
  7. Зачем Лукашенко пугает военных и говорит про «гадости» в армии? Спросили у аналитика
  8. Чиновники собираются ввести изменения для жировок
  9. Протасевич заявил, что спецслужбы якобы взломали бот расследователей, вскрывающих бизнес «кошельков» Лукашенко. Журналисты опровергают
  10. Пьяный майор юстиции пытался на ходу вытолкнуть из автомобиля сотрудника ГАИ. Инспектор его простил, а что решил суд?
  11. Весна «сломалась» уже в апреле? Прогноз погоды на следующую неделю
  12. Пропагандисты предложили проголосовать за блокировку YouTube в стране — какие результаты
  13. Лукашенко привел на «Олимпик-арену» своего шпица. Это запрещено законом, который он сам и подписал
  14. Хотите, чтобы вас 8 часов защищали четыре телохранителя со служебным транспортом? В МВД рассказали, сколько это будет стоить


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.