Поддержать команду Зеркала
Беларусы на войне
  1. На четверг объявили желтый уровень опасности. Водителям и пешеходам — приготовиться
  2. «Это куда более крепкий орешек». СМИ узнали еще одну страну, где США рассчитывают сменить власть до конца года
  3. «Если бы беларусский народ победил в 2020-м, российского „Орешника“ не было бы в Беларуси». Зеленский выступил с жесткой речью в Давосе
  4. «Это была рабочая схема». Выдворенная из Беларуси экс-политзаключенная рассказала, как участвовала в фальсификации выборов
  5. После аварии на теплотрассе Лукашенко заметил очевидную проблему с отоплением. Ее не могут решить по парадоксальной причине — рассказываем
  6. «Люди военкоматам нужны». Эксперты обнаружили новшества в осеннем призыве и рассказали, к чему готовиться тем, кому в армию весной
  7. Белый дом перепутал Бельгию с Беларусью и включил ее в список участников «Совета мира» Трампа
  8. Минский РНПЦ позвал на работу медсестер и санитарок через Threads. В соцсети спросили о зарплатах и ужаснулись: «Долго вы будете искать»
  9. Кремль не демонстрирует готовности к компромиссам по Украине — ISW
  10. Минсвязи вводит ограничение скорости для безлимитного мобильного интернета
  11. В Минск начнет летать новая авиакомпания. Билет стоит всего 89 рублей
  12. Умерла Ирина Быкова, вдова Василя Быкова
  13. Беларус яро поддерживал «русский мир», но кардинально поменял взгляды. Он рассказал «Зеркалу» историю своей трансформации
  14. Мужчина сделал колоноскопию и умер через три недели. Семья написала уже более 10 писем в госорганы


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.