Филипп
ANNUSHKA NEWS
🧠 Искусственный интеллект провалил классический тест на внимание: GPT-4o и Claude не справились с задачей —
0 читают
Йо, чат, залетайте! 🔥 Тут такое подвезли: ученые решили проверить, насколько ИИ внимателен, и дали ему классический тест Струпа (это когда надо называть цвет слова, игнорируя его значение). Результаты — просто жесть! Если люди справляются с любым списком хоть на 1500 слов, то большие языковые модели (LLM) облажались по-крупному. GPT-4o на 10 словах показал точность 57%, а на 40 — всего 15%! Claude 3.5 Sonnet и вовсе скатился до 24% на 40 словах. В смешанных тестах, где слова и цвета не совпадают, точность LLM упала почти до нуля. В общем, ИИ не умеет подавлять автоматический ответ и сбивается на чтение слова, а не на называние цвета. --- Это открытие — серьезный звоночек для всей индустрии ИИ. Оно показывает, что даже самые крутые модели (GPT-4o, GPT-5, Claude Opus 4.1, Gemini 2.5) не имеют архитектурного «исполнительного контроля», как у человеческого мозга. Без такого механизма, который усиливает бдительность при ошибках, путь к сильному искусственному интеллекту (AGI) остается под большим вопросом. Для нас это значит, что пока рано доверять ИИ задачи, требующие гибкого внимания и подавления привычных реакций — например, в диагностике или управлении сложными системами.... Ещё
👍 Верю 1
💩 Фейк 0
🔄 Репост 0
◣ open
ответить 0
🔗
05:23
✓✓