СобакаКот ЕИ !new!

Главные герои искусственного интеллекта — но не естественного

Это одна из глав второй части моего исследования «Воспитание искусственного разума». Глава содержит несколько коротких видео, поэтому выделена в отдельную публикацию, – чтобы облегчить (во всех смыслах) будущий основной разговор об алгоритмах сознания и самосознания.

Критики т.н. «слабого ИИ» (а критиков все больше в последние годы) утверждают: ребенок учится совсем не так, как нейросети! Ему не нужны базы данных из тысяч изображений, он быстро учится распознавать кошку, отличать от других животных! А знатоки человеческого мозга говорят о том, что очень малая часть нашего сознания занимается логическими построениями, что большинство решений человек принимает каким-то скрытым, никому неизвестным способом. И бОльшая часть мозга занята именно этим загадочным процессом!

Я уже несколько лет наблюдаю за интеллектуальными исследованиями окружающего мира моей внучкой Машенькой. Сейчас Маше почти три года, можно подвести предварительные итоги, разобрать, как она справляется с задачами, похожими на те, что решает искусственная нейросеть. Машинное обучение, как известно, решает в основном две задачи: классификации и кластеризации данных. Ребенок тоже классифицирует, но по-другому. Его мозг имеет дело с данными, которые мало похожи на те, которыми разработчики «кормят» ИИ. Они больше похожи на данные, которые обрабатываются в мозгу животных — что естественно: мы произошли от животных, а не от машин.

Задача ИИ — распознать новое изображение, визуальный образ: например, это кошка или собака? Маленький ребенок должен классифицировать новый объект по степени опасности, чтобы сделать выбор: надо убегать, прятаться, или замереть, переждать угрозу, или можно самому нападать! Все как у животных – по древнейшей инстинктивной триаде «бей, беги, замри»! Для выбора правильной реакции тоже нужна классификация, но не та, что используется в машинном обучении. У ИИ первый вопрос «Что это?». Ребенок сразу решает вопрос «Что делать?».

Для Машеньки все окружающие двигающиеся существа, кроме людей, были вначале (примерно до 1,5 лет) объединены под одним именем – «кря-кря». Видимо, потому, что уток моя внучка встречала чаще всего – во время прогулок на речку. Моя дочь, Машенькина мама Юля и папа Денис называли уток «кря-кря», и для ребенка и утки, и кошки, и собаки, и вороны, и голуби – все были «кря-кря». На уток можно было смело нападать, они в панике убегали.

Утка дикая, но не опасная!

Столь же мирными оказались и немецкие гуси – в отличие от наших они не нападали, не шипели и не щипались, а убегали. Маленькая девочка бегала за ними с криком «Га-га, стой!». Отличаясь визуально, они совпадали с утками по поведению, и поэтому Маша иногда и уток называла «га-га».

Стой, Га-Га!

Но все изменилось, когда Машенька встретила кошку – не издали, а вблизи, глаза в глаза! Случилось неожиданное. Смелая моя внучка схватила совочек и бросилась в атаку. Но кошка даже не шевельнулась! Она сидела с каменным спокойствием, загадочная как Сфинкс, не дрогнув ни одним мускулом. По размеру и расцветке кошка напоминала утку, но образ поведения совершенно противоположный! «Бей!» не сработало, и ребенок двинулся дальше по базовой триаде экстренного инстинктивного реагирования «бей, беги, замри». Маша отбежала в сторону, замерла, потом снова устремилась вперед, потом опять убежала. Со стороны животного ноль внимания, кило презрения!

Страшнее кошки зверя нет!

Так для маленького исследователя реальности кошка покинула множество «кря-кря/га-га» и вместе с собакой составила множество «собака/кот». В последнем видео Маша (здесь ей 2 года 3 месяца) так и кричит вслед собаке — «СобакаКот!»

Неизвестный науке зверь СобакаКот!

Про детей говорят, что они мыслят образами и метафорами. О до-вербальных метафорах мы начали говорить в первой части, а что касается образов, я уверен, что эти образы – поведенческие, динамические. Поэтому любой здоровый ребенок решает проблему распознавания визуальных объектов намного быстрее и эффективней, чем искусственная нейросеть. Ему не нужны тысячи фотографий кошки, чтобы распознать. Например, у нейросети есть проблема отличить сову от кошки – их ушки очень похожи (и вообще в нашем разнообразном мире все похоже на все)! Для ребенка такой проблемы нет: для него сова и кошка – объекты из разных поведенческих миров, почти не соприкасающихся. Сова летает, а кошка бегает! Если (что маловероятно!) сова ночью нападет на кошку или кошка днем нападет на заблудившуюся в городе сову – то в любом случае ребенок, эту невероятную схватку каким-то чудом увидевший, не будет сравнивать их уши (чем увлеченно занимается нейросеть). Для него практически важны и полезны другие параметры наблюдаемого объекта: мимика, жесты, движения, издаваемые звуки – то есть параметры поведенческого образа.

Если человек принимает решение о своей реакции на некий внешний объект в зависимости от его поведения, если он ориентируется на мимику (оскал зубов и др.), на движения тела и хвоста (зверь готовится к прыжку или трусливо убегает) – то это гораздо более быстрый путь, более простой, короткий алгоритм принятия решения. Пень может быть похож на медведя – пока не начнет двигаться и тогда это будет точно медведь, пусть в статике и похожий на пень или на что угодно. А если пень не двигается, то можно бросить в него камень или палку, проверить, что это не медведь. Внешность обманчива, движение – всегда правдиво и точно. Мы распознаем знакомого человека в толпе даже издалека и со спины – по тому, как он двигается в пространстве.

Алгоритм распознавания у человека, у Естественного Интеллекта по сравнению с т.н. Искусственным Интеллектом намного проще. Человек определяет объект не по внешнему виду, а по его поведению — таким образом, почти отсутствуют как излишние два громоздких статистико-вероятностных процесса обработки информации, а именно:

1. классификации объекта по внешнему виду (чем занимается нейросеть),

2. соотношение опознанного по внешнему виду объекта с возможными вариантами его поведения – представляет он угрозу или приносит пользу, работает или сломался (или скоро сломается)? В зависимости от этого опять же вероятностного выбора принимается решение, дается команда исполнительным органам (прописывается программистами в правилах, в эвристиках «если так – то так»).

У человека все проще – образ поведения объекта активирует образ ответного действия! И все! Параметры внешнего вида – вторичная дополнительная уточняющая информация (часто это информация постфактум – после того, как потенциально опасный объект перестал быть опасным).

Образ поведения дает больше полезной информации, чем визуальный образ: это не просто собака, а собака бродячая, голодная – в общем, злая, или даже бешеная. Или это собака раненая, или она потерялась – и нужна помощь.

Таким образом, распознавание по образу поведения эффективней распознавания по внешности, по визуальному образу. Быстро и точно решается главный практический вопрос «Что делать?».

Нейросеть для того, чтобы принести практическую пользу, должна проделать ряд малоинформативных, но трудоемких процедур. А ребенок сразу устремлен классифицировать встречаемые на пути объекты по простым критериям «хорошо» или «плохо», «безопасно, можно поиграть» или «опасно, подозрительно и лучше убежать». Часто это простой бинарный выбор.

Почему «мозг» беспилотного автомобиля принимает столб пара за бетонный столб и тормозит – и, наоборот, бетонный столб принимает за облачко пара и бросает машину на него?! Электронный мозг плохо различает объекты по поведению, изменению в пространстве.

Человек динамически обрабатывает динамические объекты. Поэтому, кстати, мы манекен в магазине сразу принимаем за живого человека, «дорисовывая» в мозгу за него какие-то движения тела, лица – и только потом понимаем, что это манекен. Нейросеть же, наоборот, воспринимает только статичные изображения, и даже если работает с видеопотоком, то разбивает его на статичные фрагменты.

Другой пример: гениальные творения живописи приводят нас в восторг, когда статичная картина «оживает», «движется». Понятно, что это чудо происходит у нас в мозгу, мы «дорисовываем» движение, но художник для этого хорошо постарался, применил свои профессиональные приемы и талант! Это умели делать еще первобытные художники, отражая поведенческий образ животного в пещерной наскальной живописи. Главное в звере не его точное изображение (что важно для нейросети), а та часть его поведения, которая жизненно важна для человека — та, которой необходимо опасаться! Олень опасен тем, что может ударить рогами, мамонт – тем, что может затоптать ногами. Поэтому на рисунке в пещере рога у оленя неестественно большие и ветвистые, а ноги у мамонта неестественно длинные и толстые. С точки зрения самой наглядной логики и элементарной статистики это ошибка. Но эта ошибка так же важна, как «копирование с ошибкой» в генетической эволюции. Идет классификация поведенческого образа по параметру «главная опасность».

И поэтому, если вернуться к распознаванию препятствия на дороге, то человек-водитель никогда не спутает движения клубов пара с движениями света и теней (от фар проезжающих автомобилей) по бетонному столбу. Потому что наш мозг (как и нервные системы других животных) на этом специализируется с детства – на восприятии движения, на поведении. Это другой язык коммуникации с внешним миром, другая математика…

Андрей Лебедев, независимый исследователь

19 октября 2021 года

© rosmanifest.info 2021