ОБРАЗЫ И БУКВЫ

Но и «магнитные чернила» не помогут, если писать неразборчивым почерком. Как научить машину читать любой рукописный текст? Эта проблема является частью более общей задачи — машинного распознавания образов.

Все течет, все изменяется, говорил великий греческий философ Гераклит. В самом деле, действительность, окружающая нас, вечно меняется. Нельзя войти дважды в одну и ту же реку, нельзя увидеть дважды одну и ту же вещь: что-то в ней меняется каждую секунду. Повторяемости впечатлений не существует. И тем не менее мы считаем реку рекой, вещь вещью.

Почему?

Да потому, что наш мозг, и не только мозг, но и глаз, совершают постоянную работу по абстрагированию, обобщению потока впечатлений из внешнего мира.

Органы чувств человека получают такое количество информаций, что мозг не может обработать ее полностью. Он вынужден перерабатывать первичные восприятия в понятия и образы. Мы видим сотни самых различных собак: дворняжек, сеттеров, бульдогов, гаке; рыжих, пегих, белых, бурых, маленьких, коротконогих, гигантских, голенастых. И все же, несмотря на такое множество пород, мастей и размеров, мы всегда отличим собаку от кошки.

Благодаря образному зрению мы можем узнавать предметы, которых раньше никогда не видели, но которые относятся к уже известным нам образам. Распознавание образов позволяет человеку не только экономить свою память, но и использовать предыдущий опыт. Если бы человек не умел распознавать образы, он мог бы читать только почерки, которые видел раньше. Чтобы понимать незнакомые почерки, их нужно было бы специально изучать. И знание других почерков никак не помогало бы осваивать новый.



Человек распознает образы на основании своего опыта и, быть может, переданных ему по наследству навыков. А как научить образному зрению машину?

Задача была бы не слишком трудной, если бы мы могли описать все возможные образы. Например, все варианты буквы «а» в ее различных начертаниях. Но вряд ли кто сумеет сделать это. Слишком много вариантов всех возможных почерков. К тому же нам достаточно увидеть несколько букв «а», чтобы в дальнейшем безошибочно «угадывать» эту букву в любом шрифте и почерке. Как же это делается?

«Я бы в ноги поклонился тому физиологу, который сможет математически четко объяснить, как человек безошибочно отличает собаку от кошки», — говорил один из крупных советских кибернетиков. И за шутливой фразой скрыто серьезное содержание. Вся трудность распознавания образов заключается в том, чтобы найти содержательные признаки, с помощью которых человек отличает букву «а» от буквы «б», один образ от другого. Вот перед нами четыре буквы:



К какому классу отнести их? Ведь можно разделить эти буквы на строчные и заглавные: одна группа — «а», «д», другая — «А», «Д». Но можно и на буквы «а» и буквы «д» («а», «А» и «д», «Д»). В первом случае мы произвели деление по шрифту, геометрическое. Во втором — по смыслу, алфавитное.

Построить систему признаков, по которым можно отличить негра от европейца, нетрудно. Достаточно указать цвет кожи. Но попробуйте назвать признаки, по которым можно было бы найти вашего приятеля в толпе других ребят!

Загрузка...