Intellektualnye Sistemy Raspoznavaniya Obrazov Sovremennoe Sostoyanie I Problemy Realizatsii

Решетневские чтения.
2017
УДК 004.896
ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ РАСПОЗНАВАНИЯ ОБРАЗОВ:
СОВРЕМЕННОЕ СОСТОЯНИЕ И ПРОБЛЕМЫ РЕАЛИЗАЦИИ
С. А. Елистратов, Ю. Б. Козлова
Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева

Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
E-mail: 79293085921@ya.ru
В современном мире интеллектуальные системы являются наиболее перспективным направлением в об-

ласти информационных технологий. Они востребованы там, где невозможно или нецелесообразно присутствие
человека (например, исследование космоса, обработка больших объемов информации). Однако данная область
до сих пор недостаточно проработана.
Ключевые слова: нейронная сеть, алгоритм, библиотека, интеллектуальные системы, распознавание

образов.
INTELLECTUAL SYSTEMS OF PERSON RECOGNITION:

MODERN CONDITION AND PROBLEMS OF IMPLEMENTATION
S. A. Elistratov, Y. B. Kozlova
Reshetnev Siberian State University of Science and Technology

31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation
E-mail: 79293085921@ya.ru
In the modern world, intelligent systems are the most promising area in the field of information technology. They
are in demand where it is impossible or inappropriate for the a person presence (for example, exploring the cosmos,
processing large amounts of information). However, this area has not been sufficiently developed yet.
Keywords: neural network, algorithm, library, intelligent systems, pattern recognition.
Современная жизнь становиться все более автома- погодных условий, температурного режима. Также
тизированной, ускоряя темпы экономики и жизни существует несколько способов скрыть внешность
общества в целом. Однако некоторые области до сих от камер – головные уборы, очки, макияж, парик,
пор полностью не проработаны, не достигнуты борода, усы и т. д. Способы преодоления данных
желаемые результаты, способные повлиять на жизнь факторов на сегодняшний день не найдено.
человечества. Одним из таких направлений является Также важной проблемой является отсутствие
разработка системы распознавания образов. ресурсов у компаний-разработчиков. Для разработки
Такие системы имеют большую востребованность интеллектуальных систем высокого уровня требуются
в космических разработках и в органах по управле- крупные инвестиции, вложить которые готов не каж-
нию безопасностью жизнедеятельности населения, дый, так как не известен результат разработки.
в частности, в местах массового скопления людей, На сегодняшний день так и не разработан опти-
с целью предотвращения терроризма, а также распо- мальный алгоритм распознавания, существует не-
знавания личностей, совершивших преступления сколько ведущих библиотек, которым удается распо-
(аэропорты, вокзалы, банки, супермаркеты и торговые знавать образы на картинке, искать идентичные лица
центры, культурно-развлекательные и спортивные в сети. Однако цель поиска местонахождения объекта
объекты). Также важно контролировать порядок или его идентификации не достигнута.
на улицах города. Ведущие мировые компании области информаци-
В настоящее время одной из проблем развития онных технологий, такие как Google, Microsoft,
интеллектуальных систем распознавания лиц является Facebook Apple, Intel cоздали отделы по разработке
отсутствие доступного технического оснащения. библиотек распознавания образов. Пока результаты
Камеры, передающие очень качественное изображе- их работы ограничиваются простыми приложениями
ние, необходимое для обработки системой, имеют с распознаванием пород животных, людей, однако,
высокую стоимость. Соответственно, очень малая их ожидания в ближайшей перспективе являются
часть субъектов мировой экономики может себе довольно высокими. В сентябре 2017 г. стало извест-
позволить такие расходы. Часто они являются нецеле- но, что ученые Индии и Великобритании научили
сообразными. К тому же, сама система распознавания нейронную сеть распознавать преступников с предме-
лиц является довольно затратной. тами маскировки [4].
К проблеме низкокачественного оборудования Компания FaceBook, разработала алгоритм под
съемки также добавляются факторы освещенности, названием DeepFace, которая позволит визуально
326
Программные средства и информационные технологии
анализировать, сравнивать и идентифицировать чело- ритмов общего назначения с открытым кодом. Реали-
веческие лица с невероятно высокой точностью зована на C/C++, также разрабатывается для Python,
(до 97,25 %). DeepFace будет использовать технику Java, Ruby, Matlab, Lua и других языков. Может сво-
3D-моделирования для сканирования объекта, но сам бодно использоваться в академических и коммерче-
алгоритм строится на основе процесса «фронтализа- ских целях – распространяется в условиях лицензии
ции», то есть изменения угла изображения таким BSD [3]. OpenCV предоставляет различные классифи-
образом, чтобы лицо человека смотрело прямо впе- каторы, которые можно использовать для распознава-
ред. Затем полученные данные переводятся в число- ния лиц, глаз, автомобилей, и многих других объек-
вое значение и обрабатываются для последующего тов. Эти классификаторы, однако, достаточно просты,
сравнения. На данный момент, DeepFace проходит они не обучены с использованием технологий
этапы тестирования, для которого FaceBook уже машинного обучения, поэтому, при распознавании
идентифицировали порядка 4 млн фотографий своих лиц точность составит примерно в 80 % [1].
пользователей [2]. Технологии распознавания объектов достигли
Компанией Google была разработана открытая высоких результатов, однако недостаточных для реа-
программная библиотека для машинного обучения лизации крупных задач, таких как исследования кос-
под названием «TensorFlow». Она позволяет решать моса и планет, где невозможно присутствие человека.
задачи построения и тренировки нейронной сети В связи с этим требуется постоянное совершенство-
с целью автоматического нахождения и классифика- вание алгоритмов распознавания объектов и обучения
ции образов, достигая качества человеческого вос- нейронных сетей.
приятия. В то время как эталонная реализация работа-
ет на единичных устройствах, TensorFlow может ра- Библиографические ссылки
ботать на многих параллельных процессорах, как
1. Веб-камера, Node.js и OpenCV: делаем систему
CPU, так и GPU, опираясь на архитектуру CUDA для
распознавания лиц [Электронный ресурс]. URL:
поддержки вычислений общего назначения на графи-
https:// habrahabr.ru/company/ruvds/blog/335770/ (дата
ческих процессорах). Уникальность библиотеки со-
обращения: 14.09.2017).
стоит в следующих характеристиках:
2. Программа Deepface – определяет лица почти
– основная библиотека подходит для широкого
как живой человек [Электронный ресурс]. URL: http://
семейства техник машинного обучения, а не только
www.sciencedebate2008.com/deepface-defines-a-person-
для глубинного обучения;
as-a-living-person/ (дата обращения: 14.09.2017).
– линейная алгебра и другие внутренности хорошо
3. Распознаем лица на фото с помощью Python
видны снаружи;
и OpenCV [Электронный ресурс]. URL: https://habra-
– в дополнение к основной функциональности
habr. ru/post/301096/ (дата обращения: 14.09.2017).
машинного обучения, TensorFlow также включает
4. Распознавание образов [Электронный ресурс].
собственную систему логирования, собственный
URL: http://ai-news.ru/raspoznavanie obrazov.html (дата
интерактивный визуализатор логов и даже мощную
обращения: 14.09.2017).
архитектуру по доставке данных;
5. TensorFlow [Электронный ресурс]. URL: https://
– модель исполнения TensorFlow отличается от
www.tensorflow.org/ (дата обращения: 14.09.2017).
scikit-learn языка Python и от большинства инструмен-
тов в R.
References
Вычисления TensorFlow выражаются как графы
потоков данных с сохранением состояния (stateful). 1. Webcam, Node.js and OpenCV: we make a face
Библиотека алгоритмов от Google инструктирует ней- recognition system. Available at: https://habrahabr.ru/
ронные сети воспринимать информацию и рассуждать company/ruvds/blog/335770/ (accessed: 14.09.2017).
подобно человеку, так что новые приложения изна- 2. The Deepface program – defines persons almost
чально обладают такими «человеческими» качества- like a living person. Available at: http://www.sciencede-
ми. Само название TensorFlow происходит от назва- bate2008.com/deepface-defines-a-person-as-a-living-
ния операций, которые эти нейросети осуществляют person/ (accessed: 14.09.2017).
над многомерными массивами данных. Эти много- 3. Recognize the faces in the photo using Python and
мерные массивы именуются «тензорами», как одно- OpenCV. Available at: https://habrahabr.ru/post/301096/
имённые математические объекты, линейно преобра- (accessed: 14.09.2017).
зующие элементы одного линейного пространства 4. Pattern Recognition. Available at: http://ai-news.ru/
в элементы другого. Задача TensorFlow – учить raspoznavanie obrazov.html (accessed: 14.09.2017).
нейросети обнаруживать и распознавать паттерны 5. TensorFlow. Available at: https://www.tensorflow.
и корреляции в массивах данных [5]. org/ (accessed: 14.09.2017).
OpenCV – библиотека алгоритмов компьютерного
зрения, обработки изображений и численных алго- © Елистратов С. А., Козлова Ю. Б., 2017
327

Intellektualnye Sistemy Raspoznavaniya Obrazov Sovremennoe Sostoyanie I Problemy Realizatsii

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Intellektualnye Sistemy Raspoznavaniya Obrazov Sovremennoe Sostoyanie I Problemy Realizatsii

Загружено:

Авторское право:

Доступные форматы

Решетневские чтения.

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева

В современном мире интеллектуальные системы являются наиболее перспективным направлением в об-

Ключевые слова: нейронная сеть, алгоритм, библиотека, интеллектуальные системы, распознавание

INTELLECTUAL SYSTEMS OF PERSON RECOGNITION:

Reshetnev Siberian State University of Science and Technology

Keywords: neural network, algorithm, library, intelligent systems, pattern recognition.

Вам также может понравиться