Академический Документы
Профессиональный Документы
Культура Документы
РЕФЕРАТ
на тему: «Новое задание по библиотечно-информационной
деятельности»
Проверил:
Выполнил:
2022
2
Оглавление
Введение ................................................................................................................... 3
1.Описание программного продукта Python ........................................................ 4
2. Исследование существующих библиотек машинного обучения ................... 5
3. Библиотека NumPy. Ее назначение, состав, особенности использования .... 9
Заключение ............................................................................................................ 12
Список использованных источников .................................................................. 13
3
Введение
Рост объемов информации, которая скапливается в современном мире,
требования к ее обработки и хранению делают актуальным исследования в
области методов и алгоритмов анализа больших наборов данных. Пока
пределом возможностей современных программных инструментов,
ориентированных на обработку больших объемов данных, являются
петабайтные наборы и гигабайтные потоки данных. Но в соответствии с
тенденции развития науки и общества ожидаются еще большие масштабы и
объемы данных. Дальнейший рост количества информации и усложнение ее
структуры делает все более актуальными проблемы машинного обучения и
интеллектуального анализа данных (Data Mining), которые позволяют
извлекать из Big Data полезные и практически применимы факты и знания
[1].
Для практического решения этой актуальной задачи, в последние годы
возникла целая экосистема библиотек, в которых достаточно грамотно
реализованы наиболее известные базовые алгоритмы машинного обучения.
Сейчас не обязательно реализовывать каждый из алгоритмов с нуля.
Современные библиотеки машинного обучения типа NumPy, по сути
представляют из себя типовые алгоритмы решения задач машинного
обучение. Хотя машинное обучение – это прикладная наука, с теоретической
точки зрения инструментами в машинном обучении являются алгоритмы.
Алгоритмы должны быть реализованы на определенном языке
программирования, в определенной среде, рассчитанной на определенный
вид «железа» и т.п.
Максимально используемым на сегодня для решение прикладных задач
является язык программирования Python. Именно на базе этого языка
реализовано большее количество библиотек, которые предоставляют в
удобном виде большинство доступных алгоритмов.
4
Заключение
Анализ основных задач машинного обучения, связанных с обработкой
Big Data, с целью получения из них полезных для практического применения
сведений, показывает целесообразность применения для этого средств
статистической обработки и работы с нейросетями. Одновременно наличие
большого разнообразия алгоритмов машинного обучения, ориентированных
на разные типы входной информации и знаний, что за ними стоят,
свидетельствует о потребностях в специализируемых библиотеках,
реализующих эти алгоритмы. Количество которых растет ежедневно и
привело к возношению определенного набора стабильно устанавливаемых
библиотек, которые постоянно занимаются машинным обучением или
обработкой обширных данных.
В настоящее время существует много онлайн сервисов по машинному
обучению, а также библиотек и фреймворков, которые возможно
использовать в своих разработках. Большие преимущества языкам
программирования предоставляет возможности использовать внешние
облачные сервисы для хранения и обработки объёмов данных. Еще одним
важным фактором для выбора инструментальной среды, в которому
решаются задачи машинного обучения, есть скорость обработки, что связано
с большими объёмами данных, которые должны обрабатываться.
Для решения всех этих проблем созданы целые пакеты библиотек,
которые можно установить за один раз, что позволяет превратить компьютер
в готовую станцию, где можно начинать реализовывать какие-либо
алгоритмы по машинному обучению, датамайнингу, анализу больших
данных. Один из таких пакетов – Anaconda Python – это полностью
настроенное среда программирования, в которая за счет десятка и сотен
библиотек (Pandas, Matplotlib, Tableau, NumPy, Scikit-Learn и др.), версии
которых не конфликтуют, делает Python надежным вариантом для создания
экспериментальных прототипов, объединяющих современные подходы к
машинному обучению элементами искусственного интеллекта.
13