Академический Документы
Профессиональный Документы
Культура Документы
Тараненко Р.А.
ruslantaranenko@ukr.net
Современные представления о
«БОЛЬШИХ ДАННЫХ» (Big Data)
Сегодня не существует единой четкой формулировки понятия «Большие данные», поэтому будем
придерживаться четвертой формулировки (мнения Новосибирских специалистов)
1. Википедия RUS: серия подходов, инструментов и методов обработки структурированных и
неструктурированных данных огромных объёмов и значительного многообразия для
получения воспринимаемых человеком результатов, эффективных в условиях
непрерывного прироста, распределения по многочисленным узлам вычислительной сети,
сформировавшихся в конце 2000-х годов, альтернативных традиционным системам
управления базами данных и решениям класса Business Intelligence
2. Wikipedia ENG: Big Data is the term for a collection of data sets so large and complex that it
becomes difficult to process using on-hand database management tools or traditional data
processing applications
3. Майкл Франклин: Большие данные – это такие данные, которыми дорого управлять или из
которых сложно извлечь ценность.
4. мнение Новосибирских специалистов: Мы видим, что приведённые определения
существенно разнятся. И это нормально для молодого направления деятельности. Мы
будем считать «большими данными» только первую часть определения русской википедии,
т.е. подходы, инструменты и методы обработки данных больших
объёмов и многообразия для получения результатов, в условиях
непрерывного прироста информации и её значительной
распределённости. Также будем понимать и сами данные,
обрабатываемые этими методами.
Что самое главное в
«Больших данных» (Big Data)
Множество различных высказываний представлений о «Big Data» говорят о слабости наших
знаний. Главная причина в том, что сегодня возможности и условия познания мира благодаря
историческому развитию всех сфер жизнедеятельности человека достигли такого уровня
сложности, что ни классики основатели фундаментальных наук ни представители современного
общества не могут себе представить во всей полноте.
В действительности любую область знаний и жизнедеятельности можно рассматривать с
точки зрения «Big Data». Однако сколько ни рассматривай традиционные характеристики данных,
например увеличение объёма данных, они не раскрывают главную характеристическую
особенность «Big Data».
Поэтому, в действительности понимание «Big Data» не обходимо рассматривать и трактовать
гораздо шире традиционных фундаментальны представлений и представлений современных
информационных технологий и систем.
• Одним из главных факторов, который тормозит внедрение Big Data - проектов, помимо
высокой стоимости, считается проблема выбора обрабатываемых данных : то есть
определение того, какие данные необходимо извлекать, хранить и анализировать, а какие –
не принимать во внимание.
Работа с Big Data: основные области и возможности (http://www.marketing.spb.ru/lib-
research/methods/Big_Data.htm)
Что самое главное в
«Больших данных» (Big Data)
Проявление главного свойства «Big Data» :
ВСЕОХВАТЫВАЮЩИЕ ПРЕДСТАВЛЕНИЯ –
формирование нового качества информационного
пространства.
Например:
• Бизнес-аналитика должна стать «всеохватывающей»
http://ko.com.ua/biznes-analitika_dolzhna_stat_vseohvatyvayushhej_38912
• Не так давно (до 2003 года) ЦРУ опубликовало "План стратегических
инвестиций анализа разведсообщества" (Strategic Investment Plan for
Intelligence Community Analysis). В плане разведчики признают, что не
использовали полностью возможности открытых источников, и теперь работа
с ними должна стать "высшим приоритетом для инвестиций". Теперь в ЦРУ
резонно полагают, что брать информацию из открытых источников
безопаснее и дешевле, чем пользоваться разведданными ...
(Дмитрий Ланде Добыча знаний /CHIP Ukraine 10 2003 (стр. 76 – 82) (электронный вариант
статьи: http://visti.net/~dwl/art/dz/)
3 V или 4V или 5V или …
Итого: «Big Data» представляют новый класс сложности решаемых задач,
возможности которого намного шире методов классических
фундаментальных наук и технических возможностей современных
информационных технологий и систем.
Проще говоря «Big Data» открывают новый уровень сложности
представления любых знаний.
Спасибо за внимание
Если вас, заинтересовала «не объятая»
перспектива Big Date и вы готовы ее уточнить,
или развивать подобные продукты, или
сотрудничать по другим вопросам
обращайтесь:
Тараненко Руслан Анатольевич
e-mail: ruslantaranenko@ukr.net
(067)402-38-54