Вы находитесь на странице: 1из 67

Introduction to Datafication: Implement

Datafication Using AI and ML


Algorithms Shivakumar R. Goniwada
Visit to download the full and correct content document:
https://ebookmass.com/product/introduction-to-datafication-implement-datafication-usi
ng-ai-and-ml-algorithms-shivakumar-r-goniwada/
Introduction
to Dataf ication
Implement Dataf ication Using AI
and ML Algorithms

Shivakumar R. Goniwada
Introduction to
Datafication
Implement Datafication Using
AI and ML Algorithms

Shivakumar R. Goniwada
Introduction to Datafication: Implement Datafication Using AI and
ML Algorithms
Shivakumar R. Goniwada
Gubbalala, Bangalore, Karnataka, India

ISBN-13 (pbk): 978-1-4842-9495-6 ISBN-13 (electronic): 978-1-4842-9496-3


https://doi.org/10.1007/978-1-4842-9496-3
Copyright © 2023 by Shivakumar R. Goniwada

This work is subject to copyright. All rights are reserved by the publisher, whether the whole or
part of the material is concerned, specifically the rights of translation, reprinting, reuse of
illustrations, recitation, broadcasting, reproduction on microfilms or in any other physical way,
and transmission or information storage and retrieval, electronic adaptation, computer software,
or by similar or dissimilar methodology now known or hereafter developed.
Trademarked names, logos, and images may appear in this book. Rather than use a trademark
symbol with every occurrence of a trademarked name, logo, or image we use the names, logos,
and images only in an editorial fashion and to the benefit of the trademark owner, with no
intention of infringement of the trademark.
The use in this publication of trade names, trademarks, service marks, and similar terms, even if
they are not identified as such, is not to be taken as an expression of opinion as to whether or not
they are subject to proprietary rights.
While the advice and information in this book are believed to be true and accurate at the date of
publication, neither the authors nor the editors nor the publisher can accept any legal
responsibility for any errors or omissions that may be made. The publisher makes no warranty,
express or implied, with respect to the material contained herein.
Managing Director, Apress Media LLC: Welmoed Spahr
Acquisitions Editor: Celestin Suresh John
Development Editor: Laura Berendson
Coordinating Editor: Mark Powers
Copy Editor: April Rondeau
Cover designed by eStudioCalamar
Cover image by Pawel Czerwinsk on Unsplash (www.unsplash.com)
Distributed to the book trade worldwide by Apress Media, LLC, 1 New York Plaza, New York, NY
10004, U.S.A. Phone 1-800-SPRINGER, fax (201) 348-4505, email orders-ny@springer-sbm.com,
or visit www.springeronline.com. Apress Media, LLC is a California LLC and the sole member
(owner) is Springer Science+Business Media Finance Inc. (SSBM Finance Inc.). SSBM Finance
Inc. is a Delaware corporation.
For information on translations, please e-mail booktranslations@springernature.com;
for reprint, paperback, or audio rights, please e-mail bookpermissions@springernature.com.
Apress titles may be purchased in bulk for academic, corporate, or promotional use. eBook
versions and licenses are also available for most titles. For more information, reference our Print
and eBook Bulk Sales web page at http://www.apress.com/bulk-sales.
Any source code or other supplementary material referenced by the author in this book is
available to readers on GitHub (https://github.com/Apress). For more detailed information,
please visit http://www.apress.com/source-code.
Printed on acid-free paper
This book is dedicated to those who may need access to the
resources and opportunities many take for granted. May
this book serve as a reminder that knowledge and learning
are powerful tools that can transform lives and create new
opportunities for those who seek them.
Table of Contents
About the Author�������������������������������������������������������������������������������xiii

About the Technical Reviewer������������������������������������������������������������xv

Acknowledgments����������������������������������������������������������������������������xvii

Introduction���������������������������������������������������������������������������������������xix

Chapter 1: Introduction to Datafication������������������������������������������������1


What Is Datafication?��������������������������������������������������������������������������������������������2
Why Is Datafication Important?�����������������������������������������������������������������������3
Data for Datafication���������������������������������������������������������������������������������������������4
Datafication Steps�������������������������������������������������������������������������������������������5
Digitization vs. Datafication����������������������������������������������������������������������������������6
Types of Data in Datafication��������������������������������������������������������������������������������7
Elements of Datafication���������������������������������������������������������������������������������8
Data Harvesting�����������������������������������������������������������������������������������������������9
Data Curation�������������������������������������������������������������������������������������������������10
Data Storage��������������������������������������������������������������������������������������������������11
Data Analysis�������������������������������������������������������������������������������������������������12
Cloud Computing�������������������������������������������������������������������������������������������13
Datafication Across Industries����������������������������������������������������������������������������13
Summary������������������������������������������������������������������������������������������������������������14

v
Table of Contents

Chapter 2: Datafication Principles and Patterns��������������������������������15


What Are Architecture Principles?����������������������������������������������������������������������16
Datafication Principles����������������������������������������������������������������������������������������16
Data Integration Principle������������������������������������������������������������������������������17
Data Quality Principle������������������������������������������������������������������������������������20
Data Governance Principles��������������������������������������������������������������������������22
Data Is an Asset���������������������������������������������������������������������������������������������23
Data Is Shared�����������������������������������������������������������������������������������������������24
Data Trustee��������������������������������������������������������������������������������������������������24
Ethical Principle���������������������������������������������������������������������������������������������25
Security by Design Principle��������������������������������������������������������������������������27
Datafication Patterns������������������������������������������������������������������������������������������29
Data Partitioning Pattern�������������������������������������������������������������������������������30
Data Replication��������������������������������������������������������������������������������������������32
Stream Processing����������������������������������������������������������������������������������������33
Change Data Capture (CDC)���������������������������������������������������������������������������35
Data Mesh�����������������������������������������������������������������������������������������������������37
Machine Learning Patterns���������������������������������������������������������������������������38
Summary������������������������������������������������������������������������������������������������������������66

Chapter 3: Datafication Analytics�������������������������������������������������������67


Introduction to Data Analytics�����������������������������������������������������������������������������68
What Is Analytics?�����������������������������������������������������������������������������������������68
Big Data and Data Science����������������������������������������������������������������������������68
Datafication Analytical Models����������������������������������������������������������������������������72
Content-Based Analytics�������������������������������������������������������������������������������72
Data Mining���������������������������������������������������������������������������������������������������72
Text Analytics�������������������������������������������������������������������������������������������������73

vi
Table of Contents

Sentiment Analytics���������������������������������������������������������������������������������������73
Audio Analytics����������������������������������������������������������������������������������������������75
Video Analytics����������������������������������������������������������������������������������������������76
Comparison in Analytics��������������������������������������������������������������������������������76
Datafication Metrics��������������������������������������������������������������������������������������������77
Datafication Analysis�������������������������������������������������������������������������������������������79
Data Sources�������������������������������������������������������������������������������������������������80
Data Gathering�����������������������������������������������������������������������������������������������83
Introduction to Algorithms����������������������������������������������������������������������������������83
Supervised Machine Learning�����������������������������������������������������������������������84
Linear Regression������������������������������������������������������������������������������������������86
Support Vector Machines (SVM)��������������������������������������������������������������������88
Decision Trees�����������������������������������������������������������������������������������������������89
Neural Networks��������������������������������������������������������������������������������������������91
Naïve Bayes Algorithm����������������������������������������������������������������������������������93
K-Nearest Neighbor (KNN) Algorithm������������������������������������������������������������94
Random Forest����������������������������������������������������������������������������������������������95
Unsupervised Machine Learning�������������������������������������������������������������������������96
Clustering������������������������������������������������������������������������������������������������������97
Association Rule Learning�����������������������������������������������������������������������������98
Dimensionality Reduction������������������������������������������������������������������������������98
Reinforcement Machine Learning�����������������������������������������������������������������������99
Summary����������������������������������������������������������������������������������������������������������100

Chapter 4: Datafication Data-Sharing Pipeline���������������������������������101


Introduction to Data-Sharing Pipelines�������������������������������������������������������������102
Steps in Data Sharing����������������������������������������������������������������������������������103
Data-Sharing Process����������������������������������������������������������������������������������104

vii
Table of Contents

Data-Sharing Decisions�������������������������������������������������������������������������������106
Data-Sharing Styles������������������������������������������������������������������������������������������108
Unidirectional, Asynchronous Push Integration Style����������������������������������108
Real-Time and Event-based Integration Style���������������������������������������������109
Bidirectional, Synchronous, API-led Integration Style���������������������������������110
Mediated Data Exchange with an Event-­Driven Approach��������������������������111
Designing a Data-Sharing Pipeline�������������������������������������������������������������������112
Types of Data Pipeline���������������������������������������������������������������������������������������118
Batch Processing�����������������������������������������������������������������������������������������118
Extract, Transform, and Load Data Pipeline (ETL)����������������������������������������119
Extract, Load, and Transform Data Pipeline (ELT)����������������������������������������120
Streaming and Event Processing�����������������������������������������������������������������121
Change Data Capture (CDC)�������������������������������������������������������������������������123
Lambda Data Pipeline Architecture�������������������������������������������������������������124
Kappa Data Pipeline Architecture����������������������������������������������������������������126
Data as a Service (DaaS)����������������������������������������������������������������������������������127
Data Lineage�����������������������������������������������������������������������������������������������������129
Data Quality�������������������������������������������������������������������������������������������������������130
Data Integration Governance����������������������������������������������������������������������������132
Summary����������������������������������������������������������������������������������������������������������133

Chapter 5: Data Analysis������������������������������������������������������������������135


Introduction to Data Analysis����������������������������������������������������������������������������136
Data Analysis Steps������������������������������������������������������������������������������������������137
Prepare a Question��������������������������������������������������������������������������������������138
Prepare Cleansed Data��������������������������������������������������������������������������������143
Identify a Relevant Algorithm����������������������������������������������������������������������144
Build a Statistical Model������������������������������������������������������������������������������146

viii
Table of Contents

Match Result�����������������������������������������������������������������������������������������������159
Create an Analysis Report���������������������������������������������������������������������������161
Summary����������������������������������������������������������������������������������������������������������163

Chapter 6: Sentiment Analysis���������������������������������������������������������165


Introduction to Sentiment Analysis�������������������������������������������������������������������166
Use of Sentiment Analysis���������������������������������������������������������������������������167
Types of Sentiment Analysis�����������������������������������������������������������������������������168
Document-Level Sentiment Analysis�����������������������������������������������������������168
Aspect-Based Sentiment Analysis���������������������������������������������������������������170
Multilingual Sentiment Analysis������������������������������������������������������������������171
Pros and Cons of Sentiment Analysis���������������������������������������������������������������173
Pre-Processing of Data�������������������������������������������������������������������������������������174
Tokenization������������������������������������������������������������������������������������������������174
Stop Words Removal������������������������������������������������������������������������������������175
Stemming and Lemmatization���������������������������������������������������������������������175
Handling Negation and Sarcasm�����������������������������������������������������������������176
Rule-Based Sentiment Analysis������������������������������������������������������������������������177
Lexicon-Based Approaches�������������������������������������������������������������������������178
Sentiment Dictionaries��������������������������������������������������������������������������������179
Pros and Cons of Rule-Based Approaches��������������������������������������������������179
Machine Learning–Based Sentiment Analysis��������������������������������������������������180
Supervised Learning Techniques�����������������������������������������������������������������180
Unsupervised Learning Techniques�������������������������������������������������������������182
Pros and Cons of the Machine Learning–Based Approach��������������������������182
Best Practices for Sentiment Analysis��������������������������������������������������������������183
Summary����������������������������������������������������������������������������������������������������������183

ix
Table of Contents

Chapter 7: Behavioral Analysis��������������������������������������������������������185


Introduction to Behavioral Analytics�����������������������������������������������������������������185
Data Collection��������������������������������������������������������������������������������������������������188
Behavioral Science�������������������������������������������������������������������������������������������189
Importance of Behavioral Science��������������������������������������������������������������������191
How Behavioral Analysis and Analytics Are Processed�������������������������������������191
Cognitive Theory and Analytics��������������������������������������������������������������������192
Biological Theories and Analytics����������������������������������������������������������������193
Integrative Model�����������������������������������������������������������������������������������������194
Behavioral Analysis Methods����������������������������������������������������������������������������194
Funnel Analysis�������������������������������������������������������������������������������������������195
Cohort Analysis��������������������������������������������������������������������������������������������195
Customer Lifetime Value (CLV)���������������������������������������������������������������������196
Churn Analysis���������������������������������������������������������������������������������������������196
Behavioral Segmentation����������������������������������������������������������������������������������197
Analyzing Behavioral Analysis���������������������������������������������������������������������������197
Descriptive Analysis with Regression����������������������������������������������������������197
Causal Analysis with Regression�����������������������������������������������������������������203
Causal Analysis with Experimental Design��������������������������������������������������210
Challenges and Limitations of Behavioral Analysis�������������������������������������������212
Summary����������������������������������������������������������������������������������������������������������213

Chapter 8: Datafication Engineering�������������������������������������������������215


Steps of AI and ML Engineering������������������������������������������������������������������������215
AI and ML Development������������������������������������������������������������������������������������217
Understanding the Problem to Be Solved����������������������������������������������������217
Choosing the Appropriate Model�����������������������������������������������������������������218
Preparing and Cleaning Data�����������������������������������������������������������������������220

x
Table of Contents

Feature Selection and Engineering�������������������������������������������������������������221


Model Training and Optimization�����������������������������������������������������������������222
AI and ML Testing����������������������������������������������������������������������������������������������223
Unit Testing��������������������������������������������������������������������������������������������������223
Integration Testing���������������������������������������������������������������������������������������225
Non-Functional Testing��������������������������������������������������������������������������������225
Performance������������������������������������������������������������������������������������������������227
Security Testing�������������������������������������������������������������������������������������������228
DataOps������������������������������������������������������������������������������������������������������������230
MLOps���������������������������������������������������������������������������������������������������������������233
Summary����������������������������������������������������������������������������������������������������������235

Chapter 9: Datafication Governance�������������������������������������������������237


Importance of Datafication Governance������������������������������������������������������������238
Why Is Datafication Governance Required?������������������������������������������������������239
Datafication Governance Framework����������������������������������������������������������������239
Oversight and Accountability�����������������������������������������������������������������������240
Model Risk, Risk Assessment, and Regulatory Guidance����������������������������241
Roles and Responsibilities���������������������������������������������������������������������������244
Monitoring and Reporting����������������������������������������������������������������������������245
Datafication Governance Guidelines and Principles������������������������������������245
Ethical and Legal Aspects����������������������������������������������������������������������������247
Datafication Governance Action Framework�����������������������������������������������������247
Datafication Governance Challenges����������������������������������������������������������������248
Summary����������������������������������������������������������������������������������������������������������250

xi
Table of Contents

Chapter 10: Datafication Security����������������������������������������������������251


Introduction to Datafication Security����������������������������������������������������������������251
Datafication Security Framework���������������������������������������������������������������������253
Regulations��������������������������������������������������������������������������������������������������253
Organization Concerns��������������������������������������������������������������������������������256
Governance and Compliance�����������������������������������������������������������������������257
Business Access Needs�������������������������������������������������������������������������������259
Datafication Security Measures������������������������������������������������������������������������260
Encryption���������������������������������������������������������������������������������������������������260
Data Masking����������������������������������������������������������������������������������������������261
Penetration Testing��������������������������������������������������������������������������������������261
Data Security Restrictions���������������������������������������������������������������������������261
Summary����������������������������������������������������������������������������������������������������������262

Index�������������������������������������������������������������������������������������������������263

xii
About the Author
Shivakumar R. Goniwada is an author,
inventor, chief enterprise architect, and
technology leader with over 23 years of
experience architecting cloud-native, data
analytics, and event-driven systems. He works
in Accenture and leads a highly experienced
technology enterprise and cloud architect
team. Over the years, he has led many
complex projects across industries and the
globe. He has ten software patents in cloud
computing, polyglot architecture, software
engineering, data analytics, and IoT. He authored a book on Cloud Native
Architecture and Design. He is a speaker at multiple global and in-house
conferences. Shivakumar has earned Master Technology Architecture,
Google Professional, AWS, and data science certifications. He completed
his executive MBA at the MIT Sloan School of Management.

xiii
About the Technical Reviewer
Dr. Mohan H M is a technical program
manager and research engineer (HMI, AI/
ML) at Digital Shark Technology, supporting
the research and development of new
products, promotion of existing products, and
investigation of new applications for existing
products.
In the past, he has worked as a technical education evangelist and
has traveled extensively all over India delivering training on artificial
intelligence, embedded systems, and Internet of Things (IoT) to research
scholars and faculties in engineering colleges under the MeitY scheme. In
the past, he has worked as an assistant professor at the T. John Institute of
Technology. Mohan holds a master’s degree in embedded systems and the
VLSI design field from Visvesvaraya Technological University. He earned
his Ph.D. on the topic of non-invasive myocardial infarction prediction
using computational intelligence techniques from the same university.
He has been a peer reviewer for technical publications, including BMC
Informatics, Springer Nature, Scientific Reports, and more. His research
interests include computer vision, IoT, and biomedical signal processing.

xv
Acknowledgments
Many thanks to my mother, S. Jayamma, and late father, G.M. Rudrapp,
who taught me the value of hard work, and to my wife, Nirmala, and
daughter, Neeharika, without whom I wouldn’t have been able to work
long hours into the night every day of the week. Last but not least, I’d like
to thank my friends, colleagues, and mentors at Mphasis, Accenture, and
other corporations who have guided me throughout my career.
Thank you also to my colleagues Mark Powers, Celestin Suresh John,
Shobana Srinivasan, and other Apress team members for allowing me to
work with you and Apress, and to all who have helped this book become
a reality. Thank you for my mentors Bert Hooyman and Abubacker
Mohamed and thanks for my colleague Raghu Pasupuleti for providing
key inputs.

xvii
Introduction
The motivation to write this book goes back to the words of Swami
Vivekananda: “Everything is easy when you are busy, but nothing is easy
when you are lazy,” and “Take up on one idea, make that one idea your life,
dream of it, think of it, live on that idea.”
Data is increasingly shaping the world in which we live. The
proliferation of digital devices, social media platforms, and the Internet
of Things (IoT) has led to an explosion in the amount of data generated
daily. This has created new opportunities and challenges for everyone
as we seek to harness the power of data to drive innovation and improve
decision making.
This book is a comprehensive guide to the world of datafication and its
development, governing process, and security. We explore fundamental
principles and patterns, analysis frameworks, techniques to implement
artificial intelligence (AI) and machine learning (ML) algorithms, models,
and regulations to govern datafication systems.
We will start by exploring the basics of datafication and how it
transforms the world, and then delve into the fundamental principles and
patterns and how data are ingested and processed with an extensive data
analysis framework. We will examine the ethics, regulations, and security
of datafication in a real scenario.
Throughout the book, we will use real-world examples and case
studies to illustrate key concepts and techniques and provide practical
guidance in sentiment and behavior analysis.
Whether you are a student, analyst, engineer, technologist, or someone
simply interested in the world of datafication, this book will provide you
with a comprehensive understanding of datafication.

xix
CHAPTER 1

Introduction to
Datafication
A comprehensive look at datafication must first begin with its definition.
This chapter provides that and details why datafication plays a significant
role in modern business and data architecture.
Datafication has profoundly impacted many aspects of society,
including business, finance, health care, politics, and education. It
has enabled companies to gain insights into consumer behavior and
preferences, health care to improve patient outcomes, finance to enhance
consumer experience and risk and compliance, and educators to
personalize learning experiences.
Datafication helps you to take facts and statistics gained from myriad
sources and give them domain-specific context, aggregating and making
them accessible for use in strategy building and decision making.
This improves sales and profiles, health results, and influence over
public policy.
Datafication is the process of turning data into a usable and accessible
format and involves the following:

• Collecting data from myriad sources

• Organizing and cleaning the data

© Shivakumar R. Goniwada 2023 1


S. R. Goniwada, Introduction to Datafication,
https://doi.org/10.1007/978-1-4842-9496-3_1
Chapter 1 Introduction to Datafication

• Making it available for analysis to use

• Analyzing the data by using artificial intelligence (AL)


and machine learning (ML) models

Developing a deeper understanding of the datafication process and


its implications for individuals and society is essential. This requires a
multidisciplinary approach that brings together stakeholders from various
fields to explore the challenges and opportunities of datafication and to
develop ethical and effective strategies for managing and utilizing data in
the digital age.
This chapter will drill down into the particulars and explain how
datafication benefits the across industry. We will cover the following topics:

• What is datafication?

• How is datafication embraced across industries?

• Why is datafication important?

• What are elements of datafication?

What Is Datafication?
Datafication involves using digital technologies such as the cloud, data
products, and AI/ML algorithms to collect and process vast amounts of
data on human behavior, preferences, and activities.
Datafication converts various forms of information, such as texts,
images, audio recordings, comments, claps, and likes/dislikes to curated
format, and that data can be easily analyzed and processed by multiple
algorithms. This involves extracting relevant data from social media,
hospitals, and Internet of Things (IoT). These data are organized into
a consistent format and stored in a way that makes them accessible for
further analysis.

2
Chapter 1 Introduction to Datafication

Everything around us, from finance, medical, construction, and social


media to industrial equipment, is converted into data. For example,
you create data every time you post to social media platforms such
as WhatsApp, Instagram, Twitter, or Facebook, and any time you join
meetings in Zoom or Google Meet, or even when you walk past a CCTV
camera while crossing the street. The notion differs from digitization, as
datafication is much broader than digitization.
Datafication can help you to understand the world more fully than
ever before. New cloud technologies are available to ingest, store, process,
and analyze data. For example, marketing companies use Facebook and
Twitter data to determine and predict sales. Digital Twin uses industrial
equipment behavior to analyze the behavior of the machine.
Datafication also raises important questions about privacy, security,
and ethics. The collection and use of personal data can infringe on
individual rights and privacy, and there is a need for greater transparency
and accountability in how data are collected and used. Overall,
datafication represents a significant shift in how we live, work, and act.

Why Is Datafication Important?


Datafication enables organizations to transform raw data into a format
that can be analyzed and used to gain insights, make informed business
decisions, improve patients’ health, and streamline supply-chain
management. This is crucial for every industry to improve in today’s
data-driven world. By using the processed data, organizations can identify
trends, gain insight into customer behavior, and discover other key
performance indicators using analytics tools and algorithms.

3
Chapter 1 Introduction to Datafication

Data for Datafication


Data is available everywhere, but what type of data you require for analysis
in datafication is crucial and helps you to understand hidden values
and challenges. Data can come from a wide range of sources, but the
specific data set will depend on the particular context and the goal of the
datafication process.
Today, data are created not only by people and their activities in the
world, but also by machines. The amount of data produced is almost out of
control.
For example:

• Social media data such as posts and comments


are structured data that can be easily analyzed for
sentiment and behavior. This involves extracting text
from the posts and comments and identifying and
categorizing any images, comments, or other media
that are part of it.

• In the medical context, datafication might involve


converting medical records and other patient
information into structured data that can be used
for analysis and research. This involves extracting
information about diagnoses, treatments, and other
medical reports.

• In the e-commerce context, datafication might


involve converting users’ statistics and other purchase
information into structured data that can be used for
analysis and recommendations.
In summary, data can come from a wide range of sources, and how it
is used will depend on the specific context and goals of the datafication
process.

4
Chapter 1 Introduction to Datafication

Data constantly poses new challenges in terms of storage and


accessibility. The need to use all of this data is pushing us into a higher
level of technological advancement, whether we like or want it or not.
Datafication requires new forms of integration to uncover large hidden
values from extensive collections that are diverse, complex, and of a
massive scale. According to Kepios (https://kepios.com/), there will be
4.80 billion social media users worldwide as of April 2023, 59.0 percent of
the world population, and approximately 227 million users join every year.
The following are a few statistics regarding major social media
applications as of the writing of this book:

• Facebook has 3.46 billion monthly visitors.

• YouTube’s potential advertising reach is 7.55 billion


people (monthly average).

• WhatsApp has at least 3 billion monthly users.

• Instagram’s potential advertising reach is


approximately 2.13 billion people.

• Twitter’s possible advertising reach is approximately


2.30 billion people.

Datafication Steps
For datafication, as defined by DAMA (Data Management Association),
you must have a clear set of data, well-defined analysis models, and
computing power. To obtain a precise collection of data, relevant models,
and required computing power, one must follow these steps:

• Data Harvesting: This step involves obtaining data in


a real-time and reliable way from various sources, such
as databases, sensors, files, etc.

5
Chapter 1 Introduction to Datafication

• Data Curation: This step involves organizing and


cleaning the data to prepare it for analysis. You need
to ensure that the data collected are accurate by
removing errors, inconsistencies, and duplicates with a
standardized format.

• Data Transformation: This step involves converting


data into a suitable format for analysis. This step helps
you transform the data into a specific form, such as
dimensional and graph models.

• Data Storage: This step involves storing the data after


transformation in storage, such as a data lake or data
warehouse, for further analysis.

• Data Analysis: This step involves using statistical and


analytical techniques to gain insights from data and
identify trends, patterns, and correlations in the data
that help with predictions and recommendations.

• Data Dissemination: This step involves sharing the


dashboards, reports, and presentations with relevant
stakeholders.
• Cloud Computing: This step provides the necessary
infrastructure and tools for the preceding steps.

Digitization vs. Datafication


For a better understanding of datafication, it can be helpful to contrast it
with digitization. This may help you to better visualize the datafication
process.

6
Chapter 1 Introduction to Datafication

Digitization is a process that has taken place for decades. It entails


the conversion of information into a digital format; for example, music
to MP3/MP4, images to JPG/PNG, manual banking process to mobile
and automated web process, manual approval process to automatic BPM
workflow process, and so on.
Datafication, on the other hand, involves converting data into a usable,
accessible format. This consists of collecting data from various sources and
formats, organizing and cleansing it, and making it available for analysis.
The primary goal of datafication is to help the organization make data-­
driven decisions, allowing it to gain insights and knowledge from the data.
Datafication helps monitor what each person does. It does so with
advanced technologies that can monitor and measure things individually.
In digitization, you convert many forms into digital forms, which are
accessible to an individual computer. Similar to datafication, you ingest
the activities and behavior and convert them into a virtual structure that
can be used within formal systems.
However, many organizations realize that more than simply processing
data is needed to support business disruption. It requires quality data
and the application of suitable algorithms. Modern architecture and
methodologies must be adopted to address these challenges to create
datafication opportunities.

Types of Data in Datafication


The first type of data is content, which can be user likes, comments on
blogs and web forums, visible hyperlinks in the content, user profiles on
social networking sites, news articles on news sites, and machine data. The
data format can be structured or unstructured.
The second type of data is the behavior of objects and the runtime
operational parameters of industrial systems, buildings, and so forth.

7
Chapter 1 Introduction to Datafication

The third type is time series data, such as stock price, weather, or
sensor data.
The fourth type of data is network structured data, such as integrated
networked systems in an industrial unit, such as coolant pipes and water
flow. This data type is beneficial because it provides for overall media
analysis, entire industrial function, and so on.
The fifth data set is your health, fitness, sleep time, conversation chats,
smart home, and health monitor device.

Elements of Datafication
As defined by DAMA, Figure 1-1 illustrates the seven critical elements of
the datafication architecture used to develop the datafication process.
Datafication will only be successful if at least one of the steps is included.

Figure 1-1. Data elements

8
Chapter 1 Introduction to Datafication

Data Harvesting
Data harvesting is extracting data from a given source, such as social
media, IoT devices, or other various data sources.
Before harvesting any data, you need to analyze it to identify the source
and software tools needed for harvesting.
First, the data is undesiably noticeable if it is inaccurate, biased,
confidential, and irrelevant. Therefore, harvested information is
more objective and reliable than familiar data sources. However, the
disadvantage is that it is difficult to know the users’ demographic and
psychological variables for social media data sources.
Second, harvesting must be automatic, real-time, streaming and able
to handle large-scale data sources efficiently.
Third, the data are usually fine-grained and available in real-time. Text
mining techniques are used to preprocess raw text images, text processing
techniques are used to preprocess essential texts, and video processing
techniques are used to preprocess photos and videos for further analysis.
Fourth, the data can be ingested in real-time or in batches. In real-­
time, each data item is imported as the source changes it. When data are
ingested through sets, the data elements are imported in discrete chunks
at periodic intervals.
Various data harvesting methods can be used depending on the data
source type, as follows:

• IoT devices typically involve collecting data from IoT


sensors and devices using protocols such as MQTT,
CoAP, HTTP, and AMQP.

• Social media platforms such as Facebook, Twitter,


LinkedIn, Instagram, and others use REST API,
streaming, Webhooks, and GraphQL.

9
Chapter 1 Introduction to Datafication

Data Curation
Data curation organizes and manages data collected through ingestion
from various sources. This involves organizing and maintaining data in
a way that makes it accessible and usable for data analysis. This involves
cleaning and filtering data, removing duplicates and errors, and properly
labeling and annotating data.
Data curation is essential for ensuring that the data are accurate,
consistent, and reliable, which is crucial for data analysis.
The following are the few steps involved in data curation:

• Data Cleaning: Once the data is harvested, it must


be cleaned to remove errors, inconsistencies, and
duplicates. This involves removing missing values,
correcting spelling errors, and standardizing data
formats.

• Data Transformation: After the data has been cleaned,


it needs to be transformed into a format suitable for
analysis. This involves aggregating data, creating new
variables, and so forth. For example, you might have a
data set of pathology reports with variables that include
such elements as patient ID, date of visit, test ID, test
description, and test results. You want to transform this
data set into a format that shows each patient’s total
health condition. To do this you need to alter harvested
data for data analysis with transformations such as
creating a new variable for test category, aggregating
test data for patient for a year, summarizing data by
group (ex: hemoglobin), etc.

10
Chapter 1 Introduction to Datafication

• Data Labeling: Annotating data with relevant


metadata, such as variable names and data
descriptions.

• Data Quality Test: In this step, you need to ensure the


data is accurate and reliable by using various tests like
statistical tests, etc.

The overall objective of data curation is to reduce the time it takes


to obtain insight from raw data by organizing and bringing relevant
information together for further analysis.
The steps involved in data curation are organizing and cataloging data,
ensuring data quality, preserving data, and providing access to data.

Data Storage
Data storage stores actual digital data on a computer with the help of a
hard drive, solid-state drive, and related software to manage and organize
the data.
Data storage is the actual physical storage of datafication data. More
than 2.5 quintillion bytes of data are created daily, and data snowballs
of approximately 2 MB are made every second for every person. These
numbers are from users searching the content in the internet, browsing
social media networks, posting blogs, photos, comments, status updates,
watching a video, downloading images, streaming songs, etc. To make a
business decision, the data must be stored in a way that is easier to manage
and access, and it is essential to protect data against cyber threats.
For IoT, the data need to be collected from sensors and devices and
stored in the cloud.
Several types of database storage exist, including relational databases,
NoSQL databases, in-memory databases, and cloud databases. Each type
of database storage has advantages and disadvantages, but the best choice
for datafication is cloud databases that involve data lakes and warehouses.

11
Chapter 1 Introduction to Datafication

Data Analysis
Data analysis refers to analyzing a large set of data to discover different
patterns and KPIs (Key Performance Indicators) of an organization. The
main goal of analytics is to help organizations make better business
decisions and future predictions. Advanced analytics techniques such
as machine learning models, text analytics, predictive analytics, data
mining, statistics, and natural language processing are used. With these
ML models, you uncover hidden patterns, unknown correlations, market
trends, customer preferences, feedback about your new FMCG (Fast
Moving Consumer Goods) products, and so on.
The following are the types of analytics that you can process using
ML models:
• Prescriptive: This type of analytics helps to decide
what action should be taken and examines data to
answer various questions such as what should be done.
Or what can we do to make our product attractive? This
helps to find an answer to various problems, such as
where to focus on treatment.
• Predictive: This type of analytics helps to predict the
future or what might happen, such as emphasizing the
business relevance of the resulting insights and use
cases, such as sales and production data.
• Diagnostic: This type of analytics helps to analyze
past situations, such as what went wrong and why it
happened. This helps to facilitate correction in the future;
for example, weather prediction and customer behavior.
• Descriptive: This type of analytics helps to analyze
current and future use cases, such as behavioral analysis
of users.
• Exploratory: This type of analytics involves visualization.

12
Chapter 1 Introduction to Datafication

Cloud Computing
Cloud computing is the use of computing resources delivered over the
internet and has the potential to offer substantial opportunities in various
datafication scenarios. It is a flexible delivery platform for data, computing,
and other services. It can support many architectural and development
styles, from extensive, monolithic systems to sizeable virtual machine
deployments, nimble clusters of containers, a data mesh, and large farms
of serverless functions.
The primary services of cloud offerings for data storage are as follows:

• Data storage as a service

• Streaming services for data ingestion

• Machine learning workbench for analysis

Datafication Across Industries


Datafication is a valuable resource for businesses and organizations
seeking to gain insights into customer behavior, market trends, patient
health healing progress, and more.
Datafication is the process of converting various types of data into a
standardized format that can be used for analysis and decision making
and has become increasingly important across industries as a means of
leveraging data.
In the health-care industry, datafication is used to improve patient
outcomes and reduce costs. By collecting and analyzing patient data,
including pathology tests, medical histories, vital signs, and lab results, health-
care providers are able to optimize treatments and improve patient care.
In the finance industry, datafication is used to analyze financial
data, such as transaction history, risk, fraud management, personalized
customer experience, and compliance.

13
Chapter 1 Introduction to Datafication

In the manufacturing industry, datafication is used to analyze


production data, machine data to improve the production process, digital
twins, etc.
In the retail industry, datafication is used to analyze customer behavior
and preferences to optimize pricing strategies and personalized customer
experience.

Summary
Datafication is the process of converting various types of data and
information into a digital format that can easily be processed and
analyzed. With datafication, you can increase your organization’s
footprint by using data effectively for decision making. It helps to improve
operational efficiency and provides input to the manufacturing hub to
develop new products and services.
Overall, data curation is the key component of effective datafication,
as it ensures that the data is accurate, complete, and reliable, which is
essential for making decisions and gleaning meaningful insights.
In this chapter, I described datafication and discussed the types
of data involved in datafication, datafication steps, and datafication
elements. Next chapter provides more details of principles, patterns and
methodolgoies to realize the datafication.

14
CHAPTER 2

Datafication
Principles
and Patterns
Principles are guidelines for the design and development of a system. They
reflect the level of consensus among the various elements of your system.
Without proper principles, your architecture has no compass to guide its
journey toward datafication.
Patterns are tried-and-tested accurate solutions to common design
problems, and they can be used as a starting point for developing a
datafication.
The processes involved in datafication are to collect, analyze, and
interpret the vast amount of information from a range of sources, such
as social media, Internet of Things (IoT) sensors, and other devices. The
principles and patterns underlying datafication must be understood to
ensure that it benefits all.
The patterns are reusable solutions to commonly occurring problems
in software design. These patterns provide a template for creating designs
that solve specific problems while also being flexible to adapt to different
contexts and requirements.

© Shivakumar R. Goniwada 2023 15


S. R. Goniwada, Introduction to Datafication,
https://doi.org/10.1007/978-1-4842-9496-3_2
Chapter 2 Datafication Principles and Patterns

This chapter provides you with an overview of the principles and


patterns shaping the development of datafication. It will examine the
ethical implication of these technologies for society. Using these principles
and patterns, you can develop datafication projects that are fair and
transparent and that perform well.

What Are Architecture Principles?


A principle is a law or a rule that must be or usually is to be followed
when making critical architectural decisions. The architecture and design
principles of datafication play a crucial role in guiding the software
architecture work responsible for defining the datafication direction.
While following these principles, you must also align with the existing
enterprise’s regulations, primarily those related to data and analytics.
The data and analytics architecture principles are a subset of the
overall enterprise architecture principles that pertain to the rules
surrounding your data collection, usage, management, integration, and
analytics. Ultimately, these principles keep your datafication architecture
consistent, clean, and accountable and help to improve your overall
datafication strategy.

Datafication Principles
As mentioned in the previous chapter, datafication analyzes data from
various sources, such as social media, IoT, and other digital devices. For
a successful and streamlined datafication architecture, you must define
principles related to data ingestion, data streaming, data quality, data
governance, data storage, data analysis, visualization, and metrics. These
principles ensure that data and analytics are used in a way that is aligned
with the organization’s goals and objectives.

16
Chapter 2 Datafication Principles and Patterns

Examples of datafication principles include the use of accurate and up-­


to-­date data, the use of a governance framework, the application of ethical
standards, and the application of quality rules.
The following few principles that helps you to design the datafication
process:

Data Integration Principle


Before big data and streaming technology, data movement was simple.
Data moved linearly from static structured databases and static APIs to
data warehouses. Once you built an integration pipeline in this stagnant
world, it operated consistently because data moved like trains on a track.
In datafication, data have upended the traditional train track–based
approach to use a modern and smart city traffic signal–based approach.
To move data at the speed of business and unlock the flexibility of modern
data architecture, the integration must be handled such that it has the
ability to monitor and manage performance continually. For modern data
integration, your data movement must be prepared for the following:1

• Be capable of doing streaming, batch, API-led, and


micro-batch processing
• Support structured, semi-structured, and
unstructured data

• Handle scheme and semantic changes without


affecting the downstream analysis

• Respond to changes from sources and


application control

1
https://streamsets.com/blog/data-integration-architecture/

17
Chapter 2 Datafication Principles and Patterns

The following principles will help you design modern data integration.
For example, in health-care data analysis, you need to integrate various
health-care systems in the hospitals, such as electronic medical records
and insurance claims data. In financial data analysis, to generate trends
and statistics of financial performance, you need to integrate various data
systems, such as payment processors, accounting systems, and so forth.

• Design for Both Batch and Streaming: While you are


building for social media and IoT, which capitalize
on streaming and API-led data, you must account for
the fact that these data often need to be joined with
or analyzed against historical data and other batch
sources within an enterprise.

• Structured, Semi-structured, and Unstructured


Data: Data integration combines data from multiple
sources to provide a unified view. To achieve this, data
integration software must be able to support this.

• Handle Scheme and Schematics Changes: In


data integration, it is standard for the scheme and
schematics of the data to change over time as new data
sources are added or existing sources are modified.
These changes affect the downstream analysis, making
it difficult to maintain the data’s integrity and the
analysis’s accuracy. It is essential to use a flexible and
extensible data integration architecture to handle this.
You can use data lineage tools to achieve this.

• Respond to Changes from Sources: In data integration,


responding to the source side requires technical and
organizational maturity. Using CDC (Change Data
Capture) and APIs (Application Programming Interface)
and implementing the best change management ensures
that data integration is responsive, efficient, and effective.

18
Chapter 2 Datafication Principles and Patterns

• Use Low-Code No-Code Concepts: Writing custom


code to ingest data from the source into your data store
has been commonplace.

• Sanitize Raw Data upon Data Harvest: Storing


raw inputs invariably leads you to have personal
data and otherwise sensitive information posing
some compliance risks (use only when it is needed).
Sanitizing data as close to the source as possible makes
data analytics productive.

• Handle Data Drift to Ensure Consumption-Ready


Data: Data drift refers to the process of data changing
over time, often in ways that are unpredictable and
difficult to detect. This drift can occur for many
reasons, such as changes in the data source, changes in
data processing algorithms, or changes in the system’s
state. This kind of drift can impact the quality and
reliability of data and analytics. Data drift increases
costs, causes delays in time to analysis, and leads to
poor decisions based on incomplete data. To mitigate
this, you need to analyze and choose the right tools and
software to detect and react to changes in the schema
and keep data sources in sync.

• Cloud Design: Designing integration for the cloud


is fundamentally different when architecting the
cloud. Enterprises often put raw data into object
stores without knowing the end analytical intent.
Legacy tools for data integration often lack the level of
customization and interoperability needed to take full
advantage of cloud services.

19
Chapter 2 Datafication Principles and Patterns

• Instrument Everything: Obtaining end-to-end insight


into data systems will be challenging. End-to-end
instrumentation helps to manage data movements.
This instrumentation is needed for time series analysis
of a single data flow to tease out changes over time.

• Implement the DataOps Approach: Traditional


data integration was suitable for the waterfall
delivery approach but may not work for modern-­
day engineering principles. Modern dataflow tools
provide an integrated development environment for
continuous use for the dataflow life cycle.

Data Quality Principle


Ensuring you have high-quality data is central to the data management
platform. The principle of data quality management is a set of fundamental
understandings, standards, rules, and values. It is the core ingredient of
a robust data architecture. Data quality is critical for building an effective
datafication architecture. Well-governed, high-quality data helps create
accurate models and robust schemas.
There are five characteristics of data quality, as follows:

• Accuracy: Is the information captured in every detail?

• Completeness: How compressive is the data?

• Reliability: Does the data contradict other trusted


resources?

• Relevance: Do you need this data?

• Timeliness: Is this data obsolete or up-to-date, and can


it be used for real-time analysis?

20
Chapter 2 Datafication Principles and Patterns

To address these issues, several steps can be taken to improve the


quality, as follows:

• Identify the type of source and assess its reliability.

• Check the incoming data for errors, inconsistencies,


and missing values.

• Use data cleaning techniques to fix any issues and


improve the quality.

• Use validation rules to ensure data is accurate and


complete. This could be an iterative approach.

• Monitor regularly and identify changes.

• Apply data governance and management process.

Data Quality Tools


Data quality is a critical capability of datafication, as the accuracy and
reliability of data are essential for an accurate outcome. These tools and
techniques can ensure that data is correct, complete, and consistent and
can help identify and remediate quality issues. There are various tools and
techniques to address data quality. Here are a few examples:
• Data Cleansing tools: These help you identify and fix
errors, inconsistencies, and missing values.

• Data Validation tools: These tools help you to check


data consistency and accuracy.

• Data Profiling tools: These will provide detailed data


analysis such as data types, patterns, and trends.

• Data Cataloging tools: These tools will create a


centralized metadata repository, including data quality
metrics, data lineage, and data relationships.

21
Chapter 2 Datafication Principles and Patterns

• Data Monitoring and Alerting tools: These track data


quality metrics and alert the governance team when
quality issues arise.

Data Governance Principles


Data are an increasingly significant asset as organizations implementing
datafication move up the digital curve as they focus on big data and
analytics. Data governance helps organizations better manage data
availability, usability, integrity, and security. It involves establishing
policies and procedures for collecting, storing, and using data.
In modern architecture, especially for datafication, data are expected
to be harvested and accessed anywhere, anytime, on any device. Satisfying
these expectations can give rise to considerable security and compliance
risks, so robust data governance is needed to meet the datafication process.
Data governance is about bringing data under control and keeping
it secure. Successful data governance requires understanding the data,
policies, and quality of metadata management, as well as knowing where
data resides. How did it originate? Who has access to it? And what does it
mean? Effective data governance is a prerequisite to maintaining business
compliance, regardless of whether that compliance is self-imposed by an
organization or comes from global industry practices.
Data governance includes how data delivery and access take place.
How is data integrity managed? How does data lineage take place? How
is data loss prevention (DLP) configured? How is security implemented
for data?
Data governance typically involves the following:

• Establish the data governance team and define its roles


and responsibilities.

• Develop a data governance framework that includes


policies, standards, and procedures.

22
Chapter 2 Datafication Principles and Patterns

• Data consistency across user behavior ensures


completeness and accuracy in generating required KPIs
(Key Performance Indicators).

• Identify critical data assets and classify them according


to their importance.

• Define compliance matrices like GDPR, etc.

• Fact-based decisions based on advanced analytics become


actual time events, and data governance ensures data
veracity, which builds the confidence an organization
needs to achieve the real-time goal for decision making.

• Consider using data governance software such as


Alation, Collibra, Informatica, etc.

Data Is an Asset
Data is an asset that has value to organizations and must be managed
accordingly. Data is an organizational resource with real measurable
value, informing decisions, improving operations, and driving business
growth. Organizations’ assets are carefully managed, and data are equally
important as physical or digital assets. Quality data are the foundation
of the organization’s decisions, so you must ensure that the data are
harvested with quality and accuracy and are available when needed.
The techniques used to measure the data value are directly related to the
accuracy of the outcome of the decision, the accuracy of the outcome
depends on the quality, relevance, and reliability of hte data used in
the decision-making process. the common techniques are data quality
assessment, data relevance analysis, cost-benefit analysis, impact analysis
and differnet forms of analytics.

23
Chapter 2 Datafication Principles and Patterns

Data Is Shared
Different organizational stakeholders will access the datafication data
to analyze various KPIs. Therefore, the data can be shared with relevant
teams across an organization. Timely access to accurate and cleansed data
is essential to improving the quality and efficiency of an organization’s
decision-making ability. The speed of data collection, creation, transfer,
and assimilation is driven by the ability of an organization’s process and
technology to capture social media or IoT sensor data.
To enable data sharing, you must develop and abide by a common
set of policies, procedures, and standards governing data management
and access in the short and long term. It would be best if you had a clear
blueprint for data sharing; there should not be any compromise of the
confidentiality and privacy of data.

Data Trustee
Each data element in a datafication architecture has a trustee accountable for
its quality. As the degree of data sharing grows and business units within an
organization rely upon information, it becomes essential that only the data
trustee makes decisions about the content of the data. In this role, the data
trustee is responsible for ensuring that the data used are following applicable
laws, regulations, or policies and are handled securely and responsibly. The
specific responsibilities of a data trustee will vary depending on the type of
data being shared and the context in which it is being used.
The trustee and steward are different roles. The trustee is responsible
for the accuracy and currency of the data, while the steward may be
broader and include standardization and definition tasks.

24
Chapter 2 Datafication Principles and Patterns

Ethical Principle
Datafication focuses on and analyzes social media, medical, and IoT data.
These data are focused on human dignity, which involves considering
the potential consequences of data and ensuring that it is used fairly,
responsibly, and transparently. This principle reflects the fundamental
ethical requirement that people be treated in a way that respects their
dignity and autonomy as human individuals. When analyzing social
media and medical data, we must remember that data also affects,
represents, and touches people. Personal data are entirely different from
any machine’s raw data, and the unethical use of personal data can directly
influence people’s interactions, places in the community, personal product
usage, etc. It would be best if you considered various laws across the globe
to meet ethics needs while designing your system.
There are various laws in place globally; here are a few:
GDPR Principles (Privacy): Its focus is protecting, collecting, and
managing personal data; i.e., data about individuals. It applies to all
companies and originations in the EU and companies outside of Europe that
hold or otherwise process personal data. The following are a few guidelines
from the GDPR. For more details, refer to https://gdpr-­info.eu/:

• Fairness, Lawfulness, Transparency: Personal data


shall be processed lawfully, fairly, and transparently
about the data subject.

• Purpose Limitation: Personal data must be collected


for specified, explicit, and legitimate purposes and not
processed in an incompatible manner.

• Data Minimization: Personal data must be adequate,


relevant, and limited to what is necessary for the
purpose they are processed.

• Accuracy: Personal data must be accurate and, where


necessary, kept up to date.

25
Chapter 2 Datafication Principles and Patterns

• Integrity and Confidentiality: Data must be


processed with appropriate security of the personal
data, including protection against unauthorized and
unlawful processing.

• Accountability: Data controllers must be responsible


for any compliance

PIPEDA (Personal Information Protection and Electronic


Documents Act): This applies to every organization that collects, uses,
and disseminates personal information. The following are the statutory
obligations of PIPEDA; for more information, visit https://www.
priv.gc.ca/:

• Accountability: Organizations are responsible for


personal information under its control and must
designate an individual accountable for compliance.

• Identifying Purpose: You must specify the purpose for


which personal information is collected.

• Consent: You must obtain the knowledge and consent


of the individual for the collection.

• Accuracy: Personal information must be accurate,


complete, and up to date.

• Safeguards: You must protect personal information.

Human Rights and Technology Act: The U.K. government proposed


this act. It would require companies to conduct due diligence to ensure
that their datafication system does not violate human rights and to report
any risk or harm associated with the technology. You can find more
information at https://www.equalityhumanrights.com/. The following
are a few guidelines:

26
Chapter 2 Datafication Principles and Patterns

• Human Rights Impact Assessment: Conduct a human


rights impact assessment before launching new
services.

• Transparency and Accountability: You must disclose


information about technology services, including how
you collect the data and the algorithms you use to make
decisions affecting individual rights.

Universal Guidelines for AI: This law provides a set of guidelines for
AI/ML and was developed by IEEE (Institute of Electrical and Electronics
Engineers). These guidelines include transparency, accountability, and
safety. You can find more information at https://thepublicvoice.org/
ai-universal-guidelines/. The following are a few guidelines:

• Transparency: AI should be transparent in decision-­


making process, and data algorithms used in AI should
be open and explainable.

• Safety and Well-being: Should be designed to ensure


the safety and well-being of individuals and society.

There are various laws available for each country, and we suggest
following the laws and compliance requirements before processing any
data for analysis.

Security by Design Principle


Security by design also means privacy by design and is a concept in which
security and privacy are considered fundamental aspects of the design.
This principle emphasizes the importance of keeping security and
privacy at the core of a product system.

27
Chapter 2 Datafication Principles and Patterns

The following practices help with the design and development of a


datafication architecture:2

• Minimize Attack Surface Area: Restricts a user’s


access to services.

• Establish Secure Defaults: Strong security rules on


registering users to access your services.

• The Principle of Least Privilege: The user should


have minimum privileges needed to perform a
particular task.

• The Principle of Defense Depth: Add multiple layers


of security validations.

• Fail Securely: Failure is unavoidable and therefore you


want it to fail securely.

• Don’t Trust Services: Do not trust third-party services


without implementing a security mechanism.

• Separation of Duties: Prevent individuals from acting


fraudulently.

• Avoid Security by Obscurity: Should be sufficient


security controls in place to keep your application safe
without hiding core functionality or source code.

• Keep Security Simple: Avoid the use of very


sophisticated architecture when developing security
controls.

• Fix Security Issues Correctly: Developers should


carefully identify all affected systems.

2
Cloud Native Architecture and Design Patterns, Shivakumar Goniwada,
Apress, 2021

28
Chapter 2 Datafication Principles and Patterns

Datafication Patterns
Datafication is the process of converting various aspects of invisible data
into digital data that can be analyzed and used for decision making. As
I explained in Chapter 1, “Introduction to Datafication,” datafication is
increasingly prevalent in recent years, as advances in technology have
made it easier to collect, store, and analyze large amount of data.
The datafication patterns are the common approaches and techniques
used in the process of datafication. These patterns involve the use of
various technologies and methods, digitization, aggregation, visualization,
AI, and ML to convert data into useful insights.
By understanding these patterns, you can effectively store, collect,
analyze, and use data to drive decision making and gain a competitive
edge. By leveraging these patterns, you optimize storage operations.
Each solution is stated so that it gives the essential fields of the
relationships needed to solve the problem, but in a very general and
abstract way so that you can solve the problem for yourself by adapting it
to your preferences and conditions.
The patterns can be the following:

• Can be seen as building blocks of more complex


solutions

• The function is a common language used by


technology architects and designers to describe
solutions.3

3
Cloud Native Architecture and Design Patterns, Shivakumar Goniwada,
Apress, 2021

29
Another random document with
no related content on Scribd:
CHAPITRE IV
DE L’INSTRUCTION : QUELQUES LACUNES

Les langages secrets. — La constitution. — Soi-même. — « Self-defence ». —


Planter un clou. — Les « applications ».

Les langages secrets.

On jargonne autour de nous des langues qui sont aussi


différentes du français, aussi mystérieuses que les langues
étrangères, mortes et vivantes. Or, le programme des études fait une
place importante au latin, voire au grec, qui sont des fleurs de luxe et
de haute culture. Il consacre un temps moindre à l’anglais et à
l’allemand, qui ne sont qu’utiles. Et il dédaigne absolument ces
langages à la fois usuels et secrets dont on aura toujours besoin
dans la vie actuelle.
Quels sont donc ces idiomes hermétiques, qu’on n’apprend pas
et qu’il faut comprendre ? Mais tout d’abord celui qu’on parle au pays
de Finance. Nous en ignorons, au moment d’entrer dans la lutte, les
plus élémentaires rudiments. Qui donc nous apprit la simple
différence entre une action et une obligation ? Entre le dividende et
l’intérêt ? Qui nous initia au mystère de l’hypothèque, du marché à
terme et au comptant, du change et de l’escompte, du report et de la
couverture ? Qui nous révéla l’énigme alléchante de l’action de
jouissance et celle, angoissante, du chèque barré ? Et tant de mots
détournés de leur sens originel, le parquet, la coulisse, la
liquidation…
Les cours de comptabilité jettent bien là-dessus quelque lumière.
Mais ils ne figurent qu’au programme d’une instruction déjà
spécialisée. Tout le monde ne les suit pas. Et tout le monde aura
besoin de connaître ces notions. Tout le monde se heurtera, tôt ou
tard, à ces mots impénétrables. Dans ce pays où le sens de
l’épargne est si vif, où chacun s’efforce, aux dépens de son bien-être
présent, d’amasser pour l’avenir une petite liasse de titres, n’est-il
pas surprenant qu’on n’enseigne pas le moyen de s’en servir ?
L’argent circule dans le corps social comme le sang dans un
organisme. Les phénomènes financiers mènent le monde actuel. Ils
font la paix et la guerre. Il y a là, au point de vue des rapports
internationaux, une géographie qui en vaut bien une autre. Or, par
une hypocrisie pareille à l’hypocrisie sexuelle, on garde, sur ces
questions qu’on sait pourtant vitales, un silence absolu.
On rétorquera que, là-dessus, chacun fait son apprentissage, le
moment venu, tant bien que mal, sous la pression du besoin.
Fâcheuse méthode. D’abord, c’est risquer d’être pris de court dans
une circonstance imprévue. Et puis, ce ne serait pas la peine de
consacrer à l’instruction dix des plus charmantes années de la vie, si
l’on n’acquérait pas à ce prix l’A B C des connaissances utiles, si l’on
devait tout apprendre plus tard, dans l’urgence et sous le joug de la
nécessité.
Pourquoi ne pas inculquer ces simples notions à l’âge où l’on
admet que la mémoire est spécialement sensible, tendre et fidèle ?
Encore une fois, il ne s’agit pas de faire de nos adolescents
autant de petits financiers. Il n’est question que d’un enseignement
très élémentaire, qui n’exigerait guère de temps dans l’énorme total
des heures de classe. Et si cet enseignement ne figure à aucun
degré du programme des études générales, c’est sans doute que ce
plan a été conçu dans un esprit déjà ancien, à une époque où la
nécessité de ces connaissances ne se fût justifiée ni par la
prodigieuse extension des affaires, ni par la non moins stupéfiante
diffusion des fortunes.
Il existe encore un autre langage aussi nécessaire et aussi
fermé. C’est celui que parlent les notaires et les avoués. C’est la
langue du Palais.
Là, encore, nul ne peut dire qu’il ne se heurtera pas quelque jour
à un jargon incompréhensible et dont il aurait pourtant besoin de
pénétrer le sens. Pour conclure en connaissance de cause un acte
d’association, industrielle ou conjugale, il nous faudrait des clartés
qu’on ne nous a pas données.
Quels fiancés ont saisi un mot à la lecture de leur contrat de
mariage ? O subtilités de la communauté réduite aux acquêts,
lourdes entraves du régime dotal, rigueurs du remploi, vous restez
lettre close pour les tendres amoureux. Et quand ils vous
découvrent, il est trop tard. Que de drames seraient évités, en trois
leçons !
Et combien d’industriels, de commerçants, ont dû maudire leur
ignorance lorsqu’ils se sont sentis prisonniers de leur acte de
société, faute d’avoir pu éventer les pièges tendus à chaque ligne ?
Actuellement, pour se marier, pour s’établir, pour mourir même —
car on ne sait pas rédiger son testament — il faut avoir fait son droit.
Mais, dira-t-on, il y a le notaire. Je sais bien. D’abord, il ne peut
pas s’intéresser à chacun de nous aussi étroitement que nous-
même. Puis, on ne peut pas se faire accompagner toute sa vie par
un notaire. On signe des actes hors de sa présence. Et, en tout cas,
ce n’est point une ambition démesurée, ni une précaution superflue,
que de vouloir comprendre un peu le langage qu’il nous parle…
Voilà bien l’effet — et peut-être aussi la cause — de notre
ignorance : elle justifie le notaire. Elle le rend indispensable, même
en des circonstances où l’on conçoit qu’on pourrait se passer de lui.
Que d’actes pourraient être signés sans gros frais, non dans une
étude, mais dans un bureau qu’on ouvrirait dans les mairies, si nous
avions quelques connaissances en droit usuel !
En parlant un langage obscur et qu’on nous laisse ignorer, le
tabellion obéit peut-être à une sorte d’instinct de conservation. Tous
les hommes de robe — les médecins qui professent s’en affublent
encore en cérémonie — ont besoin, pour garder leur pouvoir, de
s’envelopper de mystère, comme ils s’entourent les deux jambes
dans un unique fourreau. Notre ignorance fait piédestal à leur
science.
Enseignons donc à nos enfants les quelques éléments essentiels
de ces deux langages, celui de la Bourse et celui du Palais, comme
on apprend d’avance les mots principaux d’une langue vivante, afin
de ne pas être tout à fait désemparé sur la terre étrangère.

La Constitution.

On ne sait guère comment marche la machine à gouverner. Qui


s’avise de la distinction entre le législatif et l’exécutif, du rôle du
Président, de ses ministres et du parlement, du jeu de la vie
administrative ?
En France, on méprise volontiers la politique. Certes, on peut
étayer cette attitude de forts arguments. Quand, jetant les yeux sur
le fourmillement parlementaire, on aperçoit les servitudes et les
appétits, la terreur des responsabilités, les intrigues et les
compromissions, les rivalités et les palinodies, je conçois qu’on en
détourne le regard.
Mais ce n’est là qu’une vue partielle, donc injuste. Du logis qu’on
visite, on n’explore pas uniquement l’office. Les politiciens, n’étant
que des hommes, en ont les passions et les défaillances. Nous les
apercevons d’autant mieux qu’ils sont en vedette et que leur vie
nous appartient. Mais ils ne commettent pas que des turpitudes.
Cette agitation cache des efforts, produit du travail, engendre des
lois… Les séances du Parlement donnent une idée inexacte des
parlementaires. Elles laissent ignorer le labeur réel des
Commissions.
La politique est une fonction nécessaire du corps social. Et tous
les organismes ont leurs basses servitudes.
Quiconque étudie l’épopée napoléonienne ou l’œuvre de la
première Révolution, ne s’arrête pas à la trivialité des héros. Il juge
d’ensemble. Efforçons-nous d’apporter cette harmonieuse
impartialité dans notre appréciation du présent. Un étrange instinct
nous pousse à croire que le temps où nous vivons est inférieur à
toutes les époques passées. Qui sait ? L’histoire de ce régime
naissant, de sa résistance aux assauts, de la défense obstinée de
son idéal à travers les crises suprêmes, inspirera peut-être à nos
descendants une curiosité recueillie.
Pour ma part, je déplore ce divorce entre la politique et le pays.
Je crois qu’il est né de malentendus, servi par les légendes que
laisse flotter dans l’air l’éclatement des scandales, qu’il fut surtout
nourri de faciles couplets de revue, excité par d’âpres journaux de
parti, entretenu par le snobisme. Je crois qu’il y aurait grand
bénéfice à ce qu’on suivît passionnément le spectacle de la vie
publique.
Il y a là un cercle vicieux. Se désintéresser de la politique, la tenir
en mésestime, c’est autoriser les défaillances, permettre
l’affaissement des consciences. Garder le contact avec les élus, ce
serait stimuler leur zèle, exercer sur eux le meilleur contrôle. Les
gens qui se savent regardés conservent toujours une grande dignité
d’attitude.
Souvent, on voit des hommes se plaindre que le Parlement
n’agisse pas selon le programme des candidats. Mais se donnent-ils
la peine de rappeler à leur député ses promesses ? Lui font-ils
connaître leurs vues, leurs désirs ? Lui donnent-ils un mandat précis,
renouvelé, vivant, se modelant sur les circonstances, sur la vie ?
Non. Précisément parce qu’ils le dédaignent, parce qu’ils l’ignorent,
après l’avoir nommé. Ils ne se rappellent à lui que pour le charger de
démarches et de commissions. Ils lui donnent leurs voix, mais
ensuite ils ne le chargent pas d’exprimer leur pensée…
Je déplore encore ce détachement dédaigneux pour une autre
cause : tous, plus ou moins, nous dépendons de la politique… En
effet, il faut bien se rendre compte qu’une douzaine de ministères se
partagent toute l’activité du pays. Chacun d’eux jette sur la France
— et c’est une géographie qu’on n’apprend guère — un réseau
administratif, une trame plus ou moins serrée. La Justice la partage
en Cours d’appel, l’instruction Publique en Universités, la Guerre en
Corps d’armée, etc. Les Chambres de Commerce, les Trésoreries
générales, les régions minières et agricoles constituent des divisions
analogues. Et nous sommes toujours pris dans les mailles d’un de
ces filets lancés sur le territoire national.
Quelque métier qu’on exerce, on est tributaire d’un de ces
départements. L’artiste dépend des Beaux-Arts, le cultivateur de
l’Agriculture, l’ouvrier du Travail, le négociant du Commerce. Celui
qui convoite une juste faveur — le plus souvent de couleur rouge ou
violette — ou celui qui réclame même l’exercice d’un droit, se voit
contraint de s’adresser au ministère dont il est justiciable. Malgré lui,
il fait de la politique.
Le simple fait d’être citoyen français, de payer l’impôt, d’obéir à la
police, de servir, de voter, nous contraint de reconnaître plusieurs de
ces pouvoirs dont, soit dit en passant, nous subissons le prestige,
tout en les méprisant. Leurs décisions, leurs décrets nous touchent.
Le moindre changement dans la loi fiscale ou militaire réagit sur
notre vie ou sur celle des nôtres. Entre nous et le régime accepté,
s’est fatalement établie une solidarité nécessaire.
Alors, puisque nous sommes contraints d’obéir aux lois, puisque
nous ne pouvons pas les ignorer, pourquoi feindre à leur égard un
détachement puéril ? Puisque nous en subissons les effets, pourquoi
se désintéresser de leurs causes ? Pourquoi ne pas en suivre la
genèse, tout le travail d’élaboration ?
Là, encore, l’enseignement officiel est le grand coupable. Sur ce
terrain, cependant, il aurait dû marcher de l’avant, donner le goût du
régime. Mais non. Il donne l’exemple de l’indifférence. Au lieu d’en
démonter les rouages, d’en montrer les grands mouvements, il
laisse pour ainsi dire ignorer tout le machinisme de la Constitution.
Il ne s’agissait pourtant pas pour lui de prendre parti. Au
contraire, il eût favorisé l’esprit critique. Comment, par exemple,
discuter l’existence de ces grands corps comme le Conseil d’État, la
Cour des Comptes, dont nous ignorons le rôle ? Comment
condamner celle des sous-préfets, du moment qu’on nous en a
caché soigneusement les services ?
Si l’adolescent connaissait le fonctionnement de la machine
politique, il ne s’en désintéresserait peut-être pas dans la vie.
Convaincu qu’il participe à son mouvement et qu’il en subit les
effets, il continuerait d’en suivre le travail. Au surplus, le spectacle
n’est pas si morose que semblent croire ceux qui en détournent les
yeux. Toujours instructif, souvent savoureux, il est parfois brillant et
pathétique. Il y a de la beauté dans la passion.
Sourds aux plaisanteries et aux préjugés, étudions donc un peu
cette planche d’anatomie politique qui s’appelle la Constitution. En
un temps où volontiers on cocardise, ce n’est pas la moins
intelligente façon d’aimer son pays que de savoir comment il vit.

Soi-même.

Tout le monde sait la place de la Serbie. Peu de gens savent la


place de leur glande thyroïde. Cette ignorance de soi-même, du site,
du rôle et du jeu des principaux organes humains, apparaît
prodigieuse, inconcevable, quand on l’oppose au prix et à
l’importance que chacun attache à sa vie, à sa santé et aussi à la
santé et à la vie de ceux qui lui sont chers.
Je m’en étonnai un jour devant un homme qui a donné des
marques éclatantes d’intelligence générale. Il répondit avec un geste
de pudique dégoût :
— Cela ne m’intéresse pas.
Notez que ce même homme sait parfaitement qu’une migraine le
fauche, qu’il est à la merci de ce corps méprisé. Et il pousse à
l’extrême le souci de ne pas vieillir avant l’âge. Il fait analyser ses…
résidus à courts intervalles. Il veille au grain de sable. Conçoit-on
pareilles contradictions dans un maître cerveau ? On devrait pouvoir
parler de son corps comme on parle de son cœur.
Il serait curieux de rechercher dans le passé les origines de cet
étrange mépris pour notre « guenille ». Mais il importe surtout de le
constater dans le présent. Le programme des études secondaires
comporte bien quelques leçons de sciences naturelles. Mais elles
s’étendent volontiers sur les généralités et passent rapidement sur le
chapitre de l’Homme. La preuve que cet enseignement est trop
sommaire ? Mais c’est que nul ne s’en souvient… Je le répète, il
suffit de s’interroger pour reconnaître qu’on ne sait rien de soi, rien
de ce qui se passe en soi.
Quant aux effets de cette ignorance, ils se manifestent même à
l’état de santé. Cette santé, nous ne savons pas la défendre. Nous
ne savons pas prendre pour elle ces simples, ces instinctives
mesures de précaution qui nous font conserver, brillante, entre nos
mains en coquille, la lueur d’une allumette. Nous ne savons pas
nous mettre en garde contre les risques, contre les suites d’une
imprudence, des excès, du surmenage. Rien ne nous avertit des
sourdes alertes du mal, dans sa période d’incubation, alors qu’il
serait temps de l’enrayer et qu’on ne songe point encore à appeler le
médecin. Où donc aurions-nous appris tout cela ?
Nous ne savons pas nous nourrir. La notion des aliments
vraiment nutritifs, de ceux qui ne le sont pas, est totalement ignorée
de la ménagère qui dresse le menu. Cependant, le principe est
simple, la liste est courte. Il y aurait grand intérêt à ce qu’ils fussent
répandus, aussi bien pour notre économie vitale que pour
l’économie de notre budget.
Nous ne savons même pas dormir ! En ce sens que nous ne
savons pas favoriser par des moyens naturels notre sommeil, où
pourtant se régénère notre vie. On ne nous enseigne pas le régime
qui lui soit le plus propice. Et nous ne savons rien de l’influence de
ces courants magnétiques qui, dirigeant l’aiguille de la boussole du
nord au sud, agissent sans doute sur notre organisme au repos,
peut-être sur notre organisme en action, et devraient tout au moins
décider de l’orientation de notre lit.
Et cette précieuse intégrité de nous-même, nous ne savons
guère plus l’entretenir et la développer que la protéger. La plupart
des gens ignorent leurs ressources physiques, le parti merveilleux
qu’ils pourraient tirer d’eux-mêmes, les résultats stupéfiants, extra-
rapides de simples exercices gymnastiques…
Il suffit pourtant, le matin, de quelques mouvements réguliers,
pour amplifier le jeu de la respiration — nous ne savons pas respirer,
nous n’utilisons pas pleinement nos poumons — pour renforcer les
muscles en retard, pour retoucher la statue.
Avec une échelle, une simple échelle, on accoutume un enfant
au vertige. En l’escaladant à l’endroit, à l’envers, en s’y suspendant,
il se développe harmonieusement.
Il faudrait encore choisir parmi les sports, les adapter aux
complexions, en éviter les excès. Si le canotage est excellent pour
tous, parce qu’il exige l’exercice complet des muscles en même
temps qu’il aiguise la présence d’esprit, la bicyclette est néfaste à
quelques-uns. Mais là encore, nous allons à tâtons.
Cette ignorance de la machine humaine est encore plus
fâcheuse quand nous nous trouvons en présence d’un accident ou
des premiers symptômes d’une maladie déclarée. Notre bon vouloir
est désarmé. Il peut même être néfaste. Car nous risquons, par
exemple, de placer un asphyxié dans une mauvaise position ou de
prendre au sujet d’un malade des décisions contre-indiquées. Et
qu’on ne prétende pas, dans ces deux cas, qu’on a toujours un
médecin sous la main. Il peut être éloigné, occupé, absent. Bref, il y
a toujours une période d’attente, où notre ignorance peut être
mortelle, faute de quelques connaissances médicales.
Elle est fatale encore quand elle nous masque toute la vie
sexuelle, qui joue un rôle si important dans l’économie humaine. Je
l’ai dit : de courageuses initiatives ont soulevé un coin du voile,
protesté contre le mystère honteux qui aggravait les maux
vénériens. Mais l’histoire de la génération ne se borne pas au
chapitre de la maladie, heureusement. Et c’est l’ensemble de cette
histoire que l’on tient secret.
J’ai entendu le propriétaire d’une roseraie fameuse s’assurer,
l’œil inquiet, avant d’expliquer le mariage des roses : « Il n’y a pas de
jeunes filles ? » De pareilles pudibonderies ne sont-elles pas
indécentes ?
Mais c’est justement grâce à l’exemple des fleurs, des bêtes
domestiques, qu’on parvient à jeter, sur ces grandes lois vitales,
quelques clartés dans l’âme enfantine, sans la choquer ni la
décevoir. Et cela sans solennité, je le répète une fois de plus, tout
simplement, tout naturellement, au hasard des occasions et des
causeries. Point n’est besoin d’aller vite. La prudence n’est pas de la
pruderie. Et alors l’initiation perdra ce vilain attrait de fruit défendu
qui lui donne actuellement son caractère de louche obscénité.
Alors seront évitées bien des blessures morales, chez la femme
qu’une révélation trop brutale a froissée à jamais.
Et ce ne seront pas seulement des blessures morales qui seront
évitées, mais aussi les blessures physiques. Ce mépris, cette honte
qu’on s’inspire à soi-même, retiennent des malheureux des deux
sexes d’avouer même au médecin leur intime misère, quelle qu’en
soit l’origine. Ayant mis un bandeau sur les yeux, on a mis du même
coup un bâillon sur les lèvres. Et il y en a qui se laissent mourir
plutôt que de parler, s’immolant ainsi volontairement aux exigences
farouches de la pudeur convenue.
Enfin, même silence sur les choses de la maternité. N’est-il pas
prodigieux qu’on améliore toutes les autres espèces animales, qu’on
étudie pour elles les lois de la reproduction et de la sélection, et
qu’on abandonne encore au pur hasard la procréation humaine ?
Combien d’époux, faute d’en connaître les prémisses — où donc en
auraient-ils connu ? — arrivent au jour de la délivrance sans savoir si
elle s’annonce et se présente normalement, si elle est précédée de
ses signes nécessaires, et alors, ce sont des catastrophes, —
aisément évitables — où le petit enfant perd souvent la vie.
Tels sont, à grands traits, les ravages de l’ignorance de soi-
même. Tels sont les fruits du dédain et de la honte que nous inspire
notre corps. Je ne sais pas de préjugé qui fasse plus de victimes ni
qui mérite d’être plus obstinément dénoncé.

Self-defence.
Un jour, un bon bourgeois passait aux environs de la gare Saint-
Lazare, quand il sentit une main s’abattre durement sur son épaule.
Tournant la tête, il vit un homme sombre et furieux qui lui ordonna de
le suivre.
— Où donc ?
— Au poste.
On n’est jamais tout à fait innocent. Arrêté sans cause connue,
on a vite fait soi-même d’en découvrir une dans son passé. Bref,
sans plus regimber, notre promeneur se laissa conduire au
commissariat voisin. Et là, il s’aperçut qu’il avait été arrêté par un
fou…
Oui, c’était un vrai fou, qui, sans doute atteint de la manie des
grandeurs, se croyait policier. L’anecdote est authentique. A notre
époque, un fou peut arrêter un passant et le conduire au
commissariat. Comment pareille aventure est-elle possible ?
L’explication est fort simple : le passant ignore ses droits. Il ne sait
pas les garanties qu’il doit exiger de l’homme qui veut l’arrêter.
Démuni d’armes légales, il ne peut pas se défendre.
Que chacun s’interroge sincèrement et se place dans un cas
semblable. Certes, selon sa nature, il se cabrera plus ou moins haut.
Mais, en vérité, il ne saura pas au juste les catégories d’individus qui
ont le droit d’arrêter les autres. Il ignorera les moyens de vérifier leur
identité. Il ne saura pas dans quelles conditions d’heure et de lieu, ni
sur la présentation de quels mandats cette arrestation est légale.
Pour les perquisitions, même histoire. Nous ne sommes pas
mieux armés pour la défense de notre foyer que pour celle de notre
personne. Là, encore, les faits-divers nous apportent leurs
témoignages. Que de fois la femme, restée seule au logis, laisse
fouiller les meubles et crocheter les tiroirs — quand elle n’en livre
pas elle-même les clefs — par de faux policiers, qu’elle a crus sur
leur arrogance et leur mauvaise mine ! Elle ne savait pas. Elle
ignorait sur quel « Sésame » nous devons ouvrir notre porte à la loi.
Et nous ne savons pas plus dans quelles conditions nous devons
l’ouvrir à la réquisition militaire en temps de manœuvre, à
l’inquisition fiscale en matière de fraudes. Quand un « rat de cave »,
flairant un petit délit, se présente chez un viticulteur soupçonné ou
dénoncé, il se nomme à peine. Il entre, il est chez lui. Seul, son
sans-gêne est garant de son autorité. Le propriétaire se tait et se
tient coi. Et pour cause. Sait-il seulement les références qu’il peut
exiger de l’inquisiteur ?
Ce sont là, dira-t-on, des cas exceptionnels. Soit. Mais tout le
monde paie l’impôt, et tout le monde passe à l’octroi. Or, sommes-
nous mieux armés pour exiger le respect de nos biens que pour
défendre celui de notre personne et de notre logis ?
Chacun paie aveuglément ses contributions. Qui donc en pourrait
vérifier l’exactitude ? Nul ne sait, nul ne se soucie de savoir sur
quelles bases elles sont calculées.
Quand la main du gabelou s’abat sur nos bagages, sur notre
auto, connaissons-nous exactement nos droits ? Pouvons-nous
simplement donner au sbire la clef de notre malle et le laisser à sa
basse besogne, ou peut-il nous contraindre à déboucler et à
reboucler ? Quand nous lui affirmons que nous n’avons rien à
déclarer, peut-il nonobstant exiger la fouille ?
Ainsi, qu’il s’agisse de nous ou de notre propriété, nous ne
savons pas nous défendre. Nous avons négligé les armes que nous
tendait la loi. Mais elles existent, ces armes, elles reposent à l’ombre
de l’épaisse forêt du Code. Il nous serait relativement aisé de les
ramasser.
A-t-on déjà tenté en ce sens quelque effort officiel ? J’ai consulté
le programme actuel des lycées de France. J’ai vu que, dans une
classe de troisième, on consacrait une heure par semaine à l’étude
du droit usuel. Et encore on ne fait du droit usuel que dans la
division B où l’on n’apprend pas le latin. Si bien que le latiniste est
condamné à ignorer toute notion de droit. Mais tranquillisez-vous :
ces notions de droit usuel ne descendent pas jusqu’à ces
applications pratiques dont on aurait besoin dans la vie. En fait,
latinistes et modernes restent également ignorants, également
désarmés dans l’art de se défendre contre les abus de l’autorité.
Planter un clou.

Un dimanche matin, Monsieur, pris d’un beau zèle, décide de se


passer des services toujours onéreux du tapissier et d’accrocher lui-
même quelques tableaux. Il se munit de clous, s’arme d’un marteau,
prend d’assaut l’escabelle. Il frappe. L’opération semble aisée. Or,
elle est rarement couronnée de succès. Le marteau ne veut rien
savoir pour tomber sur le clou. Il marque le mur d’une empreinte
ineffaçable ou il meurtrit les doigts de Monsieur. Cependant, parmi
tant de coups, certains parviennent à destination. A force de
persévérance, la pointe s’enfonce. Mais la malice des choses n’a
pas dit son dernier mot. Tantôt le clou s’enfonce trop bien dans un
joint de plâtre et Monsieur le cueille comme un fruit mûr. Tantôt le
clou rencontre de la brique et, sous les coups qui l’atteignent, il se
tord.
Comme il a raison de se tordre ! N’est-ce pas comique, qu’un
homme cultivé ne soit pas capable de planter un clou ? Mais qui
donc le lui aurait appris ? C’est l’éternelle question. Dans la
bourgeoisie qui destine son fils aux carrières libérales, le collège
prend l’enfant dès sa première culotte, ne le lâche que pour le
confier aux écoles spéciales. Elles le passent à la caserne, qui le
jette enfin dans la vie. Il y tombe tout à fait gauche, tout à fait
inadapté, puisqu’on s’est bien gardé, au cours de ces stages
successifs, de lui donner cette dextérité pratique dont l’art de planter
un clou n’était qu’un modeste symbole.
D’ailleurs, c’est dès le berceau qu’on a négligé d’apprendre à
l’enfant l’usage de ses mains. En réalité, nous n’avons qu’une main.
Nous nous privons du bénéfice d’en avoir deux. Nous n’avons pas
de main gauche. Nous agissons comme si nous n’en avions pas.
Nous nous imposons d’étonnantes gymnastiques pour laisser à la
main gauche son rôle de reine fainéante. L’art de jongler à table
avec sa fourchette et son couteau est aussi curieux à observer que
difficile à exercer. Seule, la main droite règne. La mère dit à son
enfant sans réfléchir : « Ta main droite ! » A la campagne, on dit :
« Ta belle main ! » Pourquoi n’utilisons-nous pas les deux ? Pourquoi
n’entraîne-t-on pas l’enfant à les employer tour à tour à la même
besogne afin d’acquérir, par une habitude égale, une égale
habileté ?
Il y a bien d’autres traits de cette inaptitude à se servir de ses
mains et des outils qui les prolongent. On n’est pas adroit, chez les
privilégiés de la vie. Le serait-on, qu’on l’ignorerait. Comment s’en
serait-on aperçu ? Cette gaucherie nous rend pour ainsi dire
étrangers à notre propre logis et tributaires, au moindre accroc, de
tous les corps de métier. Pour poser une sonnerie, pour changer une
lampe électrique, pour remplacer un plomb qui saute, pour remonter
l’horloge, bien vite il faut faire venir un spécialiste. Le plus modeste
emballage décourage les meilleures volontés. Scier une planche,
c’est encore plus difficile que de planter un clou.
Loin de donner aux enfants le goût de l’habileté manuelle, il
semble qu’on les en ait dégoûtés. Tirer parti de ses mains, c’est une
sorte de déchéance. C’est effrayant ce que la serrurerie de Louis
XVI lui a fait du tort devant l’histoire. Quand on a dit d’un particulier
qu’il bâtit des petits ouvrages en bois découpé ou qu’il tourne des
ronds de serviette, on l’a marqué d’un signe indélébile de médiocrité.
Cela vaut pourtant mieux que de cartonner.
Et ce mépris du travail manuel ne rend pas seulement l’homme
inapte aux besognes familières. Il le prive de l’agréable en même
temps que de l’utile. Il lui défend les petits plaisirs inépuisables du
« bricolage », la joie de mettre son empreinte sur les objets qui
l’entourent. Il lui interdit la pratique de ces arts charmants qui lui
permettraient de décorer, d’embellir à peu de frais son logis et par
conséquent de s’y attacher.
Cette inaptitude, ce défaut de préparation à la vie pratique, il en
souffre dans toutes sortes de directions. Sait-il, par exemple, le prix
des choses ? J’entends le prix approximatif des choses qui ont un
cours. Savons-nous le prix moyen d’un kilo de beurre, d’un kilo de
bœuf, d’un kilo de fer ? Pourrions-nous établir le prix, même
vaguement approché, du mètre courant d’une maçonnerie
déterminée ? Cela pourrait cependant servir pour dresser un devis,
préparer un budget, ou tout simplement pour n’être pas dupe devant
une facture. Il y aurait là une vingtaine de chiffres à savoir. Ce ne
serait pas plus inutile qu’une vingtaine de dates de bataille.
On n’apprend pas à « se servir de la vie ». J’entends par là que
les enfants, dont la cervelle est bourrée, en vue des examens, de
notions dont ils n’auront jamais besoin, ne sont pas initiés à toutes
sortes de petites connaissances utiles qui rendraient la vie d’un
usage plus commode.
Ainsi, pour préciser par un exemple, entraîne-t-on un adolescent
à se servir de la poste ? A l’envoi des mandats, des différents
mandats ? A quel moment lui apprend-on les diverses manières
d’expédier un paquet, par colis postal, messageries, etc. ?
Mais, dira-t-on, il l’apprendra bien à l’user. D’abord, mieux vaut le
lui enseigner au moment où, au dire même des pédagogues, il a la
mémoire facile. Puis, dans la vie, plus tard, on n’a pas le temps.
On n’apprend pas à écrire une lettre, un télégramme, à les
composer d’avance dans sa tête, à être clair, précis, à faire tenir en
peu de mots l’essentiel, à mettre chaque chose à sa place. Les
lettres ? Nous ne savons même pas les lire. Faites l’expérience. Ou
nous sautons des mots, ou nous faussons leur sens.
On n’apprend pas à parler au téléphone, à y dire d’abord
l’important, sans bavardage préliminaire, pour le cas où la
communication viendrait à être coupée. Et toujours à être exact,
limpide, à y verser une parole dépouillée.
Ce sont de petits arts nécessaires.
En somme, qu’il s’agisse de manier le bois, de manier le fer, de
manier la plume, ou de manier l’argent, tout exige un apprentissage.
Ni l’instruction, ni l’éducation ne nous le donnent.

Les « Applications ».

L’enseignement officiel se flatte de donner une culture générale.


Mais c’est une culture sans fruit. Avec elle, on ne récolte pas. On
pioche dans le sol aride, on l’abandonne dès qu’il devient fécond.
Aussitôt que la leçon menace de devenir intéressante, de s’appliquer
à la vie, au point précis où apparaîtrait son utilité, elle s’arrête.
Cet enseignement a ses raisons de planer sur les hauteurs, de
dédaigner la terre. Il entend découvrir à l’esprit des vues plus
étendues, l’élargir et l’assouplir. Certes, une telle gymnastique doit
permettre de descendre ensuite aisément aux vulgaires
contingences. Mais le détour est singulier. On rirait d’un quidam qui
monterait en ballon pour apprendre à marcher.
Qu’arrive-t-il, en effet ? L’écolier devient étudiant, soldat, il entre
enfin dans la vie normale. Or, il n’a jamais eu le temps de prolonger
son instruction, de la compléter au point de vue pratique. Sa
mémoire a vomi les matières indigestes dont on l’avait chargée. De
tout ce qu’il apprit, rien ne lui reste.
En faut-il des exemples ? On apprend beaucoup de physique, au
lycée. Évidemment, puisqu’on en demande aux examens. On
s’étend avec complaisance sur les lois, les théories, sèchement
illustrées d’expériences classiques. Mais voici notre bachelier dans
la vie. N’eût-il, par un miracle unique, rien oublié de sa science, il
restera comme un simple sot, incapable d’une explication, d’une
clarté, devant tant de phénomènes familiers qui sont cependant de
la physique.
Sait-il pourquoi la cheminée tire mal, pourquoi la lampe file ?
Non. Il ignore même qu’il faut percer un tonneau de deux trous pour
que le liquide s’en écoule. Il ignore le fonctionnement de son
radiateur, de son ascenseur, de son chauffe-bain, qui contiennent
pourtant des menaces de danger. Bien qu’il ait la cervelle farcie des
lois d’Ampère et de Faraday, il ne sait rien de l’appareillage
électrique, sonnerie, lumière et téléphone. Bref, il ignore tout de la
physique du logis.
S’il descend dans la rue, il n’y brille pas davantage. Je le mets au
défi d’expliquer comment fonctionnent le métro, le tramway, l’horloge
électrique. Et je ne suis pas bien sûr que le capot d’une limousine ne
recèle pas pour lui du mystère. Pourquoi ? Parce que la science
officielle, dans je ne sais quel antique esprit de renoncement, de
mépris pour la vie vraie, s’est résolument arrêtée devant les
applications. Et il en est ainsi pour chaque branche de
l’enseignement. On la coupe au moment où l’on va cueillir, à son
extrémité, la fleur ou le fruit.
S’agit-il de géographie ? On s’est bourré la mémoire de
nomenclatures de fleuves, de montagnes. On a appris les noms des
comtés, duchés, principautés, de tous ces petits lambeaux de sol
que s’arrache l’ambition humaine. Bref, on est très « calé » en
géographie. Seulement, on n’a pas appris à lire la carte… J’entends
la lire pratiquement, savoir se débrouiller, s’orienter, venir en aide au
pilote, au chauffeur assis à ses côtés.
En histoire, on possède à fond les civilisations abolies, les âges
disparus. Mais on connaît fort mal son propre siècle. On sait mieux
le successeur de Louis XIV que celui de Sadi-Carnot. Je veux dire
par là qu’on ne le connaît pas d’une manière intime, familière, qui
permette de juger les événements actuels et de les relier à ceux de
la veille.
Notons en passant que dans l’éducation familiale, on tombe dans
le même travers. On va à ce qui est loin dans l’espace et le temps.
Et on ignore ce qui est proche. On ignore sa famille au-dessus de
ses grands-parents. On apprend la filiation des rois et on ne sait pas
la sienne. On ne sait pas le nom de son bisaïeul et encore moins
son métier, son œuvre sur la terre. On ignore l’histoire et le plan de
la ville qu’on habite. Et on apprend des dates de batailles et les
affluents du Danube…
On pioche l’histoire littéraire en vue des examens, mais on
n’apprend pas les noms de ces héros de Balzac, de Daudet, de
Zola, d’Anatole France, qui sont devenus, par la puissance du génie,
des entités vivantes. On apprend à peu près les noms des artistes
de la Renaissance, mais on ignore les noms de ces peintres récents
qui fondèrent des écoles et dont les toiles deviennent cependant
classiques. On n’est point apte à saisir toutes les allusions que roule
l’entretien, lorsqu’elles s’inspirent d’œuvres contemporaines. Car
c’est la dernière fleur de l’histoire et l’enseignement ne la connaît
pas.
En dessin, même chanson. Pour les concours, on apprend à
reproduire tant bien que mal les traits d’un morne Romain de plâtre,
à grand renfort d’effets d’estompe. Mais veut-on montrer à un
menuisier, à un maçon, le petit projet qu’on rêve de réaliser ?
Impossible. On ne sait pas se servir de ses doigts. On ne peut pas
les contraindre à exprimer par des traits sa pensée. Ils se dérobent.
Ils refusent. Ils trahissent. C’est toujours le résultat de
l’enseignement. Appliquer des notions de dessin à la pratique ? Fi
donc !
On devrait enseigner aux enfants un peu de modelage, leur
mettre aux mains la boulette de glaise ou de plastiline. Rien
n’accoutume mieux à pénétrer le secret des formes, des reliefs et
des contours. Mais on ne demande pas de modelage aux examens !
Tous ces reproches doivent se retourner contre ceux qui
élaborent les programmes scolaires. Pourquoi en écartent-ils ces
applications qui en apparaissent le couronnement logique ?
Pourquoi cette cassure entre l’enseignement et la vie ? Il suffirait de
jeter du lest par ailleurs, d’éliminer de vaines connaissances dont
notre mémoire fait justice.
Pour en finir avec ces lacunes des programmes officiels, notons
encore qu’on n’apprend pas l’ethnographie. Elle nous enseigne
pourtant ce merveilleux échange d’effluves entre le ciel et la terre,
qui crée les races, les faunes, les flores. Elle devrait être la préface
souriante de la géographie.
On ne donne point aux enfants, parmi les connaissances à la
base, quelques notions d’architecture. Elles leur permettraient
cependant de comprendre et de goûter ces sages leçons d’équilibre
et d’harmonie qui sont inscrites dans les lignes d’un beau
monument. Elles leur permettraient aussi de discerner le style d’un
édifice ancien, de donner un âge à ces témoins émouvants du
passé, qui nous entourent et que pourtant nous ne savons pas voir.
Enfin, on n’apprend guère d’astronomie, dans les notions
générales. Et cependant ce devrait être une connaissance à la base.
Elle est, de toutes les sciences, la plus étroitement mêlée à notre
existence. C’est elle qui règle le pendule et le calendrier. C’est elle
qui fait le jour et la nuit, la pluie et le beau temps, elle qui entraîne
autour de la terre la ronde des saisons. Les spectacles
astronomiques nous entourent : le rayon de soleil qui nous verse la
vie, le clair de lune qui nous verse la paix, les constellations qui sont
la parure de la nuit, tous les phénomènes qui frappent l’imagination,
éclipses, étoiles filantes, comètes.
Et cependant les notions acquises sur l’univers sont peu
répandues. Elles ne sont pas descendues dans les couches
profondes. Elles ne nous sont pas familières.
Il y a sans doute dans cette ignorance l’effet d’un instinct
religieux. L’astronomie ne représente pas le ciel tel que le
catholicisme l’avait organisé.
De plus, l’astronomie ouvre à l’esprit des vues dangereuses pour
l’ordre établi. Elle nous ramène à notre taille, qui est petite. Elle nous
montre combien sont mesquines nos luttes, combien sont brefs les
empires, devant l’infini de l’espace et du temps. Et c’est là le péril.
Car, prêtres et chefs d’État, pour garder leur pouvoir et mener les
foules, ont besoin d’entretenir un fanatisme, haine des peuples et
crainte de Dieu, que dissiperait, si nous réfléchissions, le clair regard
d’une étoile.
TABLE DES MATIÈRES

Préambule. — Le But et le Plan 1


PREMIÈRE PARTIE
OPINIONS
Chapitre Ier. — Le Bonheur 5
Chapitre II. — Le Temps 17
La Foi dans l’Avenir. — La Connaissance de l’Avenir. — Le
Présent vaut le Passé. — L’Héritage du Passé.
Chapitre III. — La Vie 43
La Vie en souplesse. — La Vie est complexe. — La Vie est
précaire. — L’Inutile Tristesse. — L’Harmonie dans la
Vie. — Le Plan du Réel.
Chapitre IV. — Vues Morales 67
Les Mains propres. — Le Déterminisme. — La Loi
d’Équilibre. — Le Contrôle. — La Bravoure. — La Mort.
— La Religion.
Chapitre V. — Vues Sociales 99
Altruisme. — Solidarité. — Quelques iniquités. — L’idée de
Patrie.
DEUXIÈME PARTIE
ADAPTATIONS

Вам также может понравиться