100% found this document useful (1 vote)
208 views

Download Complete Introduction to Datafication: Implement Datafication Using AI and ML Algorithms Shivakumar R. Goniwada PDF for All Chapters

Shivakumar

Uploaded by

klemetadormi
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
100% found this document useful (1 vote)
208 views

Download Complete Introduction to Datafication: Implement Datafication Using AI and ML Algorithms Shivakumar R. Goniwada PDF for All Chapters

Shivakumar

Uploaded by

klemetadormi
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 48

Download the full version of the ebook at

https://ebookmass.com

Introduction to Datafication: Implement


Datafication Using AI and ML Algorithms
Shivakumar R. Goniwada

https://ebookmass.com/product/introduction-to-
datafication-implement-datafication-using-ai-and-
ml-algorithms-shivakumar-r-goniwada/

Explore and download more ebook at https://ebookmass.com


Recommended digital products (PDF, EPUB, MOBI) that
you can download immediately if you are interested.

Introduction to Datafication: Implement Datafication Using


AI and ML Algorithms Shivakumar R. Goniwada

https://ebookmass.com/product/introduction-to-datafication-implement-
datafication-using-ai-and-ml-algorithms-shivakumar-r-goniwada/

testbankdeal.com

Introduction to Responsible AI: Implement Ethical AI Using


Python 1st Edition Manure

https://ebookmass.com/product/introduction-to-responsible-ai-
implement-ethical-ai-using-python-1st-edition-manure/

testbankdeal.com

Introduction to Unity ML-Agents: Understand the Interplay


of Neural Networks and Simulation Space Using the Unity
ML-Agents Package 1st Edition Dylan Engelbrecht
https://ebookmass.com/product/introduction-to-unity-ml-agents-
understand-the-interplay-of-neural-networks-and-simulation-space-
using-the-unity-ml-agents-package-1st-edition-dylan-engelbrecht-2/
testbankdeal.com

Introduction to Unity ML-Agents: Understand the Interplay


of Neural Networks and Simulation Space Using the Unity
ML-Agents Package 1st Edition Dylan Engelbrecht
https://ebookmass.com/product/introduction-to-unity-ml-agents-
understand-the-interplay-of-neural-networks-and-simulation-space-
using-the-unity-ml-agents-package-1st-edition-dylan-engelbrecht/
testbankdeal.com
Time Series Algorithms Recipes: Implement Machine Learning
and Deep Learning Techniques with Python Akshay R Kulkarni

https://ebookmass.com/product/time-series-algorithms-recipes-
implement-machine-learning-and-deep-learning-techniques-with-python-
akshay-r-kulkarni/
testbankdeal.com

Absolute Beginner's Guide to Algorithms: A Practical


Introduction to Data Structures and Algorithms in
JavaScript Kirupa Chinnathambi
https://ebookmass.com/product/absolute-beginners-guide-to-algorithms-
a-practical-introduction-to-data-structures-and-algorithms-in-
javascript-kirupa-chinnathambi/
testbankdeal.com

Introduction to algorithms for data mining and machine


learning Yang

https://ebookmass.com/product/introduction-to-algorithms-for-data-
mining-and-machine-learning-yang/

testbankdeal.com

Explainable AI Recipes: Implement Solutions to Model


Explainability and Interpretability with Python 1st
Edition Pradeepta Mishra
https://ebookmass.com/product/explainable-ai-recipes-implement-
solutions-to-model-explainability-and-interpretability-with-
python-1st-edition-pradeepta-mishra/
testbankdeal.com

Explainable AI Recipes: Implement Solutions to Model


Explainability and Interpretability with Python 1st
Edition Pradeepta Mishra
https://ebookmass.com/product/explainable-ai-recipes-implement-
solutions-to-model-explainability-and-interpretability-with-
python-1st-edition-pradeepta-mishra-2/
testbankdeal.com
Introduction
to Dataf ication
Implement Dataf ication Using AI
and ML Algorithms

Shivakumar R. Goniwada
Introduction to
Datafication
Implement Datafication Using
AI and ML Algorithms

Shivakumar R. Goniwada
Introduction to Datafication: Implement Datafication Using AI and
ML Algorithms
Shivakumar R. Goniwada
Gubbalala, Bangalore, Karnataka, India

ISBN-13 (pbk): 978-1-4842-9495-6 ISBN-13 (electronic): 978-1-4842-9496-3


https://doi.org/10.1007/978-1-4842-9496-3
Copyright © 2023 by Shivakumar R. Goniwada

This work is subject to copyright. All rights are reserved by the publisher, whether the whole or
part of the material is concerned, specifically the rights of translation, reprinting, reuse of
illustrations, recitation, broadcasting, reproduction on microfilms or in any other physical way,
and transmission or information storage and retrieval, electronic adaptation, computer software,
or by similar or dissimilar methodology now known or hereafter developed.
Trademarked names, logos, and images may appear in this book. Rather than use a trademark
symbol with every occurrence of a trademarked name, logo, or image we use the names, logos,
and images only in an editorial fashion and to the benefit of the trademark owner, with no
intention of infringement of the trademark.
The use in this publication of trade names, trademarks, service marks, and similar terms, even if
they are not identified as such, is not to be taken as an expression of opinion as to whether or not
they are subject to proprietary rights.
While the advice and information in this book are believed to be true and accurate at the date of
publication, neither the authors nor the editors nor the publisher can accept any legal
responsibility for any errors or omissions that may be made. The publisher makes no warranty,
express or implied, with respect to the material contained herein.
Managing Director, Apress Media LLC: Welmoed Spahr
Acquisitions Editor: Celestin Suresh John
Development Editor: Laura Berendson
Coordinating Editor: Mark Powers
Copy Editor: April Rondeau
Cover designed by eStudioCalamar
Cover image by Pawel Czerwinsk on Unsplash (www.unsplash.com)
Distributed to the book trade worldwide by Apress Media, LLC, 1 New York Plaza, New York, NY
10004, U.S.A. Phone 1-800-SPRINGER, fax (201) 348-4505, email orders-ny@springer-sbm.com,
or visit www.springeronline.com. Apress Media, LLC is a California LLC and the sole member
(owner) is Springer Science+Business Media Finance Inc. (SSBM Finance Inc.). SSBM Finance
Inc. is a Delaware corporation.
For information on translations, please e-mail booktranslations@springernature.com;
for reprint, paperback, or audio rights, please e-mail bookpermissions@springernature.com.
Apress titles may be purchased in bulk for academic, corporate, or promotional use. eBook
versions and licenses are also available for most titles. For more information, reference our Print
and eBook Bulk Sales web page at http://www.apress.com/bulk-sales.
Any source code or other supplementary material referenced by the author in this book is
available to readers on GitHub (https://github.com/Apress). For more detailed information,
please visit http://www.apress.com/source-code.
Printed on acid-free paper
This book is dedicated to those who may need access to the
resources and opportunities many take for granted. May
this book serve as a reminder that knowledge and learning
are powerful tools that can transform lives and create new
opportunities for those who seek them.
Table of Contents
About the Author�������������������������������������������������������������������������������xiii

About the Technical Reviewer������������������������������������������������������������xv

Acknowledgments����������������������������������������������������������������������������xvii

Introduction���������������������������������������������������������������������������������������xix

Chapter 1: Introduction to Datafication������������������������������������������������1


What Is Datafication?��������������������������������������������������������������������������������������������2
Why Is Datafication Important?�����������������������������������������������������������������������3
Data for Datafication���������������������������������������������������������������������������������������������4
Datafication Steps�������������������������������������������������������������������������������������������5
Digitization vs. Datafication����������������������������������������������������������������������������������6
Types of Data in Datafication��������������������������������������������������������������������������������7
Elements of Datafication���������������������������������������������������������������������������������8
Data Harvesting�����������������������������������������������������������������������������������������������9
Data Curation�������������������������������������������������������������������������������������������������10
Data Storage��������������������������������������������������������������������������������������������������11
Data Analysis�������������������������������������������������������������������������������������������������12
Cloud Computing�������������������������������������������������������������������������������������������13
Datafication Across Industries����������������������������������������������������������������������������13
Summary������������������������������������������������������������������������������������������������������������14

v
Table of Contents

Chapter 2: Datafication Principles and Patterns��������������������������������15


What Are Architecture Principles?����������������������������������������������������������������������16
Datafication Principles����������������������������������������������������������������������������������������16
Data Integration Principle������������������������������������������������������������������������������17
Data Quality Principle������������������������������������������������������������������������������������20
Data Governance Principles��������������������������������������������������������������������������22
Data Is an Asset���������������������������������������������������������������������������������������������23
Data Is Shared�����������������������������������������������������������������������������������������������24
Data Trustee��������������������������������������������������������������������������������������������������24
Ethical Principle���������������������������������������������������������������������������������������������25
Security by Design Principle��������������������������������������������������������������������������27
Datafication Patterns������������������������������������������������������������������������������������������29
Data Partitioning Pattern�������������������������������������������������������������������������������30
Data Replication��������������������������������������������������������������������������������������������32
Stream Processing����������������������������������������������������������������������������������������33
Change Data Capture (CDC)���������������������������������������������������������������������������35
Data Mesh�����������������������������������������������������������������������������������������������������37
Machine Learning Patterns���������������������������������������������������������������������������38
Summary������������������������������������������������������������������������������������������������������������66

Chapter 3: Datafication Analytics�������������������������������������������������������67


Introduction to Data Analytics�����������������������������������������������������������������������������68
What Is Analytics?�����������������������������������������������������������������������������������������68
Big Data and Data Science����������������������������������������������������������������������������68
Datafication Analytical Models����������������������������������������������������������������������������72
Content-Based Analytics�������������������������������������������������������������������������������72
Data Mining���������������������������������������������������������������������������������������������������72
Text Analytics�������������������������������������������������������������������������������������������������73

vi
Table of Contents

Sentiment Analytics���������������������������������������������������������������������������������������73
Audio Analytics����������������������������������������������������������������������������������������������75
Video Analytics����������������������������������������������������������������������������������������������76
Comparison in Analytics��������������������������������������������������������������������������������76
Datafication Metrics��������������������������������������������������������������������������������������������77
Datafication Analysis�������������������������������������������������������������������������������������������79
Data Sources�������������������������������������������������������������������������������������������������80
Data Gathering�����������������������������������������������������������������������������������������������83
Introduction to Algorithms����������������������������������������������������������������������������������83
Supervised Machine Learning�����������������������������������������������������������������������84
Linear Regression������������������������������������������������������������������������������������������86
Support Vector Machines (SVM)��������������������������������������������������������������������88
Decision Trees�����������������������������������������������������������������������������������������������89
Neural Networks��������������������������������������������������������������������������������������������91
Naïve Bayes Algorithm����������������������������������������������������������������������������������93
K-Nearest Neighbor (KNN) Algorithm������������������������������������������������������������94
Random Forest����������������������������������������������������������������������������������������������95
Unsupervised Machine Learning�������������������������������������������������������������������������96
Clustering������������������������������������������������������������������������������������������������������97
Association Rule Learning�����������������������������������������������������������������������������98
Dimensionality Reduction������������������������������������������������������������������������������98
Reinforcement Machine Learning�����������������������������������������������������������������������99
Summary����������������������������������������������������������������������������������������������������������100

Chapter 4: Datafication Data-Sharing Pipeline���������������������������������101


Introduction to Data-Sharing Pipelines�������������������������������������������������������������102
Steps in Data Sharing����������������������������������������������������������������������������������103
Data-Sharing Process����������������������������������������������������������������������������������104

vii
Table of Contents

Data-Sharing Decisions�������������������������������������������������������������������������������106
Data-Sharing Styles������������������������������������������������������������������������������������������108
Unidirectional, Asynchronous Push Integration Style����������������������������������108
Real-Time and Event-based Integration Style���������������������������������������������109
Bidirectional, Synchronous, API-led Integration Style���������������������������������110
Mediated Data Exchange with an Event-­Driven Approach��������������������������111
Designing a Data-Sharing Pipeline�������������������������������������������������������������������112
Types of Data Pipeline���������������������������������������������������������������������������������������118
Batch Processing�����������������������������������������������������������������������������������������118
Extract, Transform, and Load Data Pipeline (ETL)����������������������������������������119
Extract, Load, and Transform Data Pipeline (ELT)����������������������������������������120
Streaming and Event Processing�����������������������������������������������������������������121
Change Data Capture (CDC)�������������������������������������������������������������������������123
Lambda Data Pipeline Architecture�������������������������������������������������������������124
Kappa Data Pipeline Architecture����������������������������������������������������������������126
Data as a Service (DaaS)����������������������������������������������������������������������������������127
Data Lineage�����������������������������������������������������������������������������������������������������129
Data Quality�������������������������������������������������������������������������������������������������������130
Data Integration Governance����������������������������������������������������������������������������132
Summary����������������������������������������������������������������������������������������������������������133

Chapter 5: Data Analysis������������������������������������������������������������������135


Introduction to Data Analysis����������������������������������������������������������������������������136
Data Analysis Steps������������������������������������������������������������������������������������������137
Prepare a Question��������������������������������������������������������������������������������������138
Prepare Cleansed Data��������������������������������������������������������������������������������143
Identify a Relevant Algorithm����������������������������������������������������������������������144
Build a Statistical Model������������������������������������������������������������������������������146

viii
Table of Contents

Match Result�����������������������������������������������������������������������������������������������159
Create an Analysis Report���������������������������������������������������������������������������161
Summary����������������������������������������������������������������������������������������������������������163

Chapter 6: Sentiment Analysis���������������������������������������������������������165


Introduction to Sentiment Analysis�������������������������������������������������������������������166
Use of Sentiment Analysis���������������������������������������������������������������������������167
Types of Sentiment Analysis�����������������������������������������������������������������������������168
Document-Level Sentiment Analysis�����������������������������������������������������������168
Aspect-Based Sentiment Analysis���������������������������������������������������������������170
Multilingual Sentiment Analysis������������������������������������������������������������������171
Pros and Cons of Sentiment Analysis���������������������������������������������������������������173
Pre-Processing of Data�������������������������������������������������������������������������������������174
Tokenization������������������������������������������������������������������������������������������������174
Stop Words Removal������������������������������������������������������������������������������������175
Stemming and Lemmatization���������������������������������������������������������������������175
Handling Negation and Sarcasm�����������������������������������������������������������������176
Rule-Based Sentiment Analysis������������������������������������������������������������������������177
Lexicon-Based Approaches�������������������������������������������������������������������������178
Sentiment Dictionaries��������������������������������������������������������������������������������179
Pros and Cons of Rule-Based Approaches��������������������������������������������������179
Machine Learning–Based Sentiment Analysis��������������������������������������������������180
Supervised Learning Techniques�����������������������������������������������������������������180
Unsupervised Learning Techniques�������������������������������������������������������������182
Pros and Cons of the Machine Learning–Based Approach��������������������������182
Best Practices for Sentiment Analysis��������������������������������������������������������������183
Summary����������������������������������������������������������������������������������������������������������183

ix
Visit https://ebookmass.com
now to explore a rich
collection of eBooks and enjoy
exciting offers!
Table of Contents

Chapter 7: Behavioral Analysis��������������������������������������������������������185


Introduction to Behavioral Analytics�����������������������������������������������������������������185
Data Collection��������������������������������������������������������������������������������������������������188
Behavioral Science�������������������������������������������������������������������������������������������189
Importance of Behavioral Science��������������������������������������������������������������������191
How Behavioral Analysis and Analytics Are Processed�������������������������������������191
Cognitive Theory and Analytics��������������������������������������������������������������������192
Biological Theories and Analytics����������������������������������������������������������������193
Integrative Model�����������������������������������������������������������������������������������������194
Behavioral Analysis Methods����������������������������������������������������������������������������194
Funnel Analysis�������������������������������������������������������������������������������������������195
Cohort Analysis��������������������������������������������������������������������������������������������195
Customer Lifetime Value (CLV)���������������������������������������������������������������������196
Churn Analysis���������������������������������������������������������������������������������������������196
Behavioral Segmentation����������������������������������������������������������������������������������197
Analyzing Behavioral Analysis���������������������������������������������������������������������������197
Descriptive Analysis with Regression����������������������������������������������������������197
Causal Analysis with Regression�����������������������������������������������������������������203
Causal Analysis with Experimental Design��������������������������������������������������210
Challenges and Limitations of Behavioral Analysis�������������������������������������������212
Summary����������������������������������������������������������������������������������������������������������213

Chapter 8: Datafication Engineering�������������������������������������������������215


Steps of AI and ML Engineering������������������������������������������������������������������������215
AI and ML Development������������������������������������������������������������������������������������217
Understanding the Problem to Be Solved����������������������������������������������������217
Choosing the Appropriate Model�����������������������������������������������������������������218
Preparing and Cleaning Data�����������������������������������������������������������������������220

x
Table of Contents

Feature Selection and Engineering�������������������������������������������������������������221


Model Training and Optimization�����������������������������������������������������������������222
AI and ML Testing����������������������������������������������������������������������������������������������223
Unit Testing��������������������������������������������������������������������������������������������������223
Integration Testing���������������������������������������������������������������������������������������225
Non-Functional Testing��������������������������������������������������������������������������������225
Performance������������������������������������������������������������������������������������������������227
Security Testing�������������������������������������������������������������������������������������������228
DataOps������������������������������������������������������������������������������������������������������������230
MLOps���������������������������������������������������������������������������������������������������������������233
Summary����������������������������������������������������������������������������������������������������������235

Chapter 9: Datafication Governance�������������������������������������������������237


Importance of Datafication Governance������������������������������������������������������������238
Why Is Datafication Governance Required?������������������������������������������������������239
Datafication Governance Framework����������������������������������������������������������������239
Oversight and Accountability�����������������������������������������������������������������������240
Model Risk, Risk Assessment, and Regulatory Guidance����������������������������241
Roles and Responsibilities���������������������������������������������������������������������������244
Monitoring and Reporting����������������������������������������������������������������������������245
Datafication Governance Guidelines and Principles������������������������������������245
Ethical and Legal Aspects����������������������������������������������������������������������������247
Datafication Governance Action Framework�����������������������������������������������������247
Datafication Governance Challenges����������������������������������������������������������������248
Summary����������������������������������������������������������������������������������������������������������250

xi
Table of Contents

Chapter 10: Datafication Security����������������������������������������������������251


Introduction to Datafication Security����������������������������������������������������������������251
Datafication Security Framework���������������������������������������������������������������������253
Regulations��������������������������������������������������������������������������������������������������253
Organization Concerns��������������������������������������������������������������������������������256
Governance and Compliance�����������������������������������������������������������������������257
Business Access Needs�������������������������������������������������������������������������������259
Datafication Security Measures������������������������������������������������������������������������260
Encryption���������������������������������������������������������������������������������������������������260
Data Masking����������������������������������������������������������������������������������������������261
Penetration Testing��������������������������������������������������������������������������������������261
Data Security Restrictions���������������������������������������������������������������������������261
Summary����������������������������������������������������������������������������������������������������������262

Index�������������������������������������������������������������������������������������������������263

xii
About the Author
Shivakumar R. Goniwada is an author,
inventor, chief enterprise architect, and
technology leader with over 23 years of
experience architecting cloud-native, data
analytics, and event-driven systems. He works
in Accenture and leads a highly experienced
technology enterprise and cloud architect
team. Over the years, he has led many
complex projects across industries and the
globe. He has ten software patents in cloud
computing, polyglot architecture, software
engineering, data analytics, and IoT. He authored a book on Cloud Native
Architecture and Design. He is a speaker at multiple global and in-house
conferences. Shivakumar has earned Master Technology Architecture,
Google Professional, AWS, and data science certifications. He completed
his executive MBA at the MIT Sloan School of Management.

xiii
About the Technical Reviewer
Dr. Mohan H M is a technical program
manager and research engineer (HMI, AI/
ML) at Digital Shark Technology, supporting
the research and development of new
products, promotion of existing products, and
investigation of new applications for existing
products.
In the past, he has worked as a technical education evangelist and
has traveled extensively all over India delivering training on artificial
intelligence, embedded systems, and Internet of Things (IoT) to research
scholars and faculties in engineering colleges under the MeitY scheme. In
the past, he has worked as an assistant professor at the T. John Institute of
Technology. Mohan holds a master’s degree in embedded systems and the
VLSI design field from Visvesvaraya Technological University. He earned
his Ph.D. on the topic of non-invasive myocardial infarction prediction
using computational intelligence techniques from the same university.
He has been a peer reviewer for technical publications, including BMC
Informatics, Springer Nature, Scientific Reports, and more. His research
interests include computer vision, IoT, and biomedical signal processing.

xv
Acknowledgments
Many thanks to my mother, S. Jayamma, and late father, G.M. Rudrapp,
who taught me the value of hard work, and to my wife, Nirmala, and
daughter, Neeharika, without whom I wouldn’t have been able to work
long hours into the night every day of the week. Last but not least, I’d like
to thank my friends, colleagues, and mentors at Mphasis, Accenture, and
other corporations who have guided me throughout my career.
Thank you also to my colleagues Mark Powers, Celestin Suresh John,
Shobana Srinivasan, and other Apress team members for allowing me to
work with you and Apress, and to all who have helped this book become
a reality. Thank you for my mentors Bert Hooyman and Abubacker
Mohamed and thanks for my colleague Raghu Pasupuleti for providing
key inputs.

xvii
Introduction
The motivation to write this book goes back to the words of Swami
Vivekananda: “Everything is easy when you are busy, but nothing is easy
when you are lazy,” and “Take up on one idea, make that one idea your life,
dream of it, think of it, live on that idea.”
Data is increasingly shaping the world in which we live. The
proliferation of digital devices, social media platforms, and the Internet
of Things (IoT) has led to an explosion in the amount of data generated
daily. This has created new opportunities and challenges for everyone
as we seek to harness the power of data to drive innovation and improve
decision making.
This book is a comprehensive guide to the world of datafication and its
development, governing process, and security. We explore fundamental
principles and patterns, analysis frameworks, techniques to implement
artificial intelligence (AI) and machine learning (ML) algorithms, models,
and regulations to govern datafication systems.
We will start by exploring the basics of datafication and how it
transforms the world, and then delve into the fundamental principles and
patterns and how data are ingested and processed with an extensive data
analysis framework. We will examine the ethics, regulations, and security
of datafication in a real scenario.
Throughout the book, we will use real-world examples and case
studies to illustrate key concepts and techniques and provide practical
guidance in sentiment and behavior analysis.
Whether you are a student, analyst, engineer, technologist, or someone
simply interested in the world of datafication, this book will provide you
with a comprehensive understanding of datafication.

xix
CHAPTER 1

Introduction to
Datafication
A comprehensive look at datafication must first begin with its definition.
This chapter provides that and details why datafication plays a significant
role in modern business and data architecture.
Datafication has profoundly impacted many aspects of society,
including business, finance, health care, politics, and education. It
has enabled companies to gain insights into consumer behavior and
preferences, health care to improve patient outcomes, finance to enhance
consumer experience and risk and compliance, and educators to
personalize learning experiences.
Datafication helps you to take facts and statistics gained from myriad
sources and give them domain-specific context, aggregating and making
them accessible for use in strategy building and decision making.
This improves sales and profiles, health results, and influence over
public policy.
Datafication is the process of turning data into a usable and accessible
format and involves the following:

• Collecting data from myriad sources

• Organizing and cleaning the data

© Shivakumar R. Goniwada 2023 1


S. R. Goniwada, Introduction to Datafication,
https://doi.org/10.1007/978-1-4842-9496-3_1
Chapter 1 Introduction to Datafication

• Making it available for analysis to use

• Analyzing the data by using artificial intelligence (AL)


and machine learning (ML) models

Developing a deeper understanding of the datafication process and


its implications for individuals and society is essential. This requires a
multidisciplinary approach that brings together stakeholders from various
fields to explore the challenges and opportunities of datafication and to
develop ethical and effective strategies for managing and utilizing data in
the digital age.
This chapter will drill down into the particulars and explain how
datafication benefits the across industry. We will cover the following topics:

• What is datafication?

• How is datafication embraced across industries?

• Why is datafication important?

• What are elements of datafication?

What Is Datafication?
Datafication involves using digital technologies such as the cloud, data
products, and AI/ML algorithms to collect and process vast amounts of
data on human behavior, preferences, and activities.
Datafication converts various forms of information, such as texts,
images, audio recordings, comments, claps, and likes/dislikes to curated
format, and that data can be easily analyzed and processed by multiple
algorithms. This involves extracting relevant data from social media,
hospitals, and Internet of Things (IoT). These data are organized into
a consistent format and stored in a way that makes them accessible for
further analysis.

2
Visit https://ebookmass.com
now to explore a rich
collection of eBooks and enjoy
exciting offers!
Chapter 1 Introduction to Datafication

Everything around us, from finance, medical, construction, and social


media to industrial equipment, is converted into data. For example,
you create data every time you post to social media platforms such
as WhatsApp, Instagram, Twitter, or Facebook, and any time you join
meetings in Zoom or Google Meet, or even when you walk past a CCTV
camera while crossing the street. The notion differs from digitization, as
datafication is much broader than digitization.
Datafication can help you to understand the world more fully than
ever before. New cloud technologies are available to ingest, store, process,
and analyze data. For example, marketing companies use Facebook and
Twitter data to determine and predict sales. Digital Twin uses industrial
equipment behavior to analyze the behavior of the machine.
Datafication also raises important questions about privacy, security,
and ethics. The collection and use of personal data can infringe on
individual rights and privacy, and there is a need for greater transparency
and accountability in how data are collected and used. Overall,
datafication represents a significant shift in how we live, work, and act.

Why Is Datafication Important?


Datafication enables organizations to transform raw data into a format
that can be analyzed and used to gain insights, make informed business
decisions, improve patients’ health, and streamline supply-chain
management. This is crucial for every industry to improve in today’s
data-driven world. By using the processed data, organizations can identify
trends, gain insight into customer behavior, and discover other key
performance indicators using analytics tools and algorithms.

3
Chapter 1 Introduction to Datafication

Data for Datafication


Data is available everywhere, but what type of data you require for analysis
in datafication is crucial and helps you to understand hidden values
and challenges. Data can come from a wide range of sources, but the
specific data set will depend on the particular context and the goal of the
datafication process.
Today, data are created not only by people and their activities in the
world, but also by machines. The amount of data produced is almost out of
control.
For example:

• Social media data such as posts and comments


are structured data that can be easily analyzed for
sentiment and behavior. This involves extracting text
from the posts and comments and identifying and
categorizing any images, comments, or other media
that are part of it.

• In the medical context, datafication might involve


converting medical records and other patient
information into structured data that can be used
for analysis and research. This involves extracting
information about diagnoses, treatments, and other
medical reports.

• In the e-commerce context, datafication might


involve converting users’ statistics and other purchase
information into structured data that can be used for
analysis and recommendations.
In summary, data can come from a wide range of sources, and how it
is used will depend on the specific context and goals of the datafication
process.

4
Random documents with unrelated
content Scribd suggests to you:
kohtaan. Siitä on todistuksena m.m. Prahan Nadrazi Wilsonovo
(Wilsonin asema), joksi entinen Keisari Franz Josefin asema on
kastettu. Sen kansallistuntoon saattaa sisältyä jokunen määrä
ylpeyttä ja itsekkyyttä, kuten on laita meillä muillakin pienillä
vastaleivotuilla valtioilla, mutta sisäisesti vallitsee maassa
demokratia. Prahalaiset istuvat mielellään oluttuvissa —
hienoimmissa ravintoloissa näyttää olevan huomattavasti vähemmän
väkeä, — pohtivat politiikkaa ja juttelevat muista asioista. Siellä
istuvat papat ja mammat oluttuopin ääressä ja pelaavat korttia.
Usein käy tämä peli rahan päältä ja niin omituisilla korteilla, että
meikäläinen niistä ei ymmärrä mitään. Mitä heissä lie vinksin-vonksin
kuvioita, ja muutenkin ovat ne kooltaan hirmuisen suuret. Niillä voisi
vieras helposti saada pietin nahkaansa. Oluttupaan saattaa astua
verraten korkea-arvoinen upseeri, turista ukkojen kanssa päivän
kysymyksistä, lukea vapaamielisiä lehtiä, ja istua lopuksi
korttipöytään vertaisena toisten kanssa. Luultavasti vallitsee siis
tämän maan armeijassa hiukan toisenlainen henki kuin moniaitten
muitten tasavaltani upseereissa, joitten kansan keskuuteen
laskeutuminen merkitsisi kuolemansyntiä.

Praha on miellyttävä, siisti ja kaunis — joku on sen laskenut


neljänneksi maailman kauneimpien kaupunkien joukossa. Miten nyt
lienee senkään asian laita? Se laskija on tuskin muistanut, että
maanpallolla on sellainenkin kaupunki, jonka nimi on Helsinki. Mutta
kiitos ja kunnia Prahallekin, se on meidän Helsinkiämme verrempi
pinta-alaltaan ja väkiluvultaan. Ja siellä on Suomella erinomainen
edustus. Sen voin vakuuttaa omasta kokemuksestani. Minulta näet
loppuivat rahat Prahassa. Eipä silti eikä sen vuoksi, ettei niitä olisi
ollut pankissa matkakreditiivillä, mutta sattui olemaan juhlanaatto ja
pankit suljettuina. Minä onneton en osannut ottaa sitä seikkaa
huomioon, ja niin minä kävelin helluntain aattona jokseenkin
nurrumielisenä yksi ainoa viisikruunuinen taskussani. Se ei ollut
paljon, ja poliisi, jolta asiaa tiedustelin, antoi sen lohdullisen
vastauksen, että tiistaina ne pankit avataan — ja nyt on lauantai.
Mitäpä siinä muuta kuin perkaamaan puhelinluettelosta esiin
Suomen tasavallan edustusta. Löysin konsulaatin, menin sinne,
mutta sekin piti pyhää. Hain sitten konsulin yksityisasunnon
osoitteen, kaartelin kartan mukaan hänen asunnolleen, ja tapasin
erinomaisen hienon miehen, joka arvelematta asetti lompakkonsa
käytettäväkseni. Pääkonsulin nimi on Prokoj Sedlák, ulkomuodoltaan
ja käytökseltään todellinen gentlemanni, joka kohteli minua — ei
tuhlaajapoikana, vaan satunnaisesti rahapulaan joutuneena hänen
edustamansa maan täysivaltaisena kansalaisena. Ollapa meillä joka
paikassa sellainen sivistynyt ja ymmärtävä edustaja, niin tuskinpa
tarvitseisi hätääntyneen kansalaisen yrittää samaa temppua kuin
muuan suomalainen laulaja, jonka kerran kerrotaan heittäytyneen
erään lähetystösihteerin virkahuoneen brysselinmatolle pitkäkseen ja
sanoneen, että tästä ei nousta, ellei apua tule. No, eihän sitä nyt voi
vaatia, että jokaista kulkijainta olisi autettava, mutta kunnon
kansalainen olisi sentään päästettävä pulasta.

Tarvinneeko minun sanoa, että me olemme sujut nyt konsuli


Sedlákin kanssa — rahallisesti. Kiitollisuuden velassa minä sentään
tunnen vieläkin olevani. Rahattomuus ei näet ole mikään ilo
kotioloissakaan; vieraalla maalla se tahtoo tehdä pyöreästäkin
naamasta pitkulaisen.
IX.

VARSOVAN KAUTTA KOTIA KOHTI.

Tällä Tshekko-Slovakillakin tuntuu olevan valtakuntaa koko riskisti.


Eihän se kyllä vielä mitään merkitse meihin verrattuna, sillä
kuinkahan moni tässä Europassa kykenee meidän kanssamme
kilvoittelemaan pinta-aloissa, kun vain Herra siunaisi meille sitä
nuppilukua runsaammin. Mutta aika suikale on ukko Mazarykilläkin
maata tänne Puolaan päin. Juna mennä huilottaa hyvää vauhtia, ja
sittenkin sitä piisaa lähemmä puoleksi vuorokaudeksi. Vaunutkin ovat
tasakulkuisia, mukavia vehkeitä, vanhan keisarillisen Itävalta-Unkarin
pesänselvityksestä saatua kavetta. Maa ei ole kovin tiheään asuttua,
joten kansan sopii vielä hyvällä omallatunnolla täyttää vanhaa
lisääntymiskäskyä.

Täällä vilisee ennestään tuttuja paikkoja, mutta asemien nimet on


uusi isäntä vängännyt omalle kielelleen. Niin pitääkin! Oikeastaan
olisi meidänkin päästävä kokonaan kaksikielisyydestä, sillä se
synnyttää ulkomailla vain ilkeää sekaannusta. Tapaan tässä juuri
erään ranskalaisen, joka liikeasioissa läpi Europan matkustaessaan
kuuluu poikkeavan Suomeenkin. Hänellä on pitkä lista Suomen
paikkakuntien nimiä, ja kaikki ne ovat yksinomaan ruotsinkielisiä.
Muutamia niistä ei hän saa millään ilveellä suustansa ulos, ja
kirjoitettuinakin ne ovat saaneet varsin hullunkurisen muodon.
Porista syntyy meillä pitkä keskustelu. Björneborg on hänelle aivan
mahdoton lausua, ja kun minä sanon sen suomalaisen nimen,
ääntää hän sen oikein, lukuunottamatta korkoa, joka tietysti
vilskahtaa viimeiselle tavulle. Mutta se nyt ei ole iso vika sen
siansaksan rinnalla, jonka hän sylkee ulos yrittäessään sanoa
ruotsalaista nimeä. Sama on laita useitten muitten paikan nimien.
Eiköhän jo olisi korkea aika saada Suomen kansan suuren
enemmistön kieli oikeuksiinsa maan rajojen ulkopuolellakin? Mitenkä
menettelevät tässä suhteessa lähettiläät ja konsulit?

Nyt tullaan Puolan rajalle, ja siinä alkaa minusta tuntua vanhaa


»ryssän hajua». Asema on vanha venäläinen, jonka raudalla
aidattujen kujien lävitse minä ennen muistan kantaneeni
matkalaukkujani tsaari-vainaan santarmien nokan editse uteliaitten
tullimiesten tutkittaviksi. Kaikki on osapuilleen entisellään. Venäläisiä
santarmeja ei tietysti näy, mutta puolalainenkin passintarkastaja on
hampaisiin asti aseissa. Tullitarkastus toimitetaan kyllä junassa,
mutta on perinpohjaisempi kuin missään muualla tähän saakka.
Vaikuttaako siihen äskeinen vallankaappaus, vai onko tämä tavallista
menoa? Kukapa hänen niin tarkalleen tietää, vaikka kyllä kai Puola
lienee kaikista Venäjästä eronneista valtioista militaristisin. Sitäpaitsi
täytyy sen jollain tavoin painostaa uutta suurvalta-asemaansa.

Venäläinen kirjailija Aleksander Kuprin kerran viisasteli, että


Europpa alkaa Varsovasta. Sen muka parhaiten tuntee junien
kulusta, joka mainitusta kaupungista lähtien on täsmällisempää kuin
yleensä Venäjän rautateillä. Minä puolestani sanoisin, että
venäläisyys alkaa Puolan rajalta, sikäli kun ollaan tulossa Europasta.
Puolassa näet kulkee vaunujen lävitse senkin seitsemän
nappilakkista, ja kaikki näyttävät tykkäävän varsin pahaa, ellet
jokaisen kouraan lykkää rahaa. Jokainen junamies katsoo pyhäksi
oikeudekseen saada roponsa, muuten näyttää hän mörkkiä naamaa,
ja vastaa sinulle, jos on häneltä pakko jotakin tiedustaa, ilkeästi
älähtämällä.

Varsovan asemalla vetelehtii kurjia ja rääsyisiä olentoja, kuten


ennenkin. Hotellin edeskäypä ei tunnu olevan erikoisen lipevä
ammatissaan.

— Saisikohan halvan kahdenhengen huoneen, kysyn minä


totuttuun tapaani.

Muualla hotelleissa oli aina koetettu olla matkustajan mieliksi,


mutta tämä mies vastaa olkapäitään ryssän tavoin kohottaen ja
käsiään levittäen:

— A jokainen halpaa tahtoo, mistä kaikille riittää.

— No, antakaa sitten kallis.

Onkin sillä huoneella hintaa, kaikkine monimutkaisine veroineen


lähemmä sata markkaa Suomen rahassa. Eikä tuo ole huonetta
kummempi, pikemmin yksinkertainen ja vaatimaton. Sitten
meinaavat ne tehdä meille jutkun jo kohta ensimmäisenä päivänä.
Kävelyltä kotiin tullessamme ilmoittaa edeskäypä:

— Teillehän on sattunut siellä ylhäällä onnettomuus…

— Mikä onnettomuus?

— Olette särkeneet pesualtaan… Tirehtööri on juuri


tarkastamassa…
— Se nyt on varsin vale… Jos on jotain rikki, niin itse te juupelit
olette särkeneet… Tänne se tirehtööri…

Me löydämme hänet oman kerroksemme käytävältä, talutamme


hänet hiukan kovakouraisesti huoneeseemme, ja käskemme näyttää,
missä se vika oikein on.

Eihän sitä ole missään. Tirehtööri sanoo kuivasti, että slava bohu,
kun ei ole teillä, se on kai sitten jossakin muualla.

Sellaisia hälyytyksiä ne pojat toimeenpanevat. Mutta kylläpähän


ovat kaikki taas pois lähtiessä kiikkerinä kurottamassa käsiään
juomarahojen perään. Me emme ole nähneet muita palvelijoita kuin
sen edeskäyvän ja punapaitaisen Iivanan, joka meitä pölyistä
puhdisteli, mutta jo niitä lähdön hetkellä kihisee ympärillä. Muuan
paksu siivoojamatamikin tulee ihmettelemään, että vastako herrat
niin myöhään lähtevät, ja minä kun juuri pääsen vapaaksi… Mikäpä
siinä auttaa muuta kuin nikkeliä kouraan, jotta toinen voi hyvällä
omallatunnolla lähteä nauttimaan vapaudestaan.

Minua ei miellytä koko tämä Varsova. Kaikki ihmiset täällä ovat


jollakin tavoin kyllästyneen ja myrtyneen näköisiä. Ja missä ovat ne
Varsovan kauniit naiset? Me koetamme Juhanan kanssa kulkea koko
sunnuntaipäivän kaikkein vilkasliikkeisimmillä paikoilla, mutta eihän
niitä näy. Venäjällä ennen kehuttiin varsovattaria maailman
kauneimmiksi naisiksi pariisittarien jälkeen. He kuuluivat vain olleen
yleensä vesikauhuisia. Kerrottiin näet, että nuori puolatar kysyi
tavallisesti äidiltään baaleihin lähdettäessä:

— Mamma, otanko minä tänään vähän vai paljon dekolteeratun


(avokaulaisen) leningin?
Vastauksesta riippui, mihin saakka nuori neiti pesi kaulansa.

Etelässä me toki välistä vedimme huomiota puoleemme Juhanan


pellavatukalla, mutta täällä meihin tuskin vilkaistaankaan. Vielä
Pragissakin tuli eräässä ravintolassa tarjoilijatar kysymään, saisiko
hän koettaa Jussin tukkaa. »Kun herralla on niin valkeat hiukset»,
sanoi hän jatkaen minun puoleeni kääntyen: »Minkäsnäköiset teillä
ovat olleet?»… Hävytön letukka! Että voikin kysellä tuollaisia
mieheltä, joka katsoo karvaisuuden edustavan meissä apina-aikain
perintöä, ja olevan sen vuoksi sopimattoman sivistyneelle
mieshenkilölle.

Mutta hyvää ruokaa tämä Varsova tarjoaa, ja paljon. Kansa näkyy


itsekin syövän vahvasti ja politikoivan yhtä tukevasti. Äskenhän ne
juuri politikoivat oikein pyssyjen kanssa, ja mikäli innokkaista
keskusteluista saattaa päättää, voivat ne vieläkin tarttua kättä
pitempään.

Ja Israelin lapsia on Varsovassa eri tavalla. Tämä on vanhaa


tsaarin aikuista juutalaisten asuma-aluetta. Silloin ei mainittua
kansallisuutta päästetty iso-venäläisten keskuuteen, vaan tungettiin
se länsi-rajan puolelle vierasheimoisten kiusaksi. Juutalaiset ovat siis
jääneet puolalaisille ikäänkuin perinnöksi, ja nämäkin lienevät
vanhaan venäläiseen tapaan järjestäneet toisinaan pogromeja.
Juutalaisilla on Varsovassa kokonainen oma kaupunginosansa, jossa
näkee sekä puvultaan että ulkomuodoltaan oikeita Mooseksia. Meillä
tavattavat juutalaiset ovat herrasväkeä, ponssareita. Varsovassa
asuu juutalainen köyhälistö — ja levittää ympärilleen vielä
»makeampaa» tuoksua kuin ryssä. Siellä nähdään, että »tasan ei
käy onnen lahjat» juutalaistenkaan keskuudessa, kuten yleensä
luullaan, vaan sielläkin »toinen rikas, arvoss' onpi; toinen köyhä
arvoton».

Nykyisen Varsovan jättää mielihyvin; siellä tuntuu ilma jollakin


tavoin painostavalta. Se suurvaltana oleminenko niin lie jähmettänyt
ainakin operetista tunnetun vilkkaan puolalaisen veren? Kunhan vain
ei menisi lopulta operetiksi koko huusholli?

Pohjois-Puolassa alkavat maisemat muuttua yhä kotoisemmiksi.


Täällä jo voisi muuten elää ihan meikäläisissä tunnelmissa, mutta
Vilnon seutu ja yleensä Liettuan raja näyttää liiaksi sotaiselta.
Asemilla ei ole juuri muita kuin sotilaita, ja metsissäkin harhailee
ratsuväenosastoja. Se on jälleen sitä suurvaltana olemista. Riistetään
itseään pienemmältä väkivallalla lämpäre maata, ja sitten vahditaan
rajaa kuin ketunpesää. Ja jokainen rajan toiselle puolelle matkustava
ulkomaalainenkin tutkitaan täällä kuin varastetun tavaran
salaamisesta epäiltynä.

Latvialaisella raja-asemalla, Zemgalessa, onneksi palaa rauha


maahan. Pari univormupukuista rajavartijaa siellä kyllä on passeja
tarkastamassa, mutta muuten on koko toimitus flegmaattisen
rauhallista. Ja asemasillalla kävelee kukko hoidellen haaremiaan.

Latvialaiset junat kulkevat hiljaa ja taitavasti, ja asemia näytellään


harmittavan kauan. Ehkä tällainen meno on hyödyllistä pienelle
maalle: matkustaja voi luulla kulkevansa suurenkin valtakunnan läpi,
kun aikaa kuluu runsaasti. Riika kuitataan tällä kertaa pienellä
autokierroksella, ja todetaan, että se on ulkoasultaan suurkaupungin
näköinen, joskin siitä ainakin nyt tuntuu olevan vaikeata löytää
vilkasliikkeistä katua, vaikka olisi ihan paras iltakuhinan aika. Ilma on
kuitenkin viileä, ja se ehkä on pidättänyt joutilaita sisällä.
Virossa on aina sama tuntu kuin meillä ennen ryssän aikaan
kannaksella: puoleksi tätä, puoleksi sitä. Veljeskansamme näyttää
olevan vaikeata päästä siihen niin perusteellisesti painetusta
»itämaisesta» leimasta.

Tallinnasta lähdettyä alkaa tuntea olevansa kotonaan. Laivalla


kaikuu nyt suomen kieli ylinnä. Kansainvälisyyttä edustaa pääasiassa
enää vain huomattavasta meren käynnistä johtuva jotenkin
yksimielinen uhraaminen vetehiselle. Allekirjoittanut ei ota osaa
tähän toimitukseen. Tosin kertoja ei koskaan ole meritaudissa, mutta
kyllä minä en ole sitä kipua tuntenut muussakaan ominaisuudessa.

Sitten ollaan omalla kamaralla. Jokainen tuttava koettaa kiertää


ulkomailta juuri palannutta, koska hän epäilee sen vippaavan
häneltä, ja puhelimessakin on varminta heti nimensä perään
huomauttaa, ettei missään tapauksessa aio lainata puhuteltavalta,
koska viimemainittu muuten voi helposti painaa kuulotorven
paikoilleen kaikessa hiljaisuudessa. Tätä »karanteenia» kestää
vähintään siihen saakka, kun asianomainen matkoilla ollut on
todistettavasti nostanut ensimmäisen tilinsä. Sen jälkeen hänet
vähitellen otetaan jälleen toveruuteen.
*** END OF THE PROJECT GUTENBERG EBOOK SAVOLAINEN
NEEKERI MUILLA MAILLA ***

Updated editions will replace the previous one—the old editions will
be renamed.

Creating the works from print editions not protected by U.S.


copyright law means that no one owns a United States copyright in
these works, so the Foundation (and you!) can copy and distribute it
in the United States without permission and without paying
copyright royalties. Special rules, set forth in the General Terms of
Use part of this license, apply to copying and distributing Project
Gutenberg™ electronic works to protect the PROJECT GUTENBERG™
concept and trademark. Project Gutenberg is a registered trademark,
and may not be used if you charge for an eBook, except by following
the terms of the trademark license, including paying royalties for use
of the Project Gutenberg trademark. If you do not charge anything
for copies of this eBook, complying with the trademark license is
very easy. You may use this eBook for nearly any purpose such as
creation of derivative works, reports, performances and research.
Project Gutenberg eBooks may be modified and printed and given
away—you may do practically ANYTHING in the United States with
eBooks not protected by U.S. copyright law. Redistribution is subject
to the trademark license, especially commercial redistribution.

START: FULL LICENSE


THE FULL PROJECT GUTENBERG LICENSE
PLEASE READ THIS BEFORE YOU DISTRIBUTE OR USE THIS WORK

To protect the Project Gutenberg™ mission of promoting the free


distribution of electronic works, by using or distributing this work (or
any other work associated in any way with the phrase “Project
Gutenberg”), you agree to comply with all the terms of the Full
Project Gutenberg™ License available with this file or online at
www.gutenberg.org/license.

Section 1. General Terms of Use and


Redistributing Project Gutenberg™
electronic works
1.A. By reading or using any part of this Project Gutenberg™
electronic work, you indicate that you have read, understand, agree
to and accept all the terms of this license and intellectual property
(trademark/copyright) agreement. If you do not agree to abide by all
the terms of this agreement, you must cease using and return or
destroy all copies of Project Gutenberg™ electronic works in your
possession. If you paid a fee for obtaining a copy of or access to a
Project Gutenberg™ electronic work and you do not agree to be
bound by the terms of this agreement, you may obtain a refund
from the person or entity to whom you paid the fee as set forth in
paragraph 1.E.8.

1.B. “Project Gutenberg” is a registered trademark. It may only be


used on or associated in any way with an electronic work by people
who agree to be bound by the terms of this agreement. There are a
few things that you can do with most Project Gutenberg™ electronic
works even without complying with the full terms of this agreement.
See paragraph 1.C below. There are a lot of things you can do with
Project Gutenberg™ electronic works if you follow the terms of this
agreement and help preserve free future access to Project
Gutenberg™ electronic works. See paragraph 1.E below.
1.C. The Project Gutenberg Literary Archive Foundation (“the
Foundation” or PGLAF), owns a compilation copyright in the
collection of Project Gutenberg™ electronic works. Nearly all the
individual works in the collection are in the public domain in the
United States. If an individual work is unprotected by copyright law
in the United States and you are located in the United States, we do
not claim a right to prevent you from copying, distributing,
performing, displaying or creating derivative works based on the
work as long as all references to Project Gutenberg are removed. Of
course, we hope that you will support the Project Gutenberg™
mission of promoting free access to electronic works by freely
sharing Project Gutenberg™ works in compliance with the terms of
this agreement for keeping the Project Gutenberg™ name associated
with the work. You can easily comply with the terms of this
agreement by keeping this work in the same format with its attached
full Project Gutenberg™ License when you share it without charge
with others.

1.D. The copyright laws of the place where you are located also
govern what you can do with this work. Copyright laws in most
countries are in a constant state of change. If you are outside the
United States, check the laws of your country in addition to the
terms of this agreement before downloading, copying, displaying,
performing, distributing or creating derivative works based on this
work or any other Project Gutenberg™ work. The Foundation makes
no representations concerning the copyright status of any work in
any country other than the United States.

1.E. Unless you have removed all references to Project Gutenberg:

1.E.1. The following sentence, with active links to, or other


immediate access to, the full Project Gutenberg™ License must
appear prominently whenever any copy of a Project Gutenberg™
work (any work on which the phrase “Project Gutenberg” appears,
or with which the phrase “Project Gutenberg” is associated) is
accessed, displayed, performed, viewed, copied or distributed:
This eBook is for the use of anyone anywhere in the United
States and most other parts of the world at no cost and with
almost no restrictions whatsoever. You may copy it, give it away
or re-use it under the terms of the Project Gutenberg License
included with this eBook or online at www.gutenberg.org. If you
are not located in the United States, you will have to check the
laws of the country where you are located before using this
eBook.

1.E.2. If an individual Project Gutenberg™ electronic work is derived


from texts not protected by U.S. copyright law (does not contain a
notice indicating that it is posted with permission of the copyright
holder), the work can be copied and distributed to anyone in the
United States without paying any fees or charges. If you are
redistributing or providing access to a work with the phrase “Project
Gutenberg” associated with or appearing on the work, you must
comply either with the requirements of paragraphs 1.E.1 through
1.E.7 or obtain permission for the use of the work and the Project
Gutenberg™ trademark as set forth in paragraphs 1.E.8 or 1.E.9.

1.E.3. If an individual Project Gutenberg™ electronic work is posted


with the permission of the copyright holder, your use and distribution
must comply with both paragraphs 1.E.1 through 1.E.7 and any
additional terms imposed by the copyright holder. Additional terms
will be linked to the Project Gutenberg™ License for all works posted
with the permission of the copyright holder found at the beginning
of this work.

1.E.4. Do not unlink or detach or remove the full Project


Gutenberg™ License terms from this work, or any files containing a
part of this work or any other work associated with Project
Gutenberg™.

1.E.5. Do not copy, display, perform, distribute or redistribute this


electronic work, or any part of this electronic work, without
prominently displaying the sentence set forth in paragraph 1.E.1
with active links or immediate access to the full terms of the Project
Gutenberg™ License.

1.E.6. You may convert to and distribute this work in any binary,
compressed, marked up, nonproprietary or proprietary form,
including any word processing or hypertext form. However, if you
provide access to or distribute copies of a Project Gutenberg™ work
in a format other than “Plain Vanilla ASCII” or other format used in
the official version posted on the official Project Gutenberg™ website
(www.gutenberg.org), you must, at no additional cost, fee or
expense to the user, provide a copy, a means of exporting a copy, or
a means of obtaining a copy upon request, of the work in its original
“Plain Vanilla ASCII” or other form. Any alternate format must
include the full Project Gutenberg™ License as specified in
paragraph 1.E.1.

1.E.7. Do not charge a fee for access to, viewing, displaying,


performing, copying or distributing any Project Gutenberg™ works
unless you comply with paragraph 1.E.8 or 1.E.9.

1.E.8. You may charge a reasonable fee for copies of or providing


access to or distributing Project Gutenberg™ electronic works
provided that:

• You pay a royalty fee of 20% of the gross profits you derive
from the use of Project Gutenberg™ works calculated using the
method you already use to calculate your applicable taxes. The
fee is owed to the owner of the Project Gutenberg™ trademark,
but he has agreed to donate royalties under this paragraph to
the Project Gutenberg Literary Archive Foundation. Royalty
payments must be paid within 60 days following each date on
which you prepare (or are legally required to prepare) your
periodic tax returns. Royalty payments should be clearly marked
as such and sent to the Project Gutenberg Literary Archive
Foundation at the address specified in Section 4, “Information
about donations to the Project Gutenberg Literary Archive
Foundation.”

• You provide a full refund of any money paid by a user who


notifies you in writing (or by e-mail) within 30 days of receipt
that s/he does not agree to the terms of the full Project
Gutenberg™ License. You must require such a user to return or
destroy all copies of the works possessed in a physical medium
and discontinue all use of and all access to other copies of
Project Gutenberg™ works.

• You provide, in accordance with paragraph 1.F.3, a full refund of


any money paid for a work or a replacement copy, if a defect in
the electronic work is discovered and reported to you within 90
days of receipt of the work.

• You comply with all other terms of this agreement for free
distribution of Project Gutenberg™ works.

1.E.9. If you wish to charge a fee or distribute a Project Gutenberg™


electronic work or group of works on different terms than are set
forth in this agreement, you must obtain permission in writing from
the Project Gutenberg Literary Archive Foundation, the manager of
the Project Gutenberg™ trademark. Contact the Foundation as set
forth in Section 3 below.

1.F.

1.F.1. Project Gutenberg volunteers and employees expend


considerable effort to identify, do copyright research on, transcribe
and proofread works not protected by U.S. copyright law in creating
the Project Gutenberg™ collection. Despite these efforts, Project
Gutenberg™ electronic works, and the medium on which they may
be stored, may contain “Defects,” such as, but not limited to,
incomplete, inaccurate or corrupt data, transcription errors, a
copyright or other intellectual property infringement, a defective or
damaged disk or other medium, a computer virus, or computer
codes that damage or cannot be read by your equipment.

1.F.2. LIMITED WARRANTY, DISCLAIMER OF DAMAGES - Except for


the “Right of Replacement or Refund” described in paragraph 1.F.3,
the Project Gutenberg Literary Archive Foundation, the owner of the
Project Gutenberg™ trademark, and any other party distributing a
Project Gutenberg™ electronic work under this agreement, disclaim
all liability to you for damages, costs and expenses, including legal
fees. YOU AGREE THAT YOU HAVE NO REMEDIES FOR
NEGLIGENCE, STRICT LIABILITY, BREACH OF WARRANTY OR
BREACH OF CONTRACT EXCEPT THOSE PROVIDED IN PARAGRAPH
1.F.3. YOU AGREE THAT THE FOUNDATION, THE TRADEMARK
OWNER, AND ANY DISTRIBUTOR UNDER THIS AGREEMENT WILL
NOT BE LIABLE TO YOU FOR ACTUAL, DIRECT, INDIRECT,
CONSEQUENTIAL, PUNITIVE OR INCIDENTAL DAMAGES EVEN IF
YOU GIVE NOTICE OF THE POSSIBILITY OF SUCH DAMAGE.

1.F.3. LIMITED RIGHT OF REPLACEMENT OR REFUND - If you


discover a defect in this electronic work within 90 days of receiving
it, you can receive a refund of the money (if any) you paid for it by
sending a written explanation to the person you received the work
from. If you received the work on a physical medium, you must
return the medium with your written explanation. The person or
entity that provided you with the defective work may elect to provide
a replacement copy in lieu of a refund. If you received the work
electronically, the person or entity providing it to you may choose to
give you a second opportunity to receive the work electronically in
lieu of a refund. If the second copy is also defective, you may
demand a refund in writing without further opportunities to fix the
problem.

1.F.4. Except for the limited right of replacement or refund set forth
in paragraph 1.F.3, this work is provided to you ‘AS-IS’, WITH NO
OTHER WARRANTIES OF ANY KIND, EXPRESS OR IMPLIED,
INCLUDING BUT NOT LIMITED TO WARRANTIES OF
MERCHANTABILITY OR FITNESS FOR ANY PURPOSE.

1.F.5. Some states do not allow disclaimers of certain implied


warranties or the exclusion or limitation of certain types of damages.
If any disclaimer or limitation set forth in this agreement violates the
law of the state applicable to this agreement, the agreement shall be
interpreted to make the maximum disclaimer or limitation permitted
by the applicable state law. The invalidity or unenforceability of any
provision of this agreement shall not void the remaining provisions.

1.F.6. INDEMNITY - You agree to indemnify and hold the Foundation,


the trademark owner, any agent or employee of the Foundation,
anyone providing copies of Project Gutenberg™ electronic works in
accordance with this agreement, and any volunteers associated with
the production, promotion and distribution of Project Gutenberg™
electronic works, harmless from all liability, costs and expenses,
including legal fees, that arise directly or indirectly from any of the
following which you do or cause to occur: (a) distribution of this or
any Project Gutenberg™ work, (b) alteration, modification, or
additions or deletions to any Project Gutenberg™ work, and (c) any
Defect you cause.

Section 2. Information about the Mission


of Project Gutenberg™
Project Gutenberg™ is synonymous with the free distribution of
electronic works in formats readable by the widest variety of
computers including obsolete, old, middle-aged and new computers.
It exists because of the efforts of hundreds of volunteers and
donations from people in all walks of life.

Volunteers and financial support to provide volunteers with the


assistance they need are critical to reaching Project Gutenberg™’s
goals and ensuring that the Project Gutenberg™ collection will
remain freely available for generations to come. In 2001, the Project
Gutenberg Literary Archive Foundation was created to provide a
secure and permanent future for Project Gutenberg™ and future
generations. To learn more about the Project Gutenberg Literary
Archive Foundation and how your efforts and donations can help,
see Sections 3 and 4 and the Foundation information page at
www.gutenberg.org.

Section 3. Information about the Project


Gutenberg Literary Archive Foundation
The Project Gutenberg Literary Archive Foundation is a non-profit
501(c)(3) educational corporation organized under the laws of the
state of Mississippi and granted tax exempt status by the Internal
Revenue Service. The Foundation’s EIN or federal tax identification
number is 64-6221541. Contributions to the Project Gutenberg
Literary Archive Foundation are tax deductible to the full extent
permitted by U.S. federal laws and your state’s laws.

The Foundation’s business office is located at 809 North 1500 West,


Salt Lake City, UT 84116, (801) 596-1887. Email contact links and up
to date contact information can be found at the Foundation’s website
and official page at www.gutenberg.org/contact

Section 4. Information about Donations to


the Project Gutenberg Literary Archive
Foundation
Project Gutenberg™ depends upon and cannot survive without
widespread public support and donations to carry out its mission of
increasing the number of public domain and licensed works that can
be freely distributed in machine-readable form accessible by the
widest array of equipment including outdated equipment. Many
small donations ($1 to $5,000) are particularly important to
maintaining tax exempt status with the IRS.

The Foundation is committed to complying with the laws regulating


charities and charitable donations in all 50 states of the United
States. Compliance requirements are not uniform and it takes a
considerable effort, much paperwork and many fees to meet and
keep up with these requirements. We do not solicit donations in
locations where we have not received written confirmation of
compliance. To SEND DONATIONS or determine the status of
compliance for any particular state visit www.gutenberg.org/donate.

While we cannot and do not solicit contributions from states where


we have not met the solicitation requirements, we know of no
prohibition against accepting unsolicited donations from donors in
such states who approach us with offers to donate.

International donations are gratefully accepted, but we cannot make


any statements concerning tax treatment of donations received from
outside the United States. U.S. laws alone swamp our small staff.

Please check the Project Gutenberg web pages for current donation
methods and addresses. Donations are accepted in a number of
other ways including checks, online payments and credit card
donations. To donate, please visit: www.gutenberg.org/donate.

Section 5. General Information About


Project Gutenberg™ electronic works
Professor Michael S. Hart was the originator of the Project
Gutenberg™ concept of a library of electronic works that could be
freely shared with anyone. For forty years, he produced and
distributed Project Gutenberg™ eBooks with only a loose network of
volunteer support.
Project Gutenberg™ eBooks are often created from several printed
editions, all of which are confirmed as not protected by copyright in
the U.S. unless a copyright notice is included. Thus, we do not
necessarily keep eBooks in compliance with any particular paper
edition.

Most people start at our website which has the main PG search
facility: www.gutenberg.org.

This website includes information about Project Gutenberg™,


including how to make donations to the Project Gutenberg Literary
Archive Foundation, how to help produce our new eBooks, and how
to subscribe to our email newsletter to hear about new eBooks.

You might also like