0% found this document useful (0 votes)
6 views

Data Science: Concepts and Practice 2nd Edition- eBook PDF download

The document is an overview of the second edition of 'Data Science: Concepts and Practice' by Vijay Kotu and Bala Deshpande, which covers fundamental concepts and practical implementations of data science. It includes chapters on various topics such as data exploration, classification, regression methods, and machine learning techniques. The book aims to educate readers about data science and its applications in real-world scenarios, emphasizing the importance of understanding algorithms and operationalizing models.

Uploaded by

arenalelseed
Copyright
© © All Rights Reserved
Available Formats
Download as PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
6 views

Data Science: Concepts and Practice 2nd Edition- eBook PDF download

The document is an overview of the second edition of 'Data Science: Concepts and Practice' by Vijay Kotu and Bala Deshpande, which covers fundamental concepts and practical implementations of data science. It includes chapters on various topics such as data exploration, classification, regression methods, and machine learning techniques. The book aims to educate readers about data science and its applications in real-world scenarios, emphasizing the importance of understanding algorithms and operationalizing models.

Uploaded by

arenalelseed
Copyright
© © All Rights Reserved
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 58

Data Science: Concepts and Practice 2nd Edition-

eBook PDF pdf download

https://ebooksecure.com/download/data-science-concepts-and-
practice-ebook-pdf/

Download more ebook from https://ebooksecure.com


We believe these products will be a great fit for you. Click
the link to download now, or visit ebooksecure.com
to discover even more!

Addiction Medicine Science and Practice, 2nd Edition -


eBook PDF

https://ebooksecure.com/download/addiction-medicine-science-and-
practice-2nd-edition-ebook-pdf/

(eBook PDF) Concepts for Nursing Practice 2nd Edition

http://ebooksecure.com/product/ebook-pdf-concepts-for-nursing-
practice-2nd-edition/

(eBook PDF) Food Regulation: Law, Science, Policy, and


Practice 2nd Edition

http://ebooksecure.com/product/ebook-pdf-food-regulation-law-
science-policy-and-practice-2nd-edition/

(eBook PDF) Nation Branding: Concepts, Issues, Practice


2nd Edition

http://ebooksecure.com/product/ebook-pdf-nation-branding-
concepts-issues-practice-2nd-edition/
(eBook PDF) Data Mining Concepts and Techniques 3rd

http://ebooksecure.com/product/ebook-pdf-data-mining-concepts-
and-techniques-3rd/

Machine Learning for Biometrics: Concepts, Algorithms


and Applications (Cognitive Data Science in Sustainable
Computing) 1st Edition - eBook PDF

https://ebooksecure.com/download/machine-learning-for-biometrics-
concepts-algorithms-and-applications-cognitive-data-science-in-
sustainable-computing-ebook-pdf/

(eBook PDF) Intro to Python for Computer Science and


Data Science: Learning to Program with AI, Big Data and
The Cloud

http://ebooksecure.com/product/ebook-pdf-intro-to-python-for-
computer-science-and-data-science-learning-to-program-with-ai-
big-data-and-the-cloud/

(eBook PDF) Body Image Second Edition: A Handbook of


Science, Practice, and Prevention 2nd Edition

http://ebooksecure.com/product/ebook-pdf-body-image-second-
edition-a-handbook-of-science-practice-and-prevention-2nd-
edition/

Parallel programming: concepts and practice 1st Edition


- eBook PDF

https://ebooksecure.com/download/parallel-programming-concepts-
and-practice-ebook-pdf/
Data Science
This page intentionally left blank
Data Science
Concepts and Practice
Second Edition

Vijay Kotu
Bala Deshpande
Morgan Kaufmann is an imprint of Elsevier
50 Hampshire Street, 5th Floor, Cambridge, MA 02139, United States
Copyright r 2019 Elsevier Inc. All rights reserved.
No part of this publication may be reproduced or transmitted in any form or by any means, electronic or mechanical,
including photocopying, recording, or any information storage and retrieval system, without permission in writing
from the publisher. Details on how to seek permission, further information about the Publisher’s permissions policies
and our arrangements with organizations such as the Copyright Clearance Center and the Copyright Licensing Agency,
can be found at our website: www.elsevier.com/permissions.
This book and the individual contributions contained in it are protected under copyright by the Publisher (other than
as may be noted herein).
Notices
Knowledge and best practice in this field are constantly changing. As new research and experience broaden our
understanding, changes in research methods, professional practices, or medical treatment may become necessary.
Practitioners and researchers must always rely on their own experience and knowledge in evaluating and using any
information, methods, compounds, or experiments described herein. In using such information or methods they
should be mindful of their own safety and the safety of others, including parties for whom they have a professional
responsibility.
To the fullest extent of the law, neither the Publisher nor the authors, contributors, or editors, assume any liability for
any injury and/or damage to persons or property as a matter of products liability, negligence or otherwise, or from any
use or operation of any methods, products, instructions, or ideas contained in the material herein.

British Library Cataloguing-in-Publication Data


A catalogue record for this book is available from the British Library
Library of Congress Cataloging-in-Publication Data
A catalog record for this book is available from the Library of Congress
ISBN: 978-0-12-814761-0

For Information on all Morgan Kaufmann publications


visit our website at https://www.elsevier.com/books-and-journals

Publisher: Jonathan Simpson


Acquisition Editor: Glyn Jones
Editorial Project Manager: Ana Claudia Abad Garcia
Production Project Manager: Sreejith Viswanathan
Cover Designer: Greg Harris
Typeset by MPS Limited, Chennai, India
Dedication

To all the mothers in our lives


This page intentionally left blank
Contents

FOREWORD................................................................................................. xi
PREFACE ................................................................................................... xv
ACKNOWLEDGMENTS............................................................................... xix

Chapter 1 Introduction ..................................................................................... 1


1.1 AI, Machine Learning, and Data Science..........................................2
1.2 What is Data Science? .......................................................................4
1.3 Case for Data Science........................................................................8
1.4 Data Science Classification .............................................................10
1.5 Data Science Algorithms .................................................................12
1.6 Roadmap for This Book ...................................................................12
References ................................................................................................18

Chapter 2 Data Science Process................................................................... 19


2.1 Prior Knowledge...............................................................................21
2.2 Data Preparation ..............................................................................25
2.3 Modeling............................................................................................29
2.4 Application ........................................................................................34
2.5 Knowledge ........................................................................................36
References ................................................................................................37

Chapter 3 Data Exploration ........................................................................... 39


3.1 Objectives of Data Exploration ........................................................40
3.2 Datasets ............................................................................................40
3.3 Descriptive Statistics........................................................................43
3.4 Data Visualization .............................................................................48
3.5 Roadmap for Data Exploration........................................................63
References ................................................................................................64

Chapter 4 Classification................................................................................. 65
4.1 Decision Trees ..................................................................................66
4.2 Rule Induction...................................................................................87 vii
viii Contents

4.3 k-Nearest Neighbors .......................................................................98


4.4 Naïve Bayesian ...............................................................................111
4.5 Artificial Neural Networks.............................................................124
4.6 Support Vector Machines ..............................................................135
4.7 Ensemble Learners........................................................................148
References ..............................................................................................161

Chapter 5 Regression Methods................................................................... 165


5.1 Linear Regression ..........................................................................166
5.2 Logistic Regression........................................................................185
5.3 Conclusion ......................................................................................196
References ..............................................................................................197

Chapter 6 Association Analysis ................................................................... 199


6.1 Mining Association Rules...............................................................201
6.2 Apriori Algorithm............................................................................206
6.3 Frequent Pattern-Growth Algorithm ............................................211
6.4 Conclusion ......................................................................................220
References ..............................................................................................220

Chapter 7 Clustering .................................................................................... 221


7.1 k-Means Clustering........................................................................226
7.2 DBSCAN Clustering .......................................................................238
7.3 Self-Organizing Maps ....................................................................247
References ..............................................................................................260

Chapter 8 Model Evaluation ........................................................................ 263


8.1 Confusion Matrix ............................................................................264
8.2 ROC and AUC..................................................................................266
8.3 Lift Curves.......................................................................................268
8.4 How to Implement..........................................................................271
8.5 Conclusion ......................................................................................276
References ..............................................................................................279

Chapter 9 Text Mining.................................................................................. 281


9.1 How It Works ..................................................................................283
9.2 How to Implement..........................................................................290
9.3 Conclusion ......................................................................................304
References ..............................................................................................305

Chapter 10 Deep Learning .......................................................................... 307


10.1 The AI Winter............................................................................. 309
10.2 How it Works ............................................................................. 315
10.3 How to Implement .................................................................... 335
Contents ix

10.4 Conclusion ................................................................................. 341


References ........................................................................................... 342

Chapter 11 Recommendation Engines ....................................................... 343


11.1 Recommendation Engine Concepts......................................... 346
11.2 Collaborative Filtering .............................................................. 353
11.3 Content-Based Filtering ........................................................... 373
11.4 Hybrid Recommenders............................................................. 389
11.5 Conclusion ................................................................................. 390
References ........................................................................................... 394

Chapter 12 Time Series Forecasting .......................................................... 395


12.1 Time Series Decomposition ..................................................... 400
12.2 Smoothing Based Methods ...................................................... 407
12.3 Regression Based Methods ..................................................... 413
12.4 Machine Learning Methods...................................................... 429
12.5 Performance Evaluation ........................................................... 439
12.6 Conclusion ................................................................................. 443
References ........................................................................................... 444

Chapter 13 Anomaly Detection.................................................................... 447


13.1 Concepts .................................................................................... 447
13.2 Distance-Based Outlier Detection ........................................... 453
13.3 Density-Based Outlier Detection ............................................. 457
13.4 Local Outlier Factor.................................................................. 460
13.5 Conclusion ................................................................................. 464
References ........................................................................................... 465

Chapter 14 Feature Selection ..................................................................... 467


14.1 Classifying Feature Selection Methods................................... 468
14.2 Principal Component Analysis ................................................. 470
14.3 Information Theory-Based Filtering........................................ 477
14.4 Chi-Square-Based Filtering ..................................................... 480
14.5 Wrapper-Type Feature Selection............................................. 483
14.6 Conclusion ................................................................................. 489
References ........................................................................................... 490

Chapter 15 Getting Started with RapidMiner ............................................. 491


15.1 User Interface and Terminology.............................................. 492
15.2 Data Importing and Exporting Tools ....................................... 497
15.3 Data Visualization Tools ........................................................... 501
15.4 Data Transformation Tools ...................................................... 504
15.5 Sampling and Missing Value Tools.......................................... 509
x Contents

15.6 Optimization Tools .................................................................... 512


15.7 Integration with R ..................................................................... 520
15.8 Conclusion ................................................................................. 521
References ........................................................................................... 521

COMPARISON OF DATA SCIENCE ALGORITHMS ...................................... 523


ABOUT THE AUTHORS ............................................................................. 531
INDEX ...................................................................................................... 533
PRAISE .................................................................................................... 545
Foreword

A lot has happened since the first edition of this book was published in
2014. There is hardly a day where there is no news on data science, machine
learning, or artificial intelligence in the media. It is interesting that many of
those news articles have a skeptical, if not an even negative tone. All this
underlines two things: data science and machine learning are finally becom-
ing mainstream. And people know shockingly little about it. Readers of this
book will certainly do better in this regard. It continues to be a valuable
resource to not only educate about how to use data science in practice, but
also how the fundamental concepts work.
Data science and machine learning are fast-moving fields which is why this
second edition reflects a lot of the changes in our field. While we used to
talk a lot about “data mining” and “predictive analytics” only a couple of
years ago, we have now settled on the term “data science” for the broader
field. And even more importantly: it is now commonly understood that
machine learning is at the core of many current technological breakthroughs.
These are truly exciting times for all the people working in our field then!
I have seen situations where data science and machine learning had an
incredible impact. But I have also seen situations where this was not the
case. What was the difference? In most cases where organizations fail with
data science and machine learning is, they had used those techniques in
the wrong context. Data science models are not very helpful if you only
have one big decision you need to make. Analytics can still help you in
such cases by giving you easier access to the data you need to make this
decision. Or by presenting the data in a consumable fashion. But at the
end of the day, those single big decisions are often strategic. Building a
machine learning model to help you make this decision is not worth
doing. And often they also do not yield better results than just making the
decision on your own.

xi
xii Foreword

Here is where data science and machine learning can truly help: these
advanced models deliver the most value whenever you need to make lots of
similar decisions quickly. Good examples for this are:
G Defining the price of a product in markets with rapidly changing
demands.
G Making offers for cross-selling in an E-Commerce platform.
G Approving credit or not.
G Detecting customers with a high risk for churn.
G Stopping fraudulent transactions.
G And many others.
You can see that a human being who would have access to all relevant data
could make those decisions in a matter of seconds or minutes. Only that
they can’t without data science, since they would need to make this type of
decision millions of times, every day. Consider sifting through your customer
base of 50 million clients every day to identify those with a high churn risk.
Impossible for any human being. But no problem at all for a machine learn-
ing model.
So, the biggest value of artificial intelligence and machine learning is not to
support us with those big strategic decisions. Machine learning delivers most
value when we operationalize models and automate millions of decisions.
One of the shortest descriptions of this phenomenon comes from Andrew
Ng, who is a well-known researcher in the field of AI. Andrew describes what
AI can do as follows: “If a typical person can do a mental task with less than
one second of thought, we can probably automate it using AI either now or
in the near future.”
I agree with him on this characterization. And I like that Andrew puts the
emphasis on automation and operationalization of those models—because
this is where the biggest value is. The only thing I disagree with is the time
unit he chose. It is safe to already go with a minute instead of a second.
However, the quick pace of changes as well as the ubiquity of data science
also underlines the importance of laying the right foundations. Keep in
mind that machine learning is not completely new. It has been an active
field of research since the 1950s. Some of the algorithms used today have
even been around for more than 200 years now. And the first deep learning
models were developed in the 1960s with the term “deep learning” being
coined in 1984. Those algorithms are well understood now. And under-
standing their basic concepts will help you to pick the right algorithm for
the right task.
To support you with this, some additional chapters on deep learning and rec-
ommendation systems have been added to the book. Another focus area is
Foreword xiii

using text analytics and natural language processing. It became clear in the
past years that the most successful predictive models have been using
unstructured input data in addition to the more traditional tabular formats.
Finally, expansion of Time Series Forecasting should get you started on one
of the most widely applied data science techniques in the business.
More algorithms could mean that there is a risk of increased complexity. But
thanks to the simplicity of the RapidMiner platform and the many practical
examples throughout the book this is not the case here. We continue our
journey towards the democratization of data science and machine learning.
This journey continues until data science and machine learning are as ubiqui-
tous as data visualization or Excel. Of course, we cannot magically transform
everybody into a data scientist overnight, but we can give people the tools to
help them on their personal path of development. This book is the only tour
guide you need on this journey.

Ingo Mierswa
Founder
RapidMiner Inc.
Massachusetts, USA
This page intentionally left blank
Preface

Our goal is to introduce you to Data Science.


We will provide you with a survey of the fundamental data science concepts
as well as step-by-step guidance on practical implementations—enough to
get you started on this exciting journey.

WHY DATA SCIENCE?


We have run out of adjectives and superlatives to describe the growth trends
of data. The technology revolution has brought about the need to process,
store, analyze, and comprehend large volumes of diverse data in meaningful
ways. However, the value of the stored data is zero unless it is acted upon. The scale
of data volume and variety places new demands on organizations to quickly
uncover hidden relationships and patterns. This is where data science techni-
ques have proven to be extremely useful. They are increasingly finding their
way into the everyday activities of many business and government functions,
whether in identifying which customers are likely to take their business else-
where, or mapping flu pandemic using social media signals.
Data science is a compilation of techniques that extract value from data.
Some of the techniques used in data science have a long history and trace
their roots to applied statistics, machine learning, visualization, logic, and
computer science. Some techniques have just reached the popularity it
deserves. Most emerging technologies go through what is termed the “hype
cycle.” This is a way of contrasting the amount of hyperbole or hype versus
the productivity that is engendered by the emerging technology. The hype
cycle has three main phases: peak of inflated expectation, trough of disillu-
sionment, and plateau of productivity. The third phase refers to the mature
and value-generating phase of any technology. The hype cycle for data sci-
ence indicates that it is in this mature phase. Does this imply that data sci-
ence has stopped growing or has reached a saturation point? Not at all. On
the contrary, this discipline has grown beyond the scope of its initial
xv
xvi Preface

applications in marketing and has advanced to applications in technology,


internet-based fields, health care, government, finance, and manufacturing.

WHY THIS BOOK?


The objective of this book is two-fold: to help clarify the basic concepts
behind many data science techniques in an easy-to-follow manner; and to
prepare anyone with a basic grasp of mathematics to implement these techni-
ques in their organizations without the need to write any lines of program-
ming code.
Beyond its practical value, we wanted to show you that the data science
learning algorithms are elegant, beautiful, and incredibly effective. You will
never look at data the same way once you learn the concepts of the learning
algorithms.
To make the concepts stick, you will have to build data science models.
While there are many data science tools available to execute algorithms and
develop applications, the approaches to solving a data science problem are
similar among these tools. We wanted to pick a fully functional, open source,
free to use, graphical user interface-based data science tool so readers can fol-
low the concepts and implement the data science algorithms. RapidMiner, a
leading data science platform, fit the bill and, thus, we used it as a compan-
ion tool to implement the data science algorithms introduced in every
chapter.

WHO CAN USE THIS BOOK?


The concepts and implementations described in this book are geared towards
business, analytics, and technical professionals who use data everyday. You,
the reader of the book will get a comprehensive understanding of the differ-
ent data science techniques that can be used for prediction and for discover-
ing patterns, be prepared to select the right technique for a given data
problem, and you will be able to create a general-purpose analytics process.
We have tried to follow a process to describe this body of knowledge. Our
focus has been on introducing about 30 key algorithms that are in wide-
spread use today. We present these algorithms in the framework of:
1. A high-level practical use case for each algorithm.
2. An explanation of how the algorithm works in plain language. Many
algorithms have a strong foundation in statistics and/or computer
science. In our descriptions, we have tried to strike a balance between
being accessible to a wider audience and being academically rigorous.
Preface xvii

3. A detailed review of implementation using RapidMiner, by describing


the commonly used setup and parameter options using a sample data
set. You can download the processes from the companion website
www.IntroDataScience.com and we recommend you follow-along by
building an actual data science process.
Analysts, finance, engineering, marketing, and business professionals, or any-
one who analyzes data, most likely will use data science techniques in their
job either now or in the near future. For business managers who are one step
removed from the actual data science process, it is important to know what
is possible and not possible with these techniques so they can ask the right
questions and set proper expectations. While basic spreadsheet analysis, slic-
ing, and dicing of data through standard business intelligence tools will con-
tinue to form the foundations of data exploration in business, data science
techniques are necessary to establish the full edifice of analytics in the
organizations.

Vijay Kotu
California, USA
Bala Deshpande, PhD
Michigan, USA
This page intentionally left blank
Acknowledgments

Writing a book is one of the most interesting and challenging endeavors one
can embark on. We grossly underestimated the effort it would take and the
fulfillment it brings. This book would not have been possible without the
support of our families, who granted us enough leeway in this time-
consuming activity. We would like to thank the team at RapidMiner, who
provided great help with everything, ranging from technical support to
reviewing the chapters to answering questions on the features of the product.
Our special thanks to Ingo Mierswa for setting the stage for the book through
the foreword. We greatly appreciate the thoughtful and insightful comments
from our technical reviewers: Doug Schrimager from Slalom Consulting,
Steven Reagan from L&L Products, and Philipp Schlunder, Tobias Malbrecht
and Ingo Mierswa from RapidMiner. Thanks to Mike Skinner of Intel and to
Dr. Jacob Cybulski of Deakin University in Australia. We had great support
and stewardship from the Elsevier and Morgan Kaufmann team: Glyn Jones,
Ana Claudia Abad Garcia, and Sreejith Viswanathan. Thanks to our collea-
gues and friends for all the productive discussions and suggestions regarding
this project.

xix
This page intentionally left blank
CHAPTER 1

Introduction

Data science is a collection of techniques used to extract value from data. It


has become an essential tool for any organization that collects, stores, and
processes data as part of its operations. Data science techniques rely on find-
ing useful patterns, connections, and relationships within data. Being a buzz-
word, there is a wide variety of definitions and criteria for what constitutes
data science. Data science is also commonly referred to as knowledge discov-
ery, machine learning, predictive analytics, and data mining. However, each
term has a slightly different connotation depending on the context. In this
chapter, we attempt to provide a general overview of data science and point
out its important features, purpose, taxonomy, and methods.
In spite of the present growth and popularity, the underlying methods of
data science are decades if not centuries old. Engineers and scientists have
been using predictive models since the beginning of nineteenth century.
Humans have always been forward-looking creatures and predictive sciences
are manifestations of this curiosity. So, who uses data science today? Almost
every organization and business. Sure, we didn’t call the methods that are
now under data science as “Data Science.” The use of the term science in data
science indicates that the methods are evidence based, and are built on
empirical knowledge, more specifically historical observations.
As the ability to collect, store, and process data has increased, in line with
Moore’s Law - which implies that computing hardware capabilities double
every two years, data science has found increasing applications in many
diverse fields. Just decades ago, building a production quality regression
model took about several dozen hours (Parr Rud, 2001). Technology has
come a long way. Today, sophisticated machine learning models can be run,
involving hundreds of predictors with millions of records in a matter of a
few seconds on a laptop computer.
The process involved in data science, however, has not changed since those
early days and is not likely to change much in the foreseeable future. To get
meaningful results from any data, a major effort preparing, cleaning, 1
Data Science. DOI: https://doi.org/10.1016/B978-0-12-814761-0.00001-0
© 2019 Elsevier Inc. All rights reserved.
2 CHAPTER 1: Introduction

scrubbing, or standardizing the data is still required, before the learning algo-
rithms can begin to crunch them. But what may change is the automation
available to do this. While today this process is iterative and requires ana-
lysts’ awareness of the best practices, soon smart automation may be
deployed. This will allow the focus to be put on the most important aspect
of data science: interpreting the results of the analysis in order to make deci-
sions. This will also increase the reach of data science to a wider audience.
When it comes to the data science techniques, are there a core set of procedures
and principles one must master? It turns out that a vast majority of data science
practitioners today use a handful of very powerful techniques to accomplish
their objectives: decision trees, regression models, deep learning, and clustering
(Rexer, 2013). A majority of the data science activity can be accomplished
using relatively few techniques. However, as with all 80/20 rules, the long tail,
which is made up of a large number of specialized techniques, is where the
value lies, and depending on what is needed, the best approach may be a rela-
tively obscure technique or a combination of several not so commonly used
procedures. Thus, it will pay off to learn data science and its methods in a sys-
tematic way, and that is what is covered in these chapters. But, first, how are
the often-used terms artificial intelligence (AI), machine learning, and data sci-
ence explained?

1.1 AI, MACHINE LEARNING, AND DATA SCIENCE


Artificial intelligence, Machine learning, and data science are all related to
each other. Unsurprisingly, they are often used interchangeably and conflated
with each other in popular media and business communication. However,
all of these three fields are distinct depending on the context. Fig. 1.1 shows
the relationship between artificial intelligence, machine learning, and
data science.
Artificial intelligence is about giving machines the capability of mimicking
human behavior, particularly cognitive functions. Examples would be: facial
recognition, automated driving, sorting mail based on postal code. In some
cases, machines have far exceeded human capabilities (sorting thousands of
postal mails in seconds) and in other cases we have barely scratched the
surface (search “artificial stupidity”). There are quite a range of techniques
that fall under artificial intelligence: linguistics, natural language processing,
decision science, bias, vision, robotics, planning, etc. Learning is an impor-
tant part of human capability. In fact, many other living organisms can
learn.
Machine learning can either be considered a sub-field or one of the tools of
artificial intelligence, is providing machines with the capability of learning
1.1 AI, Machine learning, and Data Science 3

Artificial intelligence

Linguistics Vision

Language Robotics
synthesis
Sensor Planning
Machine learning

Data science
Support
vector Data
machines kNN Text preparation
mining
Statistics
Decision Bayesian Process
trees learning Time series mining
Visualization
forecasting
Deep Processing
learning Recommendation paradigms
engines Experimentation

FIGURE 1.1
Artificial intelligence, machine learning, and data science.

FIGURE 1.2
Traditional program and machine learning.

from experience. Experience for machines comes in the form of data. Data
that is used to teach machines is called training data. Machine learning turns
the traditional programing model upside down (Fig. 1.2). A program, a set
of instructions to a computer, transforms input signals into output signals
using predetermined rules and relationships. Machine learning algorithms,
4 CHAPTER 1: Introduction

also called “learners”, take both the known input and output (training data)
to figure out a model for the program which converts input to output. For
example, many organizations like social media platforms, review sites, or for-
ums are required to moderate posts and remove abusive content. How can
machines be taught to automate the removal of abusive content? The
machines need to be shown examples of both abusive and non-abusive posts
with a clear indication of which one is abusive. The learners will generalize a
pattern based on certain words or sequences of words in order to conclude
whether the overall post is abusive or not. The model can take the form of a
set of “if-then” rules. Once the data science rules or model is developed,
machines can start categorizing the disposition of any new posts.
Data science is the business application of machine learning, artificial intelli-
gence, and other quantitative fields like statistics, visualization, and mathe-
matics. It is an interdisciplinary field that extracts value from data. In the
context of how data science is used today, it relies heavily on machine learn-
ing and is sometimes called data mining. Examples of data science user cases
are: recommendation engines that can recommend movies for a particular
user, a fraud alert model that detects fraudulent credit card transactions, find
customers who will most likely churn next month, or predict revenue for the
next quarter.

1.2 WHAT IS DATA SCIENCE?


Data science starts with data, which can range from a simple array of a few
numeric observations to a complex matrix of millions of observations with
thousands of variables. Data science utilizes certain specialized computational
methods in order to discover meaningful and useful structures within a dataset.
The discipline of data science coexists and is closely associated with a number
of related areas such as database systems, data engineering, visualization, data
analysis, experimentation, and business intelligence (BI). We can further define
data science by investigating some of its key features and motivations.

1.2.1 Extracting Meaningful Patterns


Knowledge discovery in databases is the nontrivial process of identifying
valid, novel, potentially useful, and ultimately understandable patterns or
relationships within a dataset in order to make important decisions (Fayyad,
Piatetsky-shapiro, & Smyth, 1996). Data science involves inference and itera-
tion of many different hypotheses. One of the key aspects of data science is
the process of generalization of patterns from a dataset. The generalization
should be valid, not just for the dataset used to observe the pattern, but also
for new unseen data. Data science is also a process with defined steps, each
1.2 What is Data Science? 5

FIGURE 1.3
Data science models.

with a set of tasks. The term novel indicates that data science is usually
involved in finding previously unknown patterns in data. The ultimate objec-
tive of data science is to find potentially useful conclusions that can be acted
upon by the users of the analysis.

1.2.2 Building Representative Models


In statistics, a model is the representation of a relationship between variables
in a dataset. It describes how one or more variables in the data are related to
other variables. Modeling is a process in which a representative abstraction is
built from the observed dataset. For example, based on credit score, income
level, and requested loan amount, a model can be developed to determine
the interest rate of a loan. For this task, previously known observational data
including credit score, income level, loan amount, and interest rate are
needed. Fig. 1.3 shows the process of generating a model. Once the represen-
tative model is created, it can be used to predict the value of the interest rate,
based on all the input variables.
Data science is the process of building a representative model that fits the
observational data. This model serves two purposes: on the one hand, it pre-
dicts the output (interest rate) based on the new and unseen set of input
variables (credit score, income level, and loan amount), and on the other
hand, the model can be used to understand the relationship between the
output variable and all the input variables. For example, does income level
really matter in determining the interest rate of a loan? Does income level
matter more than credit score? What happens when income levels double or
if credit score drops by 10 points? A Model can be used for both predictive
and explanatory applications.
6 CHAPTER 1: Introduction

1.2.3 Combination of Statistics, Machine Learning, and


Computing
In the pursuit of extracting useful and relevant information from large data-
sets, data science borrows computational techniques from the disciplines of
statistics, machine learning, experimentation, and database theories. The
algorithms used in data science originate from these disciplines but have
since evolved to adopt more diverse techniques such as parallel computing,
evolutionary computing, linguistics, and behavioral studies. One of the key
ingredients of successful data science is substantial prior knowledge about
the data and the business processes that generate the data, known as subject
matter expertise. Like many quantitative frameworks, data science is an itera-
tive process in which the practitioner gains more information about the pat-
terns and relationships from data in each cycle. Data science also typically
operates on large datasets that need to be stored, processed, and computed.
This is where database techniques along with parallel and distributed com-
puting techniques play an important role in data science.

1.2.4 Learning Algorithms


We can also define data science as a process of discovering previously
unknown patterns in data using automatic iterative methods. The application of
sophisticated learning algorithms for extracting useful patterns from data dif-
ferentiates data science from traditional data analysis techniques. Many of
these algorithms were developed in the past few decades and are a part of
machine learning and artificial intelligence. Some algorithms are based on
the foundations of Bayesian probabilistic theories and regression analysis,
originating from hundreds of years ago. These iterative algorithms automate
the process of searching for an optimal solution for a given data problem.
Based on the problem, data science is classified into tasks such as classifica-
tion, association analysis, clustering, and regression. Each data science task
uses specific learning algorithms like decision trees, neural networks, k-near-
est neighbors (k-NN), and k-means clustering, among others. With increased
research on data science, such algorithms are increasing, but a few classic
algorithms remain foundational to many data science applications.

1.2.5 Associated Fields


While data science covers a wide set of techniques, applications, and disci-
plines, there a few associated fields that data science heavily relies on. The
techniques used in the steps of a data science process and in conjunction
with the term “data science” are:
G Descriptive statistics: Computing mean, standard deviation, correlation,
and other descriptive statistics, quantify the aggregate structure of a
1.2 What is Data Science? 7

dataset. This is essential information for understanding any dataset in


order to understand the structure of the data and the relationships
within the dataset. They are used in the exploration stage of the data
science process.
G Exploratory visualization: The process of expressing data in visual
coordinates enables users to find patterns and relationships in the data
and to comprehend large datasets. Similar to descriptive statistics, they
are integral in the pre- and post-processing steps in data science.
G Dimensional slicing: Online analytical processing (OLAP) applications,
which are prevalent in organizations, mainly provide information on
the data through dimensional slicing, filtering, and pivoting. OLAP
analysis is enabled by a unique database schema design where the data
are organized as dimensions (e.g., products, regions, dates) and
quantitative facts or measures (e.g., revenue, quantity). With a well-
defined database structure, it is easy to slice the yearly revenue by
products or combination of region and products. These techniques are
extremely useful and may unveil patterns in data (e.g., candy sales
decline after Halloween in the United States).
G Hypothesis testing: In confirmatory data analysis, experimental data are
collected to evaluate whether a hypothesis has enough evidence to be
supported or not. There are many types of statistical testing and they
have a wide variety of business applications (e.g., A/B testing in
marketing). In general, data science is a process where many hypotheses
are generated and tested based on observational data. Since the data
science algorithms are iterative, solutions can be refined in each step.
G Data engineering: Data engineering is the process of sourcing,
organizing, assembling, storing, and distributing data for effective
analysis and usage. Database engineering, distributed storage, and
computing frameworks (e.g., Apache Hadoop, Spark, Kafka), parallel
computing, extraction transformation and loading processing, and data
warehousing constitute data engineering techniques. Data engineering
helps source and prepare for data science learning algorithms.
G Business intelligence: Business intelligence helps organizations consume
data effectively. It helps query the ad hoc data without the need to
write the technical query command or use dashboards or visualizations
to communicate the facts and trends. Business intelligence specializes
in the secure delivery of information to right roles and the distribution
of information at scale. Historical trends are usually reported, but in
combination with data science, both the past and the predicted future
data can be combined. BI can hold and distribute the results of data
science.
8 CHAPTER 1: Introduction

1.3 CASE FOR DATA SCIENCE


In the past few decades, a massive accumulation of data has been seen with
the advancement of information technology, connected networks, and the
businesses it enables. This trend is also coupled with a steep decline in data
storage and data processing costs. The applications built on these advance-
ments like online businesses, social networking, and mobile technologies
unleash a large amount of complex, heterogeneous data that are waiting to
be analyzed. Traditional analysis techniques like dimensional slicing, hypoth-
esis testing, and descriptive statistics can only go so far in information dis-
covery. A paradigm is needed to manage the massive volume of data, explore
the inter-relationships of thousands of variables, and deploy machine learn-
ing algorithms to deduce optimal insights from datasets. A set of frameworks,
tools, and techniques are needed to intelligently assist humans to process all
these data and extract valuable information (Piatetsky-Shapiro, Brachman,
Khabaza, Kloesgen, & Simoudis, 1996). Data science is one such paradigm
that can handle large volumes with multiple attributes and deploy complex
algorithms to search for patterns from data. Each key motivation for using
data science techniques are explored here.

1.3.1 Volume
The sheer volume of data captured by organizations is exponentially increas-
ing. The rapid decline in storage costs and advancements in capturing every
transaction and event, combined with the business need to extract as much
leverage as possible using data, creates a strong motivation to store more
data than ever. As data become more granular, the need to use large volume
data to extract information increases. A rapid increase in the volume of data
exposes the limitations of current analysis methodologies. In a few imple-
mentations, the time to create generalization models is critical and data vol-
ume plays a major part in determining the time frame of development and
deployment.

1.3.2 Dimensions
The three characteristics of the Big Data phenomenon are high volume, high
velocity, and high variety. The variety of data relates to the multiple types of
values (numerical, categorical), formats of data (audio files, video files), and
the application of the data (location coordinates, graph data). Every single
record or data point contains multiple attributes or variables to provide con-
text for the record. For example, every user record of an ecommerce site can
contain attributes such as products viewed, products purchased, user demo-
graphics, frequency of purchase, clickstream, etc. Determining the most effec-
tive offer for an ecommerce user can involve computing information across
1.3 Case for Data Science 9

these attributes. Each attribute can be thought of as a dimension in the data


space. The user record has multiple attributes and can be visualized in multi-
dimensional space. The addition of each dimension increases the complexity
of analysis techniques.
A simple linear regression model that has one input dimension is relatively
easy to build compared to multiple linear regression models with multiple
dimensions. As the dimensional space of data increase, a scalable framework
that can work well with multiple data types and multiple attributes is
needed. In the case of text mining, a document or article becomes a data
point with each unique word as a dimension. Text mining yields a dataset
where the number of attributes can range from a few hundred to hundreds
of thousands of attributes.

1.3.3 Complex Questions


As more complex data are available for analysis, the complexity of informa-
tion that needs to get extracted from data is increasing as well. If the natural
clusters in a dataset, with hundreds of dimensions, need to be found, then
traditional analysis like hypothesis testing techniques cannot be used in a
scalable fashion. The machine-learning algorithms need to be leveraged in
order to automate searching in the vast search space.
Traditional statistical analysis approaches the data analysis problem by
assuming a stochastic model, in order to predict a response variable based
on a set of input variables. A linear regression is a classic example of this
technique where the parameters of the model are estimated from the data.
These hypothesis-driven techniques were highly successful in modeling sim-
ple relationships between response and input variables. However, there is a
significant need to extract nuggets of information from large, complex data-
sets, where the use of traditional statistical data analysis techniques is limited
(Breiman, 2001)
Machine learning approaches the problem of modeling by trying to find an
algorithmic model that can better predict the output from input variables.
The algorithms are usually recursive and, in each cycle, estimate the output
and “learn” from the predictive errors of the previous steps. This route of
modeling greatly assists in exploratory analysis since the approach here is not
validating a hypothesis but generating a multitude of hypotheses for a given
problem. In the context of the data problems faced today, both techniques
need to be deployed. John Tuckey, in his article “We need both exploratory
and confirmatory,” stresses the importance of both exploratory and confir-
matory analysis techniques (Tuckey, 1980). In this book, a range of data sci-
ence techniques, from traditional statistical modeling techniques like
regressions to the modern machine learning algorithms are discussed.
Another Random Scribd Document
with Unrelated Content
einigen Jahren wegen Mordes angeklagt, und man fand, daß er ein
Vermögen von 40 Millionen Mark besaß. Sein Spießgeselle Tschin-Ah-
Yam erfreute sich eines nahezu ebensogroßen Vermögens. Das
Obergericht in Singapore verurteilte den Distrikt-Großmeister der
Hungs, Namens Khu-Tan-Tek, vor kurzem zum Tode, und er erklärte,
man würde nicht den Mut haben, ihn hinzurichten. Thatsächlich
wurde ihm das Leben geschenkt, wie man sagt, weil man sich vor
der Rache der Hung-Mitglieder fürchtete. In China selbst wäre es
bisher natürlich vergebliche Mühe gewesen, gegen die Hungs
vorzugehen. Der beste Beweis ist ja der große Taipingkrieg, der auf
Veranlassung der Hung-Gesellschaft entfacht wurde und den China
erst durch die Hilfe der Europäer zu Ende führen konnte, nachdem
die volkreichsten Provinzen in Wüsten, die blühendsten Städte in
rauchende Trümmerhaufen verwandelt worden waren. In früheren
Zeiten schritt die chinesische Regierung wohl energisch gegen die
Hungs ein. So wurden in Canton an einem Tage allein dreitausend
von ihnen enthauptet, und gelegentlich der Unruhen in Peking im
Jahre 1817 wurden zehntausend in die dortigen Gefängnisse
geworfen, wo sie verschmachteten. Allein die Hungs sind eine
lernäische Schlange und der Kaiser von China leider kein Herakles.
Dagegen wurde in den europäischen Kolonien in Ostasien die
Unterdrückung der Hung-Gesellschaft mit mehr oder minder Erfolg
durchgeführt. Die Hungs sind die Ursache, daß sich der Sultan des
unabhängigen Malayenstaates Perak unter den Schutz Englands
stellen mußte, denn er konnte mit seiner Macht gegen die
fünfzigtausend Hungs in seinem Staate nicht ankämpfen. In
Niederländisch-Indien und in den Philippinnen machte man zuerst in
furchtbarer Weise Bekanntschaft mit den Hungs, und dem Morden,
Plündern und Rauben wurde dadurch wenigstens teilweise Einhalt
gethan, daß man auf die Verleitung zum Eintritt in den Geheimbund
die Todesstrafe setzte. Ebenso wurden über jene Chinesen, in deren
Besitz man Flaggen, Bücher oder Abzeichen der Hung-Gesellschaft
fand, die schwersten Strafen verhängt. Die ganze mongolische
Bevölkerung wurde strenger Kontrolle unterworfen, indem man
ihnen eigene Quartiere anwies, außerhalb welcher sie nicht wohnen
durften. Die Quartiere wurden in Bezirke abgeteilt und eigenen
Beamten und Polizisten unterstellt, die für die Bevölkerung
verantwortlich waren. In jeder Straße oder Abteilung einer solchen
waren eigene Wachleute, die jeden Einwohner persönlich kannten
und dafür zu sorgen hatten, daß niemand nach einer bestimmten
Sperrstunde ohne triftigen Grund seine Wohnung verließ. Allein auch
diese strenge Maßregeln konnten die geheimen Gesellschaften nicht
unterdrücken, wie die äußerst bewegte Geschichte der spanischen
und niederländischen Kolonien hinlänglich beweist. Wie oft wurde
Manila von den Hungs und anderen Geheimbündlern geplündert und
besetzt! Wie oft war es notwendig, mit der ganzen Garnison gegen
sie vorzugehen! Ebenso war Bandjermassin auf Borneo die Stätte
blutiger Kämpfe, so daß die niederländisch-indische Regierung sich
entschloß, alle Mitglieder der Hungs und alle verdächtigen Chinesen
aus ihrem Gebiet zu verweisen. Zehn Jahre später schrieb aber
Schlegel: „Es ist unmöglich gewesen, die Hungs aus ihren
Wohnsitzen gänzlich zu vertreiben. Sie bestehen heute noch an allen
Orten”. Die vielen Tausende, welche Niederländisch-Indien wirklich
verließen, wandten sich nach dem Sultanat von Sarawak im
Nordwesten Borneos, und Rajah Brook konnte sich gegen dieses
Raubgesindel nicht anders helfen, als indem er zehntausend der
eingeborenen Dayaks anwarb und gegen die Chinesen zu Felde zog.
So wurden sie vernichtet.
Merkwürdigerweise wurden die Geheimgesellschaften trotz all
dieser traurigen Erfahrungen, trotz der großen Unsicherheit in
Singapore und Penang, trotz der vielen Raubanfälle, Kämpfe und
Morde in diesen englischen Kolonien am längsten geduldet, bis
endlich der Aufstand von 40000 bewaffneten Chinesen im Jahre
1876 auch hier energische Maßregeln nach sich zog. Statt aber ihre
Unterdrückung anzuordnen, beschränkte sich das englische
Kolonialamt auf ihre Registrierung und Beaufsichtigung. Erst 1888,
nachdem die Zustände unerträglich geworden waren und die
englischen Beamten in ihrem Leben bedroht wurden, beschloß man
die gänzliche Ausrottung der Geheimbünde, die auch thatsächlich
gelungen sein soll. Auf wie lange, ist eine andere Frage.
Nächst der Tien-ti-Gesellschaft ist der gefürchtetste, mächtigste
und verbreitetste Geheimbund Chinas die Wu-wei-kian, zu deutsch
„Thue nichts”, jener Bund, welchem das jüngste Hinmorden der
christlichen Missionare 1895 zugeschrieben wird und dessen
Mitglieder von den Europäern Vegetarianer genannt werden. In
früheren Zeiten führte der Bund den Namen „weißer Lotos”, und
1724 erließ der Kaiser Yung-Tsching gegen ihn ein Edikt, demzufolge
alle Mitglieder vogelfrei erklärt wurden. H. F. Balfour hat sich
während seines langjährigen Aufenthaltes in Shanghai eingehend mit
den Vegetarianern beschäftigt, die diesen Namen deshalb führen,
weil ihnen der Genuß von Fleischspeisen verboten ist. Ursprünglich
durften sie keine farbigen Kleider tragen, keine spitzigen Waffen
oder Werkzeuge benutzen (thatsächlich waren die Wunden der
jüngst ermordeten Missionare durchweg Hiebwunden) und kein
Vermögen besitzen. Beim Eintritt in den Bund müssen sie jetzt noch
ihre ganze Habe dem Bund abtreten und behalten nur die
Nutznießung, solange sie leben. Die Mehrzahl der Bündler gehören
den wohlhabenderen Ständen an, und der Bund, der im Gegensatz
zu dem Tien-ti einem einzigen Oberhaupt oder Großmeister
untersteht, soll demnach auch ungeheure Reichtümer besitzen. Zu
Beginn des Jahrhunderts beschlossen die Vegetarianer die
Vernichtung der Kaiserdynastie in Peking. Der Plan wurde entdeckt,
und der Kaiser Kia-King dekretierte die Ausrottung der Vegetarianer
im ganzen Reiche. Sie zogen sich unter ihrem Großmeister Fang-
Yung-Tschen nach ihrem Hauptquartier Nanking zurück und hielten
monatelang der Belagerung durch die Kaiserlichen stand. Endlich fiel
Nanking, der Vicekönig ließ Tausende köpfen und gewährte nur
jenen Gnade, die sich entschließen würden, Fleisch zu essen, um
dadurch ihre Unterwerfung und Lossagung von dem Geheimbunde
auszudrücken. Thatsächlich unterwarfen sich sehr viele, allein keiner
davon blieb lange am Leben. Sie wurden als Renegaten von den
übriggebliebenen Geheimbündlern ermordet.
Statt unterdrückt und vernichtet zu sein, wechselten die
Mitglieder der Gesellschaft den Namen derselben vom „weißen
Lotos” in „Thue nichts” und sind heute zahlreicher und gefürchteter
als je zuvor. Der Grund davon liegt darin, daß die Wu-wei-kian auf
den Aberglauben des Volkes wirken. Die Chinesen halten sie für
Magiker, im Bund mit diabolischen Mächten. Balfour sagt darüber:
„Gebildete Chinesen haben mir allen Ernstes versichert, daß die Wu-
wei-kian aus Papier Vögel ausschneiden und diesen mittels eines
Zaubermittels Leben einflößen. Sie können auch ihren Atem
unglaublich lange Zeit anhalten, bis sie im Gesichte schwarz werden
und alles Leben in ihnen erloschen zu sein scheint. Während dieser
Zeit verläßt die Seele ihren Leib, um allerhand Auskünfte einzuholen;
sobald sie zurückkehrt, gelangen die Wu-wei-kian wieder zum
Leben”.
Das Hauptstreben der Gesellschaft ist wie bei den Hungs
ebenfalls gegen die Fremdherrschaft, also gegen die Mandschuren
gerichtet. Allein sie gehen in ihrem Grundsatz „China für die
Chinesen” noch weiter und stehen allen Europäern und allen
europäischen Religionen, demnach zunächst den Missionaren,
feindlich gegenüber. Eine ganze Menge der Morde und Angriffe auf
Missionshäuser in den letzten Jahrzehnten werden ihnen in die
Schuhe geschoben, ebenso wie sie auch direkt der jüngsten
Greuelthaten beschuldigt werden.
Die drittgrößte Geheimgesellschaft ist die Ko-Lao-Wai oder
„Gesellschaft des älteren Bruders”. Als der letztere wird die frühere
Kaiserdynastie Tang angesehen, und das Streben der Gesellschaft ist
es, an die Stelle der Mandschuren die Nachkommen der Tang zu
setzen. Das Hauptquartier der Ko-Lao sind die mittleren Provinzen
Chinas, Hunan und Honan, und die Mitglieder des Bundes bestehen
hauptsächlich aus Soldaten. Boyle sagt über sie: „Nach allen
Berichten sind sie eine tollkühne und gewissenlose Bande, die in den
mittleren Provinzen des Reiches einen großen Teil der Missethäter
und Vagabunden zu ihren Mitgliedern zählt”, und Balfour sagt: „Es ist
gar nicht zu bezweifeln, daß, wenn einer ihrer alten Generale die
Fahne des Aufruhrs entrollen würde, binnen kürzester Zeit
hunderttausend Mann um ihn geschart wären”. Nach Briefen, die ich
während meines Aufenthalts in China erhielt, wird dem Einfluß dieser
Ko-Lao großenteils der Mißerfolg der chinesischen Waffen im
Feldzuge gegen Japan zugeschrieben. Die Regimenter, welche
zahlreiche Ko-Lao in ihren Reihen hatten oder ganz aus solchen
bestanden, weigerten sich zu kämpfen oder liefen ganz davon in der
Hoffnung, daß durch die Niederlagen die Mandschudynastie gestürzt
würde und damit ihre Hoffnungen auf die Tangdynastie größere
Aussicht auf Erfüllung hätten.

Proklamation der Behörden von Südschantung zum Schutze der Missionen.


Auch die Mohammedaner, deren Zahl in China zwanzig bis
fünfundzwanzig Millionen erreicht, haben ihren eigenen großen
Geheimbund, Hwuy-Hwuy-Jin genannt. Novizen werden dadurch
gereinigt, daß man sie zunächst tüchtig durchbläut und ihnen dann
Seifenwasser zu trinken giebt, was die Nachwirkung des bei den
Taoisten so beliebten und bei den Mohammedanern verpönten
Schweinefleisches paralysieren soll. Die unzähligen anderen
Geheimgesellschaften Chinas sind viel kleiner und mehr auf gewisse
Provinzen oder Städte beschränkt, gerade wie bei unserer eigenen
Vereinsmeierei. Auf die sozialen und politischen Zustände des
Reiches üben sie keinen nennenswerten Einfluß aus. Ob der große
Mohammedaneraufstand des Jahres 1895 in den Provinzen Schensi
und Kansu auf den Einfluß der Geheimbünde zurückzuführen ist,
kann nicht gesagt werden. Die Aufständischen waren hauptsächlich
von religiösem Fanatismus und blindem Chinesenhaß erfüllte
Banden, die hier schon seit Jahrhunderten einen Rassenkrieg gegen
die Ungläubigen führen; mit diesem Namen nämlich werden die
Chinesen von den Mohammedanern bezeichnet. Die letzteren,
obschon ähnlich gekleidet wie die Chinesen und allen Gebräuchen
derselben, selbst dem Zopftragen und dem Verkrüppeln der Füße bei
den Frauen unterworfen, sind doch anderer Rasse, denn sie
stammen aus dem fernen Turkestan und wurden vor einem
Jahrtausend von den Kaisern der Tangdynastie nach Kansu gerufen,
um dieses gegen die Einfälle der Tibetaner zu schützen. Sie erhielten
dafür die Bewilligung, sich in Kansu und Schensi anzusiedeln,
verbreiteten sich aber auch auf die Nachbarprovinzen, vornehmlich
nach Schantung, und zählen heute zusammen etwa zwanzig
Millionen. Sie leben mitten unter den Chinesen, vermengen sich aber
niemals mit diesen und sind ihnen auch seit jeher feindlichgesinnt
geblieben. Auch die Mohammedaner haben ihre Geheimgesellschaft,
deren Streben es ist, die beiden Provinzen ganz von Chinesen zu
befreien und ein unabhängiges mohammedanisches Reich zu
gründen. Teilweise ist auch religiöser Fanatismus ein Grund des
Hasses gegen die Chinesen, denn diese haben ihnen wohl die
Ausübung ihrer Religion gestattet, aber die Moscheen im Reiche der
Mitte dürfen über den Pforten keinen Halbmond und keine
Bezeichnung als Moscheen tragen; im Innern der Moscheen sind
überdies auf Anordnung der chinesischen Behörden Statuen des
Confucius und die Ahnentafeln der chinesischen Kaiser aufgestellt,
die von den Mohammedanern verehrt werden müssen. Das,
zusammen mit dem Rassenhaß und den Bedrückungen durch die
Mandarine, läßt die Gärung unter den Mohammedanern nicht zur
Ruhe kommen.
Bald nach dem chinesisch-japanischen Kriege und vielleicht als
Folge desselben und der dabei zu Tage getretenen Ohnmacht der
Mandschuregierung entstand auch in Schantung ein Geheimbund,
Tjiu-dschung-tsau, allem Anschein nach dasselbe wie die weiße
Lotosgesellschaft, nur unter anderem Namen. Die Geheimbündler
verbreiteten unter den Chinesen den Glauben, daß sie unverwundbar
seien; dadurch gewannen sie so großen Einfluß, daß sogar die
Mandarinen sich ihrer bedienten, um dem Räuberunwesen zu
steuern, wenn ihre Militärmacht nicht ausreichte. Allmählich wurden
aber die Geheimbündler selbst zu Räubern, ein Schrecken für
Südschantung, so daß die Provinzregierung endlich reguläre Truppen
gegen sie aussandte. Schon im ersten Kampfe mit den
Provinztruppen fiel eine ganze Menge der Unverwundbaren unter
den Schwertstreichen; die Gefangenen wurden von den
Ortsmandarinen in die Holzkäfige gesteckt, wie sie in den Höfen
jedes Yamens in Schantung stehen, und in diesen Käfigen am Halse
aufgehängt. Nach zwei bis drei Tagen fanden die Unverwundbaren
so ihren jämmerlichen Tod. Die Seifenblase war geplatzt, mit den Tji-
dschung-tsau war es schon in den Sommermonaten 1895 vorbei.
Aber die Chinesen sind leichtgläubige Leute, und dazu ist die
Unzufriedenheit mit der Regierung wie mit dem stetigen
Fortschreiten der Europäer so groß, daß es bald zu einem neuen
Geheimbunde kam, der wohl ganz wie der letzte auch nur ein
Auswuchs der Sekte der Weißen Lotos sein dürfte, nur unter einem
anderen Namen. Dieser Name ist eben Ta-tau-hui oder Gesellschaft
der Großen Messer. Warum Große Messer, weiß ich nicht, denn ihre
Waffe ist ebenfalls nur eine lange, schmale zweischneidige Lanze, im
Chinesischen Piau-djiang genannt. Ich sah eine derartige erbeutete
Waffe bei einem der Mandarine von Tsinan-fu.
Auch die Ta-tau-hui geben sich als unverwundbar aus, und ihr
Schutzmittel sind ebenfalls Papierzettel mit allerhand Zauberformeln.
Sie haben auch früher, als sie von der Regierung noch nicht so
verfolgt wurden, in ähnlicher Weise Waffenübungen veranstaltet wie
die Tji-dschun-tsau. Ihr Streben ist dasselbe: Vertreibung der
Mandschuregierung, Vertreibung der Europäer. Hauptsächlich zu
dem Zweck, um der Regierung Knüppel zwischen die Beine zu
werfen, haben sie im Jahre 1895 über zwanzig Bethäuser der
katholischen Mission von Südschantung niedergebrannt. China
mußte schon damals der Mission einen Schadenersatz von 10000
Tiau (1 Tiau etwa 1 Mark 60 Pfennig) leisten. Die Provinzregierung
wurde angewiesen, die Ta-tau-hui zu vertreiben, und in der That zog
der jetzige Nien-Tai (Provinzialrichter) von Schantung, welcher
damals Yü-ta-dschen (Mandarin) von Tsau-tschau-fu war, an der
Spitze von Regierungstruppen persönlich gegen die Großen Messer
ins Feld. Die letzteren wurden versprengt, dreißig von ihnen
gefangen und in der Stadt Schain-hsien hingerichtet. Unter den
Hingerichteten befand sich auch ein Anführer der Großen Messer,
Namens Liu-schö-dsau. Aber das eigentliche Haupt, der schon
genannte Tschan-tsia-dschi, flüchtete über die Grenze nach Honan
und konnte bis heute nicht festgenommen werden. Ich habe selbst
die Proklamation angeschlagen gesehen, in welcher die Regierung
den Betrag von 1000 Taels auf seinen Kopf setzt.
Chinesisches Räuchergefäß.

Dieses strenge Vorgehen für die an den Missionen verübten


Unthaten erbitterte die Großen Messer natürlich noch mehr. Bald
darauf wurden in Kü-ye die beiden unglücklichen Missionare Nieß
und Henle ermordet und so viele andere Schandthaten verübt, daß
auch von Peking auf die Beschwerden des Missionsleiters die
strengsten Befehle zur Unterdrückung der Großen Messer kamen.
Die Provinztruppen schlugen die Horden auch in mehreren blutigen
Gefechten, und der Gouverneur berichtete nach Peking, der
Geheimbund bestände nicht mehr. Das war in der That der Fall, denn
um der Verfolgung durch die Regierung zu entgehen, organisierten
sich die Mitglieder wieder zu einem neuen Bunde unter anderem
Namen, jenem der Boxer. Aber der Zweck all dieser Gesellschaften
ist, wie die Ereignisse gezeigt haben, stets der gleiche: Vertreibung
der Fremden, China für die Chinesen.
Chinesisches Zeitungswesen.
ie in so vielen andern Dingen, so zeigt die chinesische Kultur
auch in Bezug auf das Zeitungswesen die größten
Widersprüche. Während Europa nur noch wenige Kleinstädte
besitzt, die nicht ihre eigene Tageszeitung aufzuweisen hätten,
wohnen zwischen dem Himalaya und der sibirischen Grenze gegen
vierhundert Millionen Menschen, denen der Begriff Zeitung in
unserm Sinne noch vollständig unbekannt ist. Und doch wären alle
Grundbedingungen dafür in China massenhaft vorhanden. Die
Chinesen sind ja die Erfinder des Papiers, der Druckerschwärze, des
Buchdrucks, ja der Zeitungen selbst. Schon vor dreizehnhundert
Jahren schnitten sie ihre Schriftzeichen in Holzplatten und druckten
ganze Werke. Vor achthundert Jahren, im Jahre 1040, erfanden sie
die beweglichen Drucktypen, und während wir in Europa die Zeitung
als eine Errungenschaft der neuesten Zeit ansehen, besaßen die
Chinesen deren eine schon vor elfhundert Jahren, denn chinesische
Werke aus der Zeit der Dynastie Tang, zwischen den Jahren 713 und
741, erwähnen bereits die Pekinger Staatszeitung. Sie ist also um
viele Jahrhunderte die älteste Zeitung der Welt, mit seltener
Pünktlichkeit durch Generationen hindurch Tag für Tag erscheinend.
Zu einer Tageszeitung im Inlande haben es aber die Hunderte
von Millionen Zopfträgern bis auf die jüngste Zeit nicht gebracht,
obschon es weder an schriftstellerischen Talenten, noch an Lesern,
noch an Stoff mangelt. Und an Neugierde fehlt es wahrscheinlich
ebensowenig, wenn man den großartigen Stadtklatsch in Betracht
zieht, der durch Hausierer, Barbiere, Dienerschaft von Straße zu
Straße verbreitet wird und stets willfährige Zuhörer findet. Oder ist
vielleicht die Regierung daran schuld, die mit
eiserner Faust alle Zeitungsunternehmungen
niederhält, Redakteure verfolgt und einsperrt,
wie es bei uns, sagen wir vor dem Jahre 1848,
der Fall war? Nicht im mindesten. Das
mittelalterliche China ist im Gegensatz zu
manchem unserer modernen Kulturstaaten das
Paradies der Preßfreiheit. Jeder kann drucken
und veröffentlichen, was er will. Es giebt kein
Preßgesetz, keine Bürgschaft, keinen
Zeitungsstempel, keine Zensur, keine
Beschlagnahme. Litteratur, besonders die
klassische, wird in China hochgeschätzt. Die
Litteraten gehören zu den angesehensten
Ständen, und von der Bevölkerung ist vielleicht
ein gleicher Prozentsatz des Lesens kundig wie
unter den Völkern von Südeuropa. Dennoch hat
sich China bis auf die jüngste Zeit mit der
einzigen Pekinger Zeitung begnügt. Messing-Opiumlampe
Diese Pekinger Zeitung, im Chinesischen aus Kiautschou.
„Tzing pao”, ist in Bezug auf ihre Redaktion, ihr
Aussehen und ihre Verbreitung ein Unikum. Der Text beschränkt sich
auf Hofnachrichten und die Veröffentlichung von kaiserlichen
Erlassen, Ernennungen, Gesetzen und Strafen. Alle Dokumente der
ganzen Regierungsmaschine dieses größten Reiches der Welt
gelangen in den großen Staatsrat, und dieser verfügt, welche
Dokumente veröffentlicht werden sollen. Abschriften derselben
werden dann dem Geheimen Rat übergeben, von welchem täglich
ein Mandarin den Dienst im kaiserlichen Palast versieht. Dem
Geheimen Rat liegt es ob, die Dekrete, Diplome, Urteile und
dergleichen an ihre Bestimmung gelangen zu lassen, und dazu
werden sie der Generalpostdirektion, einer Abteilung des
Kriegsministeriums, übergeben, die sie durch eigene Kuriere nach
den verschiedenen Provinzen entsendet, denn ein geregeltes
Postwesen nach europäischem Muster ist ja in China unbekannt.
Gleichzeitig mit den Beamten der Postdirektion finden sich im
Geheimen Rate täglich auch Beamte der Ministerien und die
Redakteure der Pekinger Zeitung ein, um von den verschiedenen
Dokumenten Abschriften anzufertigen. Die Druckerei der Pekinger
Zeitung, ein halbamtliches Unternehmen, untersteht der
Oberaufsicht der Postdirektion; sie hat darauf zu achten, daß der
Wortlaut der amtlichen Bekanntmachungen nicht geändert oder
gekürzt werde; sie erhält auch täglich eine für die verschiedenen
Behörden der Hauptstadt wie der Provinzen bestimmte Anzahl
Abdrücke, die sie gleichzeitig mit den anderen Dokumenten durch
die Kuriere versendet.
Man wird sich möglicherweise über den Ausdruck
Zeitungsdruckerei wundern, denn bisher wurde ziemlich allgemein
angenommen, daß die Pekinger Zeitung täglich in der erforderlichen
Anzahl von Exemplaren geschrieben wird. Dies ist ein Irrtum. Die
wirklich offizielle Pekinger Zeitung wird gedruckt, gerade so wie
unsere Regierungszeitungen, und es besteht in Peking hierfür eine
eigene Druckerei mit Setzern und Pressen, nur erfolgt der
Zeitungsdruck dort nicht so einfach und rasch wie bei uns. Es
vergehen immer einige Tage, bis eine Ausgabe der Zeitung
hergestellt ist. Man muß sich eben vor Augen halten, daß unsere
Setzer im ganzen mit ein paar Dutzend Buchstaben zu arbeiten
haben, die in Kästen vor ihnen liegen, ja bei den neuen
amerikanischen und deutschen Setz- oder Zeilengießmaschinen
fallen sogar diese Setzkästen fort, und die Setzer arbeiten wie an
einer Schreibmaschine. In der chinesischen Sprache giebt es statt
einzelner Buchstaben ebensoviele Tausende verschiedener Zeichen;
jedes Wort oder doch jede Silbe hat ihr eigenes Zeichen, und
dementsprechend giebt es in chinesischen Druckereien auch ganze
Katakomben gefüllt mit Tausenden von Kästchen, jedes mit anderen
Typen. Die größte Druckerei, die ich in China zu besuchen
Gelegenheit hatte, war jene der katholischen Mission in Zikaway, am
Sutschaukanal gelegen. Ich wanderte dort lange Gänge, zu beiden
Seiten mit derartigen Kästen besetzt, auf und ab. In jedem lagen
verschiedene Typen, nicht etwa die winzigen Metallstäbchen, die so
leicht zu handhaben sind, sondern Holzstücke von etwa einem
Quadratcentimeter Durchschnitt für die gewöhnlichen Typen. Unsere
Buchstaben sind einfach in der Form und leicht zu erkennen. Die
chinesischen Zeichen aber bestehen der Mehrzahl nach aus zwanzig
bis dreißig verschiedenen Strichlein, kunterbunt durcheinander
gezogen, mit Auswüchsen, Quadrätchen, Punkten und Kreislinien,
daß einem europäischen Setzer die Haare zu Berge stehen würden,
hätte er es auch nur mit sechsundzwanzig derlei Zeichen zu thun.
Und die Chinesen haben deren mindestens ebensoviele Tausende.
Dabei sind mitunter Dutzende dieser schwer zu unterscheidenden
Hieroglyphen nur durch ganz kleine Strichlein oder Punkte
voneinander unterschieden. Welche Freude für den Setzer und erst
recht für den Korrektor! Ein chinesischer Setzer müßte, wollte er sich
aus den langen Galerien die Typen selbst zusammenholen, so viel
umherlaufen wie ein Briefträger; er hat deshalb gewöhnlich einige
Laufburschen zu seiner Verfügung, welche ihm die verschiedenen
Typen, deren er bedarf, aussuchen.
Unter solchen Umständen darf es nicht wundernehmen, daß der
Satz chinesischer Handschriften so viele Zeit beansprucht. Aber auch
der Druck geht ähnlich langsam vor sich. Die Papierblätter der
Pekinger Zeitung, neunzehn Centimeter hoch und zwanzig
Centimeter breit, liegen neben dem Drucker, der den Satz in einem
Holzrahmen vor sich stehen hat. Zunächst nimmt er mittels einer
breiten Bürste, einem umgekehrten Blumenstrauß nicht unähnlich,
etwas Druckerschwärze aus einem muldenartigen Gefäß und
schwärzt die Typen. Dann legt er sorgfältig ein Blättchen darauf und
fährt mit einem kleinen harten Handkissen darüber. Damit ist ein
Blatt einer Zeitung fertiggedruckt, denn weder bei chinesischen noch
bei japanischen Büchern wird die Rückseite bedruckt. Die Blätter
werden mit dem Druck nach außen einmal gefaltet und an den
offenen Seiten zusammengeheftet. Würde man ein chinesisches
Buch aufschneiden, so ergäben sich nach je zwei bedruckten Seiten
immer zwei leere.
Ein solches Buch ist nun auch jedes Exemplar der offiziellen
Pekinger Zeitung, denn der Inhalt verteilt sich auf zehn bis zwanzig
und noch mehr Blätter, je nach der Menge des Textes. Sind alle
Blätter in der geschilderten Weise gedruckt worden, so werden sie
gefaltet und zusammengeheftet dadurch, daß man sie etwa einen
Centimeter vom Rückenrand durchlocht, Bindfäden aus gedrehtem
Papier durchzieht und diese zusammenknüpft. Ueber die Bindfäden
aus Papier darf man sich nicht wundern, denn das chinesische Papier
ist aus viel zäheren Stoffen angefertigt als das unserige. In Korea
fand ich sogar aus Papier gedrehte Seile und Schnüre allgemein im
Gebrauch.
Jedes Exemplar der Pekinger Zeitung wird nun mit einem
Umschlag von gelbem Papier versehen, denn gelb ist die Farbe des
Kaisers; dann wird noch auf der hintersten Seite des Umschlags in
roter Farbe der Name Tsing-pao, d. h. Hauptstadtzeitung
aufgedruckt, und damit ist die Zeitung zur Ausgabe bereit. Eigene
Kuriere der Postbehörde übernehmen die Pakete und laufen damit
durch die Straßen Pekings, um sie den einzelnen Mandarinen,
Gesandtschaften und sonstigen Abonnenten zu überbringen. Auf die
Zeitung kann nämlich auch um den geringen Preis von beiläufig
einer deutschen Reichsmark für den Monat abonniert werden.
Davon machen auch eigene halbamtliche Druckereien in jeder
Provinzhauptstadt Gebrauch. Kaum ist der Kurier aus Peking mit den
Regierungsdepeschen und den Zeitungsnummern im Yamen des
Generalgouverneurs oder Vizekönigs eingetroffen, so kommt ein
Zeitungsexemplar nach der Druckerei, um dort für die Abonnenten
und Behörden der Provinz nochmals vervielfältigt zu werden.
Der ganze geschilderte Vorgang nimmt wie gesagt mehrere Tage
in Anspruch. Nun liegt es aber im Interesse der Behörden und
Gesandtschaften, so rasch als möglich in den Besitz der einzigen
offiziellen Regierungsnachrichten zu kommen, und deshalb werden
mit stillschweigendem Einverständnis der Postverwaltung in Peking
noch zwei andere Ausgaben der Zeitung veranstaltet. Bei der einen,
„T’schang peun”, d. h. lange Zeitung (weil das Format etwas länger
ist), wird der Text der Dekrete auf Wachsplatten rasch
eingeschnitten und von diesen der Druck veranstaltet; für die zweite
„Sie’-peun”, d. h. geschriebene Zeitung, wird der Inhalt der
Dokumente von Schreibern rasch in der erforderlichen Anzahl von
Exemplaren abgeschrieben. Sie besteht aus einem einfachen Blatt
Papier ohne Umschlag. Diese Ausgabe kommt gewöhnlich einige
Tage früher als die gedruckte zur Verteilung und kostet, ihrer
Herstellungsweise entsprechend, erheblich mehr, d. h. etwa 24
Reichsmark monatlich.
Nehmen wir einmal eines der gelben offiziellen Zeitungshefte zur
Hand. Natürlich müssen wir, wie bei arabischen und jüdischen
Büchern, von rückwärts beginnen. Jede Seite wird durch violette
Linien in sieben vertikale, etwas über einen Centimeter breite
Rubriken geteilt, und in jeder Rubrik stehen vierzehn Zeichen, die
aber nicht am oberen Rande, sondern etwa fünf Centimeter weiter
unten beginnen. Auf jeder Seite bleibt dieser obere Raum als
Ausdruck der Achtung für die kaiserlichen Dekrete und Nachrichten
frei, gerade so wie wir es in unseren Briefen an Hochgestellte zu
thun pflegen.
Die erste Rubrik der ersten Seite, nach unserer Lesart also die
letzte, enthält das Datum: Tag, Monat und Regierungsjahr des
Kaisers; die zweite die Inhaltsangabe (mu-lu). Dann folgen auf dem
Rest der ersten und zuweilen auch der zweiten Seite Hof- und
Palastnachrichten. Jeder Ausgang des Kaisers, jedes Gebet, jeder
Besuch wird genau mit allen Einzelheiten des Zeremoniells, der
Kleidung und des Gefolges verzeichnet. Die dritte Seite enthält den
Garnisonsbefehl, d. h. den Stand und die Dienstleistungen der
verschiedenen Tatarenbanner von Peking. Auf den folgenden Seiten
befinden sich die Edikte des Kaisers, dann die Ernennungen und
Verfügungen auf Grund von Meldungen der Zensoren und
Provinzgouverneure, schließlich Meldungen aus den verschiedenen
Provinzen und Vorkommnisse in Peking, kaiserliche, militärische oder
polizeiliche Strafen und dergleichen. Eine eigentümliche Einrichtung
der Pekinger Zeitung ist es, daß die Verfügungen des Kaisers
gewöhnlich einige Tage früher veröffentlicht werden als die Berichte
der Gouverneure, auf welche hin sie getroffen wurden, denn die
chinesische Hofetikette schreibt vor, daß die kaiserlichen Worte stets
allen andern vorgehen.
Im ganzen und großen ist also die Pekinger Zeitung etwa unseren
offiziellen Regierungszeitungen ähnlich, allein man würde sich
gewaltig irren, wollte man annehmen, ihr Inhalt wäre auch ähnlich
langweilig. Im Gegenteil, die Lektüre derselben oder vielmehr die
Uebersetzung ist für den Europäer, welcher Hof und Regierung,
Leben und Sitten in China kennen lernen will, eine unerschöpfliche
Quelle des Wissens, und ich gestehe offen, ich verdanke dieser
Lektüre mehr Nachrichten, Fingerzeige, Aufschlüsse als allen
dickbändigen Reisewerken über China. Ich bin zuerst in Siam auf
diese offiziellen Veröffentlichungen aufmerksam gemacht worden,
und während meiner folgenden Reisen in China, Korea und Japan
war es stets meine erste Sorge, möglichst viele Nummern der
Regierungszeitungen durchzustudieren. Sie sind die einzigen
Bädeker jener Länder. Das ganze China, von Peking bis in die
fernsten Grenzländer, vom kaiserlichen Hofleben bis herab zu dem
Treiben der Wegelagerer und Seeräuber entrollte sich in diesen
kleinen, mit Hieroglyphen gefüllten Blättchen vor meinen Augen:
Militär und Marine, Gerichtspflege, Tempelopfer und
Ahnenverehrung, Beamtenwesen, Agrikultur, Industrie, Aberglauben
und Volksgebräuche, und fürwahr, es könnte kein besseres Buch
über China geschrieben werden, als wenn man einen Jahrgang der
Pekinger Zeitung übersetzen und durch Erklärungen ergänzen
würde.
Das, was man in anderen Ländern gewöhnlich als offizielles
Vertuschungssystem bezeichnet, kennen die Chinesen nicht. Ich war
auf das höchste erstaunt, als ich in der Pekinger Zeitung alle
Missethaten der höchsten Mandarine, Ministerialbeamten,
Tatarengenerale ganz offen geschildert fand. Ja sogar Anklagen
gegen die Kaiserin-Exregentin, gegen die Kaiserinnen und Prinzen
von seiten der Zensoren finden in der Tsing-pao Aufnahme, dazu die
Strafen, welche der Kaiser auf Grundlage von Berichten zu erteilen
für gut fand. Wo wäre ein ähnliches Vorgehen in europäischen
Staaten denkbar?
Die Erklärung dieses merkwürdigen sozialen Phänomens liegt
darin, daß es in China keine innere Politik, keine politischen Parteien,
keinen Sozialismus und Anarchismus giebt; daß man in China keine
absolute, keine despotische Regierung, sondern im wahren Sinne
des Wortes nur ein Patriarchat kennt. Die Chinesen werden wie eine
Familie betrachtet, deren Patriarch der Kaiser ist, und vor diesem
giebt es kein hoch und niedrig, alle werden nach demselben Recht
und Gesetz behandelt.
In den dem europäischen Handel geöffneten Vertragshäfen
entstanden in den letzten Jahren auch einige chinesische
Tageszeitungen, aber sie wurden ursprünglich nicht durch Chinesen,
sondern durch Engländer gegründet. In diesen Vertragshäfen spielt
das Zeitungswesen eine bedeutende Rolle. Obschon beispielsweise
Shanghai nur etwa 6000 europäische Einwohner zählt, hat es fünf
Tageszeitungen, davon vier in englischer und eine in französischer
Sprache erscheinend, ferner mehrere Wochenblätter, darunter ein
deutsches: Der ostasiatische Lloyd, das einzige deutsche Blatt in
ganz Asien. Hongkong mit seinen 10000 Europäern besitzt drei
englische Tages- und zwei Wochenblätter, Tientsin, Amoy und
Futschau je eine Tageszeitung, obschon die europäischen Kolonien
dieser Städte kaum einige hundert Einwohner zählen. In der
portugiesischen Kolonie Macao giebt es noch einige portugiesische
Blätter. Als nun die Herausgeber einiger dieser europäischer
Zeitungen das rege Interesse sahen, welches ihre Veröffentlichungen
auch unter den englisch sprechenden Chinesen fanden, versuchten
sie die Herausgabe chinesischer Tagesblätter, welche gleichzeitig mit
den englischen erschienen, und der Erfolg war derartig, daß in den
letzten Jahren eine ganze Reihe chinesischer Blätter entstanden. So
erscheint in der Redaktion der China Mail in Hongkong die
chinesische Wa T’ziat Pao, in jener der Daily Preß die chinesische
Tschung Ngoi San Pao. Die größte chinesische Tageszeitung aber
wird von der Redaktion der North China Daily News in Shanghai
hergestellt und heißt Tschen-Pao (Shanghai-Neuigkeiten); ja die
unternehmenden Herausgeber dieser Blätter veröffentlichen seit
einiger Zeit sogar ein illustriertes Wochenblatt in chinesischer
Sprache, Hu-Pao (litterarische Neuigkeiten), und machen damit
vortreffliche Geschäfte. In Tientsin kommt gleichzeitig mit der
dortigen Times der Tsche-Pao (etwa die chinesischen Worte für
Times) heraus, und in der größten Stadt Chinas, in Canton, gab vor
zwölf Jahren der damalige Vizekönig Tschang-Tschi-Tong selbst die
Veranlassung zur Gründung einer chinesischen Tageszeitung, zu
deren Redakteur er einen seiner Sekretäre ernannte. Diese Zeitung,
Kwang-Pao (Neuigkeiten der Provinz Kwangtung), wurde von dem
Nachfolger des Vizekönigs eine Zeitlang unterdrückt, erscheint aber
jetzt wieder unter dem Namen Tschung si dsche Pao
(Tagesneuigkeiten aus China und dem Westen). Ist es nicht
bezeichnend für die Zustände in dem Jahrtausende alten Reiche der
Mitte, daß der Vizekönig einer der größten Provinzen desselben zum
Zeitungsgründer wird? Friedlich und freundschaftlich verträgt sich
dieses vizekönigliche Blatt mit seinem einzigen Cantoner Rivalen,
dem Ling nam dsche Pao, zu deutsch Tägliche Nachrichten von Ling
nam. Canton hieß nämlich in früheren Zeiten Ling nam. Auch in dem
durch den Frieden von Shimonoseki eröffneten Hafen Sutschau
wurde 1897 eine neue, dreimal monatlich erscheinende Zeitung
gegründet, welche den Namen Schiwu Pao, d. h. etwa „die Zeiten”,
führt. Ihre Druckerei beschäftigt sich auch mit der Uebersetzung und
Herausgabe von nützlichen europäischen Büchern.
Damit sind wohl alle Zeitungen des Vierhundertmillionen-Reiches
erschöpft, ein halbes Dutzend von je drei- bis sechstausend Auflage,
das Shanghaier Tschen-Pao ausgenommen, das täglich in einer
Auflage von zwölftausend Exemplaren gedruckt wird. Aber neben
diesen Blättern wirkt schon seit Jahren noch ein anderes,
halbwöchentliches Blatt, das an Auflage alle zusammen übertreffen
dürfte und bis in die entferntesten Provinzen des Reiches, ja nach
Tibet und der Mongolei geht, überall gelesen, überall beachtet wird
und ganz im stillen den größten Einfluß unter allen periodischen
Veröffentlichungen Chinas ausüben dürfte, ein Blatt, besser gedruckt
und von vornehmerem Aussehen als alle anderen, die Pekinger
Zeitung nicht ausgenommen. Es führt den Titel Y-wen-lu und wird
von den Priestern der katholischen Mission in Zikawei bei Shanghai
herausgegeben. In meisterhafter Weise verstehen es die
chinesischen Redakteure, katholische Priester, das Volk zu belehren,
Auszüge aus der Pekinger Zeitung wie aus den europäischen Blättern
zu bringen, dazu gediegene Artikel über Europa und seine
Errungenschaften, aber gleichzeitig wird auch für die katholische
Religion Propaganda gemacht, und es ist nicht zum geringsten
diesem Blatte zuzuschreiben, wenn die katholische Kirche heute in
China weit über eine Million Anhänger besitzt.
Die chinesischen Tagesblätter sind in Aussehen und Einteilung
nicht etwa das, was wir in Europa als chinesisch zu bezeichnen
pflegen, exotisch, eigentümlich, verzwickt, verschnörkelt, denn sie
sind ja nicht der chinesischen Kultur entsprungen, sondern der
europäischen und wurden nur der chinesischen angepaßt. Der
Mehrzahl nach besitzen sie etwa das Format der deutschen
Gartenlaube und haben vier Blätter, bei denen auch die Innenseiten
bedruckt sind, gerade so wie bei unseren Zeitungen. Auch die
Einteilung ist ganz dieselbe, nur umgedreht; dort, wo bei uns die
Anzeigen stehen, also auf der letzten Seite, befinden sich Titel und
Leitartikel, und das was bei uns die erste Seite ist, ist bei den
chinesischen Blättern die letzte, ganz gefüllt mit Reklamen. Da sage
man noch, die chinesische Kultur sei seit Jahrtausenden
stehengeblieben! Reklamen von Geheimmittelchen, Pillen und
Pülverchen, von Schneidern und Schustern, von Theatern und
Vergnügungen, Verlustanzeigen, Land-, Häuserverkäufe und
dergleichen. Manche dieser Anzeigen sind sogar schon mit kleinen
Bilderchen illustriert, um die Aufmerksamkeit besser anzuziehen.
Und all diese Dinge findet man nicht nur auf einer Seite. Nein, bei
den meisten Blättern sind vier ganze Seiten, also die Hälfte der
Ausgabe, mit Anzeigen gefüllt, deren Lektüre einen tiefen Einblick in
das wirkliche Volksleben und den Volkscharakter der Chinesen
gewährt. Zeigt die Pekinger Zeitung den Hof, das offizielle China und
jene Ereignisse, welche zur Kenntnis und Behandlung von seiten der
Regierung kommen, so führen die Reklameseiten der lokalen Blätter
den Fremden in den chinesischen Kleinverkehr, in die Details des
städtischen Lebens ein und zeigen, daß dieses Volk in den
Fremdenstädten im großen und ganzen gerade so lebt wie wir
Europäer, nur ins Chinesische übertragen.
Besehen wir uns die letzten, d. h. also die ersten Seiten der
chinesischen Zeitungen. Der Kopf ist ganz wie bei unseren Blättern;
der Titel recht groß, daneben in kleineren Zeichen die Stellen, wo
man in der Hauptstadt wie in den Provinzen abonnieren kann,
darunter das chinesische Datum. Der Preis einer Nummer ist
durchschnittlich etwa fünf bis sechs Sapeken, beiläufig anderthalb
Pfennig. Dann folgen vortrefflich geschriebene Leitartikel über in-
und ausländische Dinge, und die chinesischen Redakteure nehmen
gar keinen Anstand, der Regierung allerhand gutgemeinte
Ratschläge zu geben. Die zweite Seite enthält Auszüge aus der
Pekinger Zeitung, Ernennungen, kaiserliche Edikte, welche sich die
Zeitungen von ihren hauptstädtischen Korrespondenten, die es auch
in China schon giebt, telegraphieren lassen. Daran schließen sich
Uebersetzungen der Reuterschen Depeschen über die wichtigsten
Ereignisse der westlichen Welt, denn Reuter hat auch in Ostasien
seine Abonnenten. Den interessantesten Teil der chinesischen
Zeitungen bilden indessen die letzten Textseiten: Lokalnachrichten,
Feuilleton, kleine Korrespondenzen aus der Provinz, Personalsachen,
Gerichtspflege. Wie man sieht, haben sich die chinesischen Ritter der
Feder oder vielmehr des Pinsels, denn man schreibt in China mit
einem Pinsel, die europäischen Zeitungsredaktionen ganz zum
Vorbilde genommen. Nun kommen in den englischen Blättern, aus
welchen sie einen großen Teil ihrer Weisheit schöpfen, eine ganze
Menge von Begriffen und Dingen vor, für welche es
begreiflicherweise keine chinesischen Wörter giebt, wie z. B.
Telephon, Telegraph. Statt lange Umschreibungen zu gebrauchen,
nehmen sie ähnlich klingende chinesische Wörter zu Hilfe, die an
und für sich ganz andere Dinge bedeuten, was anfänglich dem
chinesischen Leser recht chinesisch vorkommen mag. In ihrer Art
sind sie wie unsere Bilderrätsel. So z. B. wird das Wort Ultimatum
von den chinesischen Redakteuren durch die Zeichen U-li-ma-tung
gebildet, Telephon aus den drei Zeichen to-li-fung, und status quo
aus ße-ta-tu-ko. Ebenso schwierig ist es für sie, in den Anzeigen
europäischer Kaufleute deren Namen zu schreiben. Deshalb besitzt
jedes europäische Haus einen eigenen chinesischen Namen, so z. B.
heißt Ehlers E-li-si, Golding Go-ting, Morrison Ma-li-sun, Wolf Wa-fu,
Wilkinson Way-king-sun. Nur Meier oder Mayer giebt es wie
allüberall auf unserm Erdball, auch sogar in China, Meyer bleibt
Meyer, wohin er kommt, nur wird der Name im Chinesischen Mei-ier
geschrieben.
Trotz all dieser Anpassungen der chinesischen Redakteure an ihre
englischen Vorbilder in Ostasien zeigt sich in ihren Berichten doch
ein naiver Geist, Aberglauben und Leichtgläubigkeit, die dem Leser
unwillkürlich ein Lächeln entlocken. Beim Lesen der einfältigen
Lokalberichte und Korrespondenzen aus der Provinz fiel mir die
merkwürdige Uebereinstimmung mit ähnlichen Berichten auf, wie sie
bei uns noch im letzten Jahrhundert häufig zu lesen waren und
allgemein Glauben fanden. Die Geschichte wiederholt sich eben, und
man kann die einzelnen Phasen unserer eigenen Kulturentwickelung
heute noch in fernen Ländern bei anderen Völkern wiederfinden,
unser Altertum, unser Mittelalter, unsere neuere Zeit. Das habe ich
auf meinen Reisen in allen Weltteilen in tausenderlei Einzelheiten
gesehen, das fand ich, wie gesagt, auch in der chinesischen Presse.
Ich erwähne hier nur einige den Cantoner Blättern entnommene
Nachrichten, z. B. vom 8. Mai 1894:
„Eine Jungfrau hatte in einem Rocke unvorsichtigerweise eine
Nadel stecken lassen, die ihr beim Ankleiden in die Haut drang.
Ratlos standen die herbeigerufenen chinesischen Aerzte, ohne Mittel,
zu helfen und den Schmerz zu lindern. Da rief ihr Bruder einen
Freund herbei, der sich auf dergleichen verstand. Er legte dem
Mädchen ein mit geheimen Zeichen beschriebenes Papier auf die
Brust, und am folgenden Tage kam die Nadel richtig zum Vorschein,
so daß sie entfernt werden konnte.”
9. Mai: „In Schuntak kamen bei einem starken Regenguß zwei
Fischlein vom Himmel nieder. Sie sahen so lieblich aus, daß die
Bevölkerung sie nicht zu speisen wagte. Sie wurden deshalb
sorgfältig in den Fluß gesetzt, wo sie lustig davonschwammen.”
10. Mai: „In der Pu-Tschi-Tschiaostraße mietete jemand ein Haus
und machte bekannt, daß er von den Heiligen zum Erlöser der
leidenden Menschheit bestimmt sei. Er fand starken Zuspruch,
besonders von Frauen. Da thaten sich die Nachbarn zusammen und
jagten ihn davon.”
11. Mai: „In einem Gebäude des Panyü-Ritters wuchs vor einigen
Tagen ein Bambus hervor, der in einem Vormittag die Höhe von
sieben Fuß erreichte, das Dach durchbrach und in drei Tagen siebzig
Fuß hoch war. Es giebt Leute, die das wunder finden, obschon
eigentlich nichts natürlicher ist. Der Boden ist dort schwefelhaltig,
und Schwefel ist bekannt wegen seiner Expansivkraft.”
Derartige Mitteilungen fand ich in jeder Zeitungsnummer,
zuweilen auf derselben Seite mit Reuterdepeschen. Das alte und das
moderne China begegnen sich in diesen Blättern, aber es wird gar
nicht mehr so lange dauern, bis die Bewohner der Hauptstädte derlei
naive Nachrichten gar nicht mehr lesen werden. Dafür werden sie
größere Aufmerksamkeit den Bank- und Verkehrsnachrichten, den
Wechsel- und Aktienkursen zuwenden, die von Jahr zu Jahr in den
wenigen bestehenden Blättern immer mehr Platz einnehmen. Der
Keim für den neuen Kurs ist auch in China gelegt, und in zwei
Jahrzehnten dürfte jede größere Stadt des Reiches der Mitte ihre
Zeitung besitzen.

Tabakspfeife der Schantungleute (⅓ der natürlichen Größe).


Geld- und Bankwesen.
o sehr der Außenhandel Chinas in den letzten Jahrzehnten auch
gestiegen ist, so bildet er noch heute nur einen kleinen
Prozentsatz des Binnenhandels dieses ungeheuren, an Größe den
ganzen europäischen Kontinent weit übertreffenden Reiches. China
ist so überaus reich an Naturprodukten aller Art, daß es bis auf die
jüngste Zeit ausländische Produkte kaum gebraucht hat; die
Produkte des Südens gehen nach dem Norden, jene des Nordens
nach dem Süden. Im ganzen Reiche findet der regste Austausch der
eigenen Erzeugnisse statt. Die Flüsse, Kanäle, Straßen, Pfade sind
jahraus jahrein mit Frachtladungen bevölkert, und wohl kein einziges
Reich der Erde dürfte einen so großen Binnenhandel besitzen wie
China.
Dabei hat China noch immer keine von jenen Erleichterungen des
Verkehrs, die wir heute bei uns als unerläßlich für den letzteren
ansehen: wenige Eisenbahnen, nur teilweise geregeltes Postwesen
und kein Münzwesen. Während in allen zivilisierten Staaten der Erde
Banknoten, Gold- oder Silbermünzen den Handel vermitteln, giebt es
in dem chinesischen Reiche keine solchen; nicht Gold und Silber,
sondern Kupfer ist der Standard, und was die Banknoten betrifft, die
von den Chinesen erfunden wurden und deren Einführung in den
Handelsverkehr schon der alte Marco Polo auf seinen Reisen in China
vor sechshundert Jahren gepriesen hat, so sind sogar diese in dem
Reiche der Mitte außer Kurs gekommen und nur noch in größeren
Städten in lokalem Gebrauch. Statt Pfund Sterling, Dollars,
Napoleons, Mark und Gulden giebt es in China nur kleine durchlochte
Kupferscheiben als gesetzliche Münze; sie sind es, die dem Tausende
von Millionen Mark erreichenden Geschäftsverkehr als Grundlage
dienen.

You might also like