Download ebooks file (Ebook) Deep Reinforcement Learning with Python: RLHF for Chatbots and Large Language Models, 2nd Edition by Nimish Sanghi ISBN 9798868802720, 8868802724 all chapters
Download ebooks file (Ebook) Deep Reinforcement Learning with Python: RLHF for Chatbots and Large Language Models, 2nd Edition by Nimish Sanghi ISBN 9798868802720, 8868802724 all chapters
https://ebooknice.com/product/deep-reinforcement-learning-with-python-
with-pytorch-tensorflow-and-openai-gym-36191592
ebooknice.com
https://ebooknice.com/product/deep-reinforcement-learning-with-python-
with-pytorch-tensorflow-and-openai-gym-36191596
ebooknice.com
https://ebooknice.com/product/deep-reinforcement-learning-with-python-
with-pytorch-tensorflow-and-openai-gym-38388262
ebooknice.com
https://ebooknice.com/product/deep-learning-for-natural-language-
processing-develop-deep-learning-models-for-natural-language-in-
python-11575184
ebooknice.com
(Ebook) Deep Learning with Python: Develop Deep Learning Models on
Theano and TensorFLow Using Keras by Jason Brownlee
https://ebooknice.com/product/deep-learning-with-python-develop-deep-
learning-models-on-theano-and-tensorflow-using-keras-7295338
ebooknice.com
https://ebooknice.com/product/biota-grow-2c-gather-2c-cook-6661374
ebooknice.com
https://ebooknice.com/product/deep-learning-for-natural-language-
processing-develop-deep-learning-models-for-your-natural-language-
problems-42525080
ebooknice.com
https://ebooknice.com/product/deep-learning-with-python-learn-best-
practices-of-deep-learning-models-with-pytorch-23971132
ebooknice.com
https://ebooknice.com/product/deep-learning-with-python-learn-best-
practices-of-deep-learning-models-with-pytorch-23971134
ebooknice.com
Deep Reinforcement
Learning with Python
RLHF for Chatbots and Large
Language Models
Second Edition
Nimish Sanghi
Deep Reinforcement Learning with Python: RLHF for Chatbots and Large Language
Models, Second Edition
Nimish Sanghi
Bangalore, India
Introduction������������������������������������������������������������������������������������������������������������xxi
v
Table of Contents
Running on Kaggle���������������������������������������������������������������������������������������������������������������� 30
Using devcontainer-Based Environments������������������������������������������������������������������������������ 30
Running devcontainer Locally����������������������������������������������������������������������������������������������� 31
Running on GitHub Codespaces�������������������������������������������������������������������������������������������� 34
Running on AWS Studio Lab�������������������������������������������������������������������������������������������������� 38
Running Using Lightning.ai���������������������������������������������������������������������������������������������������� 39
Other Options to Run Code���������������������������������������������������������������������������������������������������� 41
Summary������������������������������������������������������������������������������������������������������������������������������������ 41
vi
Table of Contents
vii
Table of Contents
viii
Table of Contents
ix
Table of Contents
x
Table of Contents
xi
Table of Contents
xii
Table of Contents
xiii
Table of Contents
Index��������������������������������������������������������������������������������������������������������������������� 617
xiv
About the Author
Nimish Sanghi is a seasoned entrepreneur and an angel
investor, with a rich portfolio of AI, automation, and SaaS
tech ventures across India, the United States, and Singapore.
He has over 30 years of work experience. Nimish ventured
into entrepreneurship in 2006 after holding leadership roles
at global corporations like PwC, IBM, and Oracle.
Nimish holds an MBA from Indian Institute of
Management, Ahmedabad, India (IIMA), and a Bachelor of
Technology in electrical engineering from Indian Institute of
Technology, Kanpur, India (IITK).
xv
About the Technical Reviewer
Akshay Kulkarni is an AI and machine learning evangelist
and thought leader. He has consulted several Fortune 500
and global enterprises to drive AI and data science-led
strategic transformations. He is a Google developer expert,
author, and regular speaker at major AI and data science
conferences (including Strata, O’Reilly AI Conf, and GIDS).
He has also been a visiting faculty member at some of the
top graduate institutes in India. In 2019, he was featured
as one of the top 40 under 40 data scientists in India. In his
spare time, he enjoys reading, writing, coding, and building
next-gen AI products
xvii
Acknowledgments
A huge thank you to the Apress team—particularly Sowmya Thodur, Celestin John, Mark
Powers, and Joseph Quatela—for their guidance and help in making this publication
possible. A huge shoutout to Akshay Kulkarni for meticulously reviewing the drafts to
ensure accuracy and completeness and for verifying the code. My gratitude also extends
to all the Apress staff who contributed in various ways.
A special mention to my wife, Suman, who once again became the pillar of our
family, shielding me from distractions and providing me the peace and space needed to
write this second edition. Your unwavering support was crucial.
I must also express my gratitude to the readers of the first edition, whose constructive
feedback was instrumental in shaping this edition. I eagerly await your honest opinions
of this book—did it meet your expectations, and was it worth your time? Your feedback
is invaluable, and I’m available at nimish.sanghi@gmail.com or https://github.com/
nsanghi for any comments or suggestions.
xix
Introduction
This book is about reinforcement learning, taking the readers through the basics to advanced
topics. Although this book assumes no prior knowledge of the field of reinforcement
learning, it expects the readers to be familiar with the basics of machine learning. Have you
coded in Python? Are you comfortable working with libraries like NumPy and scikit-learn?
Have you heard of deep learning and have you explored the basic build blocks of training
simple models in PyTorch? You should answer yes to these questions to get the most out of
this book. If not, I suggest you learn a bit about these concepts first. Nothing too deep—any
introductory online tutorial or book from Apress on these topics will be sufficient.
In this second edition, I have made some major changes while keeping most of the
content from the first edition. The main additions are related to the new developments
in the field of Large Language Models (LLM) and Multimodal Generative AI, which have
revolutionized the world since late 2022. Reinforcement learning (RL) has played a crucial
role in enabling this through Reinforcement Learning from Human Feedback (RLHF). This
edition has a new chapter dedicated to this topic. It gives the reader a high-level overview
of transformers, LLMs, and related topics like prompt engineering, Retrieval Augmented
Generation (RAG), parameter efficient fine-tuning (PEFT), and chaining of LLMs and LLM-
based auto agents, followed by a detailed explanation of the concept of RLHF. In the same
chapter, you'll also explore Proximal Policy Optimization (PPO), which is a popular state-of-
the-art RL based algorithm that was used by OpenAI for the RLHF fine-tuning of ChatGPT.
Another addition is a chapter on multi-agent RL (MARL) and deep MARL
(DMARL), which deals with more than one agent cooperating or competing in the same
environment. In this chapter, I start with the introduction and go all the way to a working
example. I limit the discussion to introducing the key concepts, enabling interested
readers to follow specialized texts on MARL for further exploration.
This edition also covers additional topics, like hyperparameter tuning. It includes an
overview of other topics like curiosity learning, use of transformers in RL in various ways,
emerging areas such as sample efficient offline RL, decision transformers, automated
curriculum learning, zero-shot RL, and various other advances in the field since the
first edition. The chapter on Deep Q networks has been split into two to provide better
organization to the topic.
xxi
Introduction
On the code front, there have been significant changes too. I cover a lot more about
RL environments. I introduce Gymnasium, the successor library of OpenAI Gym. I also
introduce other environments, like FinRL, which is dedicated to applying RL in market
trading, other robotic environments, and environments for MARL. I cover various other
RL libraries that have gained popularity since the first edition. The way code runs in 2024
is very different. Therefore, immediately in Chapter 1 the book gives readers step-by-step
installation instructions to be able to run the accompanying code on local machines
and/or cloud providers, including cloud-based monitoring and tracking of training.
This book walks readers through the basics of reinforcement learning, spending a lot
of time explaining the concepts in the initial chapters. A reader with prior knowledge of
reinforcement learning can go through the first four chapters quickly. Chapter 5 picks up
pace and starts exploring advanced topics, combining deep learning with reinforcement
learning. The accompanying code hosted on GitHub is an integral part of this book.
While the book has listings of the relevant code, Jupyter notebooks in the code repository
provide additional insights and practical tips on coding these algorithms. The reader is
best served by first reading the chapter and going through the explanations followed by
working through the code in the Jupyter notebooks. The reader is also encouraged to try
and rewrite the code on their own training agents for different additional environments,
as discussed in the book.
For a subject like this, math is unavoidable. However, I have tried to keep it minimal.
The book quotes a lot of research papers giving short explanations of the approach
taken. Readers wanting a deeper understanding of the theory should go through these
research papers. This book’s purpose is to introduce practitioners to the motivation and
high-level approach behind many of the latest techniques in this field. However, by no
means it is meant to provide a complete theoretical understanding of these techniques,
which is best gained by reading the original papers.
The book is organized into 13 chapters.
xxii
Introduction
xxiii
Introduction
xxv
CHAPTER 1
Introduction to
Reinforcement Learning
Reinforcement learning is a fast-growing discipline and is helping to make AI real,
especially when it comes to robots and autonomous vehicles. Combining deep learning
with reinforcement learning has led to many significant advances that are increasingly
getting machines closer to acting the way humans do. Recently, deep reinforcement
learning has been applied to Large Language Models like ChatGPT and others to make
them follow human instructions and produce output that’s favored by humans. This is
known as Reinforcement Learning from Human Feedback (RLHF).
This book starts with the basics and finishes up discussing some of the most recent
developments in the field. There is a good mix of theory (with minimal mathematics)
and code implementations using PyTorch and other libraries.
This chapter sets the context and gets everything prepared for you to follow along in
the rest of the book.
Reinforcement Learning
All intelligent beings start with some knowledge. However, as they interact with the
world and gain experience, they learn to adapt to the environment and become better
at doing things. To quote a 1994 op-ed statement in the Wall Street Journal,1 intelligence
can be defined as follows:
1
https://en.wikipedia.org/wiki/Mainstream_Science_on_Intelligence
1
© Nimish Sanghi 2024
N. Sanghi, Deep Reinforcement Learning with Python, https://doi.org/10.1007/979-8-8688-0273-7_1
Chapter 1 Introduction to Reinforcement Learning
A very general mental capability that, among other things, involves the
ability to reason, plan, solve problems, think abstractly, comprehend com-
plex ideas, learn quickly, and learn from experience. It is not merely book
learning, a narrow academic skill, or test-taking smarts. Rather, it reflects a
broader and deeper capability for comprehending our surroundings—
“catching on,” “making sense” of things, or “figuring out” what to do.
Intelligence in the context of machines is called artificial intelligence. Oxford
Languages defines artificial intelligence (AI) as follows:
The theory and development of computer systems able to perform tasks
normally requiring human intelligence, such as visual perception, speech
recognition, decision-making, and translation between languages.
This is what you study in this book: the theory and design of algorithms that
help machines (agents) gain the capability to perform tasks by interacting with the
environment and continually learning from their successes, failures, and rewards.
Originally AI revolved around designing solutions as a list of formal rules that could be
expressed using logic and mathematical notations. These rules consisted of a collection
of information codified into a knowledge base. The design of these AI systems also
consisted of an inference engine that enabled users to query the knowledge base and
combine the individual strands of rules/knowledge to make inferences. These systems
were also known as expert systems, decision support systems, and so on. However, soon
people realized that these systems were too brittle. As the complexity of problems
grew, it became exponentially harder to codify the knowledge or to build an effective
inference system.
The modern concept of reinforcement learning is a combination of two different
threads through their individual development. First is the concept of optimal control.
Among many approaches to the problem of optimal control, in 1950 Richard Bellman
came up with the discipline of dynamic programming, which is used extensively in
this book. Dynamic programming, however, does not involve learning. It is all about
planning through the space of various options using Bellman recursive equations.
Chapters 2 and 3 have a lot to say about these equations.
The second thread is that of learning by trial and error, which finds its origin in
the psychology of animal training. Edward Thorndike was the first one to express the
concept of trial and error in clear terms. In his words:
2
Chapter 1 Introduction to Reinforcement Learning
Of several responses made to the same situation, those which are accompa-
nied or closely followed by satisfaction to the animal will, other things being
equal, be more firmly connected with the situation, so that, when it recurs,
they will be more likely to recur; those which are accompanied or closely
followed by discomfort to the animal will, other things being equal, have
their connections with that situation weakened, so that, when it recurs,
they will be less likely to occur. The greater the satisfaction or discomfort,
the greater the strengthening or weakening of the bond.
The concept of increasing the occurrence of good outcomes and decreasing the
occurrence of bad outcomes is something you will see in use in Chapter 8, on policy
gradients.
In the 1980s, these two fields merged to give rise to the field of modern reinforcement
learning. In the last decade, with the emergence of powerful deep learning methods,
reinforcement learning (when combined with deep learning) is giving rise to very
powerful algorithms that could make artificial intelligence real in coming times. Today’s
reinforcement systems interact with the world to acquire experience and learn to
optimize their actions based on the outcomes of their interactions with the world, by
generalizing their experience. There is no explicit coding of expert knowledge.
3
Chapter 1 Introduction to Reinforcement Learning
The three branches of machine learning differ in the sense of the “feedback”
available to the learning system. They are discussed in the following sections. The
distinction between supervised and unsupervised learning is blurring, with many
nuanced approaches that mix and match the two paradigms in different ways. It has
given rise to additional sub-categories, such as semi-supervised learning, self-supervised
learning, and Generative AI.
Supervised Learning
In supervised learning, the system is presented with the labeled data, and the objective
is to generalize the knowledge so that new, unlabeled data can be labeled. Consider
images of cats and dogs presented to a system, along with labels indicating whether the
image shows a cat or a dog. The input data is represented as a set of data, D = (x1, y1),
(x2, y2), …, (xn, yn), where x1, x2, …, xn are the vectors of pixel values of individual images
and y1, y2, …, yn are the labels of the respective images—say, a value of 0 for a cat and a
value of 1 for a dog. The system/model takes this input and learns a mapping from image
xi to label yi. Once trained, the system is presented with a new image x′ to get a prediction
of the label y′ = 0 or 1, depending on whether the image shows a cat or a dog.
4
Chapter 1 Introduction to Reinforcement Learning
This is a classification problem where the system learns to classify an input into the
correct class. The other problem type is that of regression, such as when you’d want to
predict the price of a house based on its features. The training data is again represented
as D = (x1, y1), (x2, y2), …, (xn, yn). The inputs are x1, x2, …, xn where each input xi is a vector
of certain attributes—for example, the number of rooms in a house, its area, the size of
the front lawn, and so on. The system is given a label yi, which represents the market
value of the house. The system uses the input data from many houses to learn to map
the input features, xi to the value of a house, yi. The trained model is then presented with
a vector x′, which consists of the features of a new house, and the model predicts the
market value y′ of this new house.
Unsupervised Learning
Unsupervised learning has no labels. It only has the inputs D = x1, x2, …, xn and no labels.
The system uses this data to learn the hidden structure of the data so that it can cluster/
categorize the data into broad categories. Post learning, when the system is presented
with a new data point x′, it can match the new data point to one of the learned clusters.
Unlike supervised learning, there is no well-defined meaning to each category. Once
the data is clustered into a category, based on the most common attributes within a
cluster, you can assign some meaning to it. The other use of unsupervised learning is to
leverage underlying input data to learn the data distribution so that the system can be
subsequently queried to produce a new synthetic data point. This latter approach has
been fueling the growth of image- and text generation. The new name for this approach
is Generative AI. I elaborate on this in a section to follow.
Many times, unsupervised learning is used for feature extraction, which is then fed
to a supervised learning system. By clustering data, you can first identify the hidden
structure and remap the data to a lower dimensional form. With this lower dimensional
data, supervised learning can learn faster. In this case, unsupervised learning is used as a
feature extractor.
There is yet another way to leverage the unsupervised learning approach. Consider a
case in which you have a small amount of labeled data and a large amount of unlabeled
data. The labeled data and the unlabeled data are first clustered together. Next, in each
such cluster, the unlabeled data is assigned labels based on the strength of labeled data
in that cluster. You are basically leveraging labeled data to assign labels to the unlabeled
data. The completely labeled data is next fed into the supervised learning algorithm to
5
Chapter 1 Introduction to Reinforcement Learning
Reinforcement Learning
Now that you’ve learned about the supervised and unsupervised approaches, this
section turns to the third broad category of machine learning—reinforcement learning.
It is distinct from all the approaches discussed so far.
Let’s first look at an example. Say you are trying to design an autonomous vehicle
that can drive on its own. You have a car called the agent; that is, a system or an algorithm
that is learning to drive on its own. It is learning the behavior of driving. Its current
coordinates, speed, and direction of motion when combined as a vector of numbers is
known as its current state. The agent uses its current state to make a decision to either
apply the brake or press on the gas pedal. It also uses this information to turn the steering
to change the direction of the car’s motion. The combined decision of “breaking/
accelerating” and “steering the car” is known as an action. The mapping of a specific
current state to a specific action is known as a policy. When the agent’s action is good,
it will yield a happy outcome, and when an action is bad, it will result in an unhappy
outcome. The agent uses this feedback of the outcome to assess the effectiveness of its
action. The outcome as feedback is known as a reward that the agent gets for acting in a
particular way in a specific state. Based on the current state and its action, the car reaches
a new set of coordinates, speed, and direction. This is the new state that the agent finds
itself in based on how it acted in the previous step. Who provides this outcome and
decides the new state? It is the surroundings of the car, and it is something that the car/
agent has no control over. Everything else that the agent does not control is known as the
environment. I have a lot more to say about each of these terms throughout the book.
In this setup, the data provided by the system in the form of state vectors, actions
taken, and rewards obtained is sequential and correlated. Based on the action the
agent takes, the next state and reward obtained from the environment could change
drastically. In the previous example of the autonomous car, imagine a pedestrian who
is crossing the road in front of the car. In this situation, the action of accelerating versus
breaking would have very different outcomes. Accelerating the car could lead to injuring
the pedestrian as well as damaging to the car and harming its occupants. Breaking could
lead to avoiding any damage and the car continuing on its journey after the road is clear.
6
Chapter 1 Introduction to Reinforcement Learning
In reinforcement learning, the agent does not have prior knowledge of the system.
It gathers feedback and uses that feedback to plan/learn actions to maximize a specific
objective. As it does not have enough information about the environment initially, it
must explore to gather insights. Once it gathers “enough” knowledge, it needs to exploit
that knowledge and adjust its behavior to maximize the objective it is chasing. The
difficult part is that there is no way to know when the exploration is “enough.” If the
agent continues to explore even after it has perfect knowledge, it is wasting resources
trying to gather new information, of which there is none. On the other hand, if the agent
prematurely assumes that it has gathered enough knowledge, it may end up optimizing
based on incomplete information and may perform poorly. This dilemma of when
to explore and when to exploit is a core recurring theme of reinforcement learning
algorithms. As you learn about different behavior optimization algorithms in this book,
you will see this issue play out again and again.
Emerging Sub-branches
As the discipline of ML is seeing rapid advances and as ML-based solutions are
becoming more and more sophisticated, the boundaries between the three traditional
branches of machine learning are blurring. The last four to five years has seen innovative
combinations of these three approaches, which has given rise to some common patterns,
especially ones involving large volumes of unlabeled data that are used to develop
models that act as supervised models. I discuss now the most prominent sub-branches.
Self-Supervised Learning
Self-supervised learning is a sub-branch of machine learning that aims to learn useful
representations from unlabeled data without human supervision. Unlike supervised
learning, where the data is labeled with the correct output beforehand, self-supervised
learning creates its own labels from the data. For example, a self-supervised learning
system can generate labels by masking some parts of the data and trying to predict them
from the rest of the data. This way, the system can learn general features and patterns
that can be useful for various downstream tasks. Some examples of self-supervised
learning are as follows:
7
Chapter 1 Introduction to Reinforcement Learning
8
Chapter 1 Introduction to Reinforcement Learning
Generative AI
Generative AI is a sub-branch of artificial intelligence that focuses on creating novel
content or data from scratch, such as images, text, music, or speech. Generative AI
models learn from a large amount of data and use statistical techniques to generate
9
Chapter 1 Introduction to Reinforcement Learning
new data. This new data resembles the original data distribution but is not an exact
copy of any existing sample. Generative AI can be used for various purposes, such as
data augmentation, artistic expression, content creation, data synthesis, and anomaly
detection.
One of the most popular Generative AI techniques is generative adversarial networks
(GANs), which consists of two neural networks: a generator and a discriminator. The
generator tries to create fake data that can fool the discriminator, while the discriminator
tries to distinguish between real and fake data. The two networks compete with each
other and improve over time, until the generator can produce realistic data that can
deceive the discriminator. GANs have been used to generate high-quality images of
faces, animals, landscapes, and objects, as well as to manipulate and enhance existing
images, such as face aging, style transfer, super-resolution, and inpainting.
Another Generative AI technique is variational autoencoders (VAEs), which are a
type of autoencoder that learns to encode the data into a latent space and then decodes
it back to the original space. The latent space is a lower-dimensional representation of
the data that captures its essential features. VAEs also impose a probabilistic distribution
on the latent space, such as a Gaussian distribution, and then sample from it to generate
new data. VAEs can generate diverse and smooth data, such as images of handwritten
digits, faces, and flowers, as well as interpolate between different data points in the
latent space.
A third Generative AI technique is autoregressive models, which are a type of
neural network that generates data sequentially, by predicting the next element in the
sequence based on the previous elements. Autoregressive models can capture long-term
dependencies and complex patterns in the data, such as natural language, music, and
speech. Autoregressive models have been used to generate coherent and fluent text,
such as stories, articles, summaries, and translations, as well as to generate realistic and
expressive music and speech, such as songs, melodies, and voices. The GPT family of
text-generation Large Language Models follow this paradigm.
A fourth Generative AI technique is deep learning diffusion models, which are a
type of probabilistic model that learns to reverse the process of adding random noise to
the data. The idea is to start with a noisy version of the data and gradually remove the
noise until the original data is recovered. By doing so, the model learns to capture the
distribution of the data and can generate new data by sampling from it. Deep learning
diffusion models can generate high-fidelity and diverse data, such as images of faces,
animals, and objects, as well as conditional generation based on text or class labels.
10
Chapter 1 Introduction to Reinforcement Learning
11
Chapter 1 Introduction to Reinforcement Learning
Core Elements of RL
A reinforcement learning system can be broken into four key components: policy,
rewards, value functions, and model of the environment.
Policy is what forms the intelligence of the agent. An agent gets to interact with the
environment to sense the current state of the environment, for example, a robot getting
visual and other sensory inputs from the system, also known as the current state of the
environment or the current observation data being perceived by the robot. The robot, like an
intelligent entity, uses this current information and possibly the past history to decide what
to do next, that is, what action to perform. The policy maps the state to the action that the
agent takes. Policies can be deterministic. In other words, for a given state of environment,
there is a single fixed action that the agent takes. Sometimes the policies can be stochastic; in
other words, for a given state, there are multiple possible actions that the agent can take.
Reward refers to the goal/objective that the agent is trying to achieve. Consider
a robot trying to go from Point A to Point B. It senses the current position and takes
an action. If that action brings it near to its goal B, the reward should be positive. If it
takes the robot away from Point B, it is an unfavorable outcome, the reward should be
negative. In other words, the reward is a numerical value indicating the “goodness” of
the action taken by the agent based on the objective/goal it is trying to achieve. The
reward is the primary way for the agent to assess if the action was good or bad and use
this information to adjust its behavior, thus optimizing the policy that it is learning.
Rewards are an intrinsic property of the environment. The reward obtained is a
function of the current state the agent is in and the action it takes while in that state.
Rewards and the policy being followed by the agent define the value functions.
Value functions are like long-term rewards that are influenced not only by the
environment but also by the policy the agent is following. Value exists because of the
rewards. The agent accumulates rewards as it follows a policy and uses these cumulative
rewards to assess the value in a state. It then makes changes to its policy to increase the
value of the state.
12
Chapter 1 Introduction to Reinforcement Learning
13
Chapter 1 Introduction to Reinforcement Learning
Q-learning approach that was named Deep Q Networks (DQN). Q-learning involves an
agent following some policy to gather experiences of its actions in the form of a tuple
of the current state, the action it took, the reward it got, and the next state it found itself
in. The agent then uses these experiences with Bellman equations in an iterative loop
to find an optimal policy so that the value function (as explained earlier) of each state
increases.
Earlier attempts to combine deep learning with reinforcement learning had not
been successful due to the unstable performance of the combined approach. DeepMind
made some interesting and smart changes to overcome instability issues. It first applied
the combined approach of traditional reinforcement learning and deep learning for
developing game-playing agents for Atari games. The agent would get a snapshot of the
game and have no prior knowledge of the rules of the game. The agent would use this
raw visual data to learn to play Atari video games. In many cases, it achieved human-
level performance. The company subsequently extended the approach to develop agents
that could defeat champion human players in a game like Go. The use of deep learning
with reinforcement learning has given rise to robots that act a lot more intelligently,
without the need to handcraft domain-specific knowledge.
And most recently it has been applied to Large Language Models (LLMs) in the
form of RLHF (Reinforcement Learning from Human Feedback) to make LLMs follow
instructions and generate human-quality text based on the prompts. This is what made
the world take notice of chatGPT3.5 and the emergence of new opportunities that arose.
This is an exciting and fast-growing field. Chapter 6 covers deep learning with
RL. Most of the algorithms from Chapter 6 onward involve a combination of deep
learning and reinforcement learning.
Autonomous Vehicles
This section looks at the field of autonomous vehicles (AVs). AVs have sensors like
LiDAR, radar, cameras, and so on, that sense their nearby environment. These sensors
are then used to carry out object detection, lane detection, and so on. The raw sensory
14
Chapter 1 Introduction to Reinforcement Learning
data and object detection are combined to get a unified scene representation that is used
for planning a path to a destination. The planned path is next used to feed inputs to the
controls to make the system/agent follow that path. The motion planning is the part in
which trajectories are planned.
A concept like inverse reinforcement learning in which one observes an expert and
learns the implied objective/reward based on the expert’s interaction can be used to
optimize cost functions to come up with smooth trajectories. Actions such as overtaking,
lane changing, and automated parking also leverage various parts of reinforcement
learning to build intelligence into the behavior. The alternative would be to handcraft
various rules, and that can never be exhaustive or flexible.
Robots
Using computer vision and natural language processing or speech recognition with deep
learning techniques has added human-like perceptions to autonomous robots. Further,
combined deep learning and reinforcement learning methods have resulted in teaching
robots to learn human-like gaits to walk, pick up and manipulate objects, or observe
human behavior through cameras and learn to perform like humans.
Recommendation Systems
Today recommender systems are everywhere. Video sharing/hosting applications,
YouTube, TikTok, and Facebook suggest videos that you might like to watch based on
your viewing history. When you visit any e-commerce site, based on the current product
you are viewing and your past purchase patterns or based on the way other users have
acted, you are presented with other similar product recommendations.
All such recommender engines are increasingly driven by reinforcement learning–
based systems. These systems continually learn from the way users respond to the
suggestions presented by the engine. A user acting on the recommendation reinforces
these actions as good actions given the context.
Healthcare
Reinforcement learning finds significant use in healthcare, be it generating predictive
signals and enabling medical intervention at early stages or be it robot-assisted surgeries
or managing the medical and patient data. It is also used to refine the interpretation of
imaging data, which is dynamic in nature. RL-based systems provide recommendations
learned from its experiences and continually evolve.
Game Playing
Finally, I cannot stress enough the way RL-based agents are able to beat human players
in many board games. While it may seem wasteful to design agents that can play games,
there is a reason for this. Games offer a simpler idealized world, making it easier to design,
train, and compare approaches. Approaches learned under such idealized environments/
setups can be subsequently enhanced to make agents perform well in real-world
situations. Games provide a well-controlled environment to research deeper into the field.
As stated, deep reinforcement learning is a fascinating and rapidly evolving field,
and I hope to provide you with a solid foundation to get started in your journey to master
this field.
16
Chapter 1 Introduction to Reinforcement Learning
17
Chapter 1 Introduction to Reinforcement Learning
At this point, the prompt in the shell window should show (drl)
as a prefix on the command line. You can check the version of
Python installed by using the following command on the shell
prompt: python -V. It should print something like: Python 3.9.18
with “18” in the end replaced with the latest sub-version 3.9 has
18
Chapter 1 Introduction to Reinforcement Learning
at the point in time you do the installation. You can also check
the pip version with the command: pip3 --version. This should
print the version number of whatever pip is linked in your virtual
environment that you just installed.
Make sure that all the commands that I ask you to run in the
upcoming steps are carried out in the same terminal where you
activated the new venv environment.
a. Visit https://docs.conda.io/en/latest/miniconda.html
and download the Miniconda install for your platform. Choose
the latest Python3.x version. If you already have Anaconda or
Miniconda installed, you can skip this step. Run the downloaded
program to install Miniconda on your local machine.
19
Chapter 1 Introduction to Reinforcement Learning
Make sure that all the commands that I ask you to run in the
upcoming steps are carried out in the same terminal where you
activated the new Conda environment.
Change the directory (cd) to the newly created local folder and
run the following command to make a local copy of the source
code accompanying the book:
6. Setting up the dependencies: You are now ready to install all the
required libraries with the help of two commands, as follows:
21
Chapter 1 Introduction to Reinforcement Learning
Make sure that your venv or Conda environment is active and you are
currently inside the drl-2ed directory, where you cloned/copied the
code. You can now start the JupyterLab session with this command:
jupyter lab
It will start the Jupyter session and will print the following instructions somewhere in
the middle of the output created by this command:
Click any of the links to open your default browser. You should see a page similar to
the one in Figure 1-2. You may navigate to any of the chapter specific folders and double-
click the specific notebooks (files with the .ipynb extension) to open them. You are
ready to follow the notebook instructions and code execution.
22
Chapter 1 Introduction to Reinforcement Learning
2. Next, you need to enable a few plugins for Python: Python, Python
Debugger, PyLance, Jupyter, Jupyter Notebook Renderers and
Jupyter Keymap, Jupyter Cell Tags, and Jupyter Slide Show. Some
of these are optional but installing all of them will give you a richer
experience. You can read through each individual plugin and
decide which ones you want to skip.
code .
4. You may see a popup in the bottom-right corner with the message
“Folder contains Dev Container configuration file. Reopen folder
to develop in a container”. Do not click the “Reopen in Container”
button. Instead click the cross at the top right of the popup to
close it. See Figure 1-3.
23
Random documents with unrelated
content Scribd suggests to you:
Flamand semi-italianisé l'estimait-il pas à sa juste valeur son naïf et
sauvage compère des Provinces affranchies.»
Si la peinture n'eût été découverte, Rembrandt l'aurait inventée. Venu
après la période des chefs-d'œuvre italiens et flamands, un homme moins
fort se fut contenté d'expliquer, pour ainsi dire, quelque maître connu. Il
voulut à son tour posséder la clef d'or du génie. La vérité fut sa religion, la
lumière sa poésie. Il fut vrai et rayonnant.
Hardi dans son art jusqu'à l'insolence, il avait banni les règles consacrées
par l'exemple des maîtres, il peignit à sa fantaisie, tantôt commençant par
où les autres finissent, tantôt finissant par où les autres commencent. Ses
portraits magiques ont un si grand relief parce qu'il semblait plutôt modeler
que peindre. On cite de lui une tête où le nez était presque aussi saillant
que celui du modèle. Cette façon de faire n'était pas du goût de tout le
monde; Rembrandt s'en embarrasse fort peu; il dit un jour à quelqu'un qui
approcha de très-près pour voir ce qu'il peignait: «Un tableau n'est pas fait
pour être flairé; l'odeur de la couleur est malsaine.» Il disait aussi à ceux
qui lui reprochaient de faire de la peinture raboteuse: «Je suis peintre et
non teinturier.» Ces deux mots sont deux leçons immortelles. Par son
admirable science du clair-obscur, il a produit dans chacun de ses tableaux
quelque effet éclatant. Il était si sûr de son pinceau et de sa palette, qu'il
plaçait chaque ton à sa vraie place, d'un seul coup, sans être obligé d'y
revenir et de le foudre avec d'autres. De là cette fleur si fraîche de coloris.
Il se contentait, pour adoucir les teintes et lier les lumières aux ombres, de
quelques glacis légers qui faisaient l'harmonie sans altérer la virginité des
couleurs.
Tout penseur qu'il fût, il était souvent sans élévation. Quelques-uns de ses
tableaux d'histoire ne sont que de suprêmes mascarades: c'était Véronèse
et Basan en Hollande. Cependant il ne faudrait pas ici prononcer un
jugement absolu: ainsi la Descente de Croix, Tobie prosterné devant l'ange,
la Résurrection de Lazare, le Triomphe de Mardochée, l'Adoration des
Mages, Jésus à Emmaüs, sont de sérieux chefs-d'œuvre animés de lueurs
exquises, éclairés çà et là d'un rayon divin. À force de vérité, Rembrandt
devient sublime comme d'autres à force d'élévation et d'idéal. J'ai vu à
Venise[43] une Madeleine de ce maître qui est un chef-d'œuvre d'expression
et qui contraste singulièrement avec toutes les Madeleines des maîtres
italiens. C'est une belle et simple Hollandaise; mais pour ce sublime poëte
n'y a-t-il pas des modèles dans tous les pays? Si elle n'est pas belle par la
grandeur des lignes, elle est belle par la douleur et par le repentir (douleur
et repentir de la première fille venue; mais pourquoi faire toujours de
Madeleine une femme trop illuminée des splendeurs du Christ, un poëte
par le cœur, une Sapho chrétienne chantant ses péchés plutôt qu'elle ne les
pleure?) Cette Madeleine de Rembrandt, on voit bien qu'avant de lever les
yeux au ciel elle a aimé les hommes de la terre; on voit bien qu'elle a
pleuré de joie avant de répandre ces belles larmes que le génie a
cristallisées. Elle n'est pas nue comme ses sœurs; on la voit à mi-corps et
de face, habillée en Hollandaise; elle montre une main admirable comme
les faisait Rembrandt en ses jours de bonne volonté[44]. Elle vit encore de
la vie humaine par le cœur qui est l'orage de la créature; toutes les
passions qui l'ont agitée sur la mer des dangers sont à peine assoupies
dans son sein.
La Vénus du musée du Louvre pourrait servir de pendant à cette
Madeleine. C'est toujours une Hollandaise habillée des pieds à la tête
(Rembrandt habillait même les anges). Elle est belle par l'éclat de la vie,
par la sève et par la force; elle est même belle, si on peut parler ainsi, par
la beauté. Dieu n'en a pas créé de plus victorieuses dans toute la Hollande.
Elle a un Amour auprès d'elle; on lui en donnerait vingt sans épuiser ses
lèvres ardentes et savoureuses.
Dans la recherche du beau, il n'y a pas seulement la sévérité de la ligue et
la grâce du contour. Le vase d'or le mieux sculpté n'est-il pas celui de l'autel
d'où s'échappe un jet des flammes divines? L'histoire de Prométhée
dérobant le feu du ciel n'est encore qu'une sublime allégorie. La beauté se
forme de divers éléments, parce qu'elle est la beauté plastique, la beauté
morale et la beauté intellectuelle, parce que l'artiste a dû tour à tour
caresser avec la même ferveur les muscles d'Hercule, les lèvres
savoureuses de Vénus ou de Madeleine[45], la tristesse poétique de Psyché
et le front pensif de Minerve. Rembrandt caressait tour à tour le front de
Minerve et les lèvres savoureuses de Madeleine ou de Vénus. Sa beauté
idéale, c'était la pensée et le rayonnement: l'homme qui pense, la femme
qui s'épanouit.
Ce grand peintre aimait trop éperdument les jeux de la lumière dans
l'obscurité. À Munich, il a un Crucifiement par un temps orageux, une Mise
au tombeau sous une sombre voûte, une Résurrection au milieu de la nuit,
une Nativité devant une lampe, une Ascension qu'illuminent les
rayonnements du Christ; mais ces effets de clair-obscur, ces magiques
oppositions de jour et de nuit, ne font pas tout le génie du peintre. Ceux
qui nient son expression et son style, s'ils étaient demeurés contemplatifs
devant ces œuvres étranges, auraient senti que son génie ne triomphait
pas seulement par la magie de l'exécution. Son âme n'est-elle pas visible
dans sa couleur? Il y a toujours sous un masque brutal, un profond
sentiment humain. Il est loin de l'idéal chrétien, des figures détachées des
fonds d'or du Giotto ou des paysages austères du Pérugin; mais il a sa foi
comme les artistes les plus pieux du moyen âge et de la Renaissance. Il
aime la nature sous quelque face qu'elle se présente. Elle est horrible;
qu'importe! c'est la nature, une chose sainte et sacrée. S'il a perdu la
poésie de l'esprit, n'a-t-il pas celle du cœur? Il proteste par l'éclat et
l'exubérance contre la tombe entr'ouverte où les chrétiens nous enterrent
même dans la vie.
Le panthéisme doit reconnaître Rembrandt pour son peintre souverain.
Après l'idéal antique, après l'idéal chrétien, il trouva l'idéal terrestre, l'idéal
de la raison qui voit par l'œil simple. Dans l'œuvre de Rembrandt on dirait
qu'il a voulu supprimer le ciel; il a pris du limon à ses pieds, et, comme un
autre créateur, il a sculpté la personnalité humaine avec respect et avec
amour[46]. Oui, il y a loin de là aux fonds d'or des Byzantins qui fuyaient la
terre et craignaient d'y mettre le pied! C'est un nouveau monde, un monde
dans les ténèbres: la lumière de Rembrandt n'est-elle pas celle qui jaillit
des ténèbres? C'est l'aube encore douteuse d'un jour nouveau qui sera
éclairé par les orages du doute. Quel poëme plein de terreur et de mystère!
La pensée humaine qui se reconnaît libre et va se briser aux tempêtes
futures! Les sombres philosophes de Rembrandt, ceux qu'il a animés de ses
rêves et de ceux de Luther, sont plus tristes que les martyrs de Ribeira. Ils
ont l'avenir, ils y vont librement, ils sont maîtres du monde; mais que
trouveront-ils dans l'avenir et que leur réserve le monde? Ils ont brisé leurs
chaînes; mais c'étaient des chaînes d'amour, des chaînes de lis et de roses
tombées du rivage sacré. Les philosophes de Rembrandt, tous nés du
protestantisme, semblent se dire tristement: «Je suis libre, mais je ne suis
qu'un homme. Je puis aller, mais où vais-je?»
Rembrandt trouva presque en même temps son génie de portraitiste, de
graveur et de paysagiste. À vingt-cinq ans, il avait toute sa force; depuis
cet âge jusqu'à sa mort, il changea çà et là sa manière, mais tout en
conservant sa chaude et vigoureuse empreinte. Soit que son travail fût
très-étudié, soit qu'il peignît avec la rapidité de la foudre, soit qu'il créât un
philosophe ou une paysanne, un intérieur hollandais ou un tableau biblique,
c'était toujours le même génie viril, solide, éclatant.
Rembrandt fut aussi grand coloriste dans la gravure que dans la peinture.
Sa pointe, c'était encore son pinceau tout baigné d'ombre et de lumière.
On reconnaît la même touche et le même esprit. Il n'a pas plus imité les
graveurs ses devanciers qu'il n'avait fait des peintres; aussi est-il plus
vigoureux et plus chaud[47]. On peut hardiment parler des teintes de sa
pointe. Ses descentes de croix, ses portraits, ses sujets religieux et
profanes, ses paysages, sont d'un effet magique par l'expression, l'énergie
et la couleur.
On peut admirer Rembrandt dans tous les musées d'Europe, mais c'est à la
Haye et à Amsterdam qu'il faut aller saluer son génie. La Leçon
d'anatomie[48] et la Ronde de nuit (qui est une ronde de jour), sont
l'expression la plus vive et la plus éloquente de ses deux manières. À vingt-
cinq ans, il peignit la Leçon d'anatomie avec la science, la sobriété, la
précision, la touche cachée d'un maître qui n'a plus rien à apprendre de
l'art. C'est un chef-d'œuvre dont nul détail ne trahit une main de vingt-cinq
ans. Plus de douze ans après, le jeune homme s'était fait homme, il peignit
la Ronde de nuit. Alors il déploya toute la fougue, toute la témérité, toute
l'exubérance de la jeunesse. Il rebroussa chemin à l'âge où tant d'autres
continuent à marcher devant eux. Il ressaisit sa jeunesse et la jeta tout
étincelante, pleine de vie féconde, audacieuse, comme un lion qui secoue
sa crinière. Corrége et Velasquez eussent été éblouis devant ce chef-
d'œuvre tout rayonnant.
Rembrandt est un poëte sombre, étrange, hardi, bizarre, romanesque. Il
joue ses drames sur un fond noir; il aime le mystérieux jusqu'à la
fantasmagorie. C'est un poëte né de son temps, comme Shakespeare[49]. Il
aime mieux les hardiesses insensées que les beautés connues. La vie
tombait de sa palette comme le blé sous la faux, comme l'eau jaillit du
rocher, comme la lumière ruisselle du soleil. Il prenait la nature corps à
corps et luttait avec elle en intrépide. Il osait être trivial, presque
monstrueux. La poésie est partout pour le poëte. Il ne reculait devant
aucune laideur vivante; mais sous sa main féconde tout prenait une
expression fantasque et grandiose. Oui, celui-là a son idéal et son style
dans le monde de l'art. Il est vrai de point en point, mais avec un accent
éloquent. Oui, il a son idéal familier, visible dans le caractère formidable de
sa peinture, dans la profondeur pensive de ses têtes, dans la bizarrerie de
ses ajustements, qui ne sont d'aucun temps ni d'aucun pays, dans ses
effets de clair-obscur, dans sa touche magistrale couronnée de chaudes
vapeurs d'or et d'argent, dans sa manière hardie de distribuer l'ombre et la
lumière. Winckelmann, qui pleurait d'admiration devant l'Apollon du
Belvédère, demeurait rêveur tout un jour devant un tableau de Rembrandt.
Le génie de ce grand artiste est presque inexplicable; il est à la fois brutal
et délicat, heurté et harmonieux, farouche et tendre. Quel chaos, mais
quelle lumière! quel tumulte, mais quelle gravité! quelle crinière
flamboyante de lion, mais quels sourires de paix! Quel amour voluptueux
des ténèbres et des rayons! quelle audace aveugle et quelle sagesse
raisonnée! quelle modération dans la force! Il est fougueux jusqu'à la furie,
original jusqu'à l'extravagance; mais comme au milieu de toutes ces
fantaisies et de toutes ces témérités il demeure en pleine vérité, le pied
cloué sur la terre, dans sa fierté dédaigneuse et sauvage!
Rembrandt a égalé la puissance de la nature; comme elle, il a répandu
d'une main large et féconde la vie sur ses œuvres. Il n'a pas imité par
l'imitation, mais par la création; il s'est élevé jusqu'au prodige.
Ne pourrait-on pas comparer Rembrandt à un comédien qui arrive à
l'improviste sur le théâtre, affublé d'un costume invraisemblable, comme
pour jouer la comédie? On le trouve si original, si franc, si bizarre, qu'on
sourit et qu'on se promet de rire beaucoup de sa comédie. Mais peu à peu
sa figure s'éclaire d'un rayon magique, on l'écoute, on ne rit plus: ce n'est
pas la comédie, c'est le drame qu'il joue, un drame sombre et gai, le drame
humain, comme Shakespeare. Il est si éloquent dans ses haillons, si trivial
sous sa toque de velours, si poétique et si pittoresque dans son franc parler
tout semé d'images bibliques et plébéiennes, qu'il vous étonne, vous
transporte et vous donne le vertige.
L'inspiration, c'est le rayon sacré qui part du sein de Dieu et qui va frapper
le cœur ou l'esprit des poëtes et des artistes. Ce rayon a traversé les
brumes du pays de Leyde pour illuminer Rembrandt et son œuvre. Comme
Michel-Ange, Rembrandt, le Michel-Ange de la Hollande, a pénétré dans le
monde des penseurs; mais, au lieu de lever ses yeux éblouis vers les cimes
inaccessibles, il est demeuré religieusement attaché à la terre, sa vraie
patrie.
[35]Les Flandres ont autant servi l'art que l'Italie; Raphaël n'a pas créé
un peintre et en a désespéré mille: chez lui, c'est le monde connu, c'est
le dernier mot, c'est le couronnement de l'œuvre; chez Rembrandt,
l'intrépide et magique coloriste, c'est encore le commencement du
monde.
[36]À ce prénom Rembrandt si l'on ajoute, selon la coutume
hollandaise, le nom paternel Hermans-zoon (Hermansz par abréviation)
et le nom topographique van Rijn, on a le nom complet, consigné, sauf
les variantes d'orthographe, dans les actes et les écrits du temps:
REMBRANDT HERMANSZ VAN RIJN.—W. BERGER.
[37]Cette famille de meuniers du Rhin était fort à l'aise et très-
honorable. Meuniers, bateliers, boulangers, sont, en ce pays-là, de bons
bourgeois, ayant pignon sur rue, voiles au vent sur les canaux, et «du
pain sur la planche;» riches souvent, et quelquefois intéressés dans les
opérations des pays d'outre-équateur; mêlés, comme tout le monde en
Hollande, aux administrations municipales et aux affaires publiques:
donnant de l'éducation à leurs enfants et les tenant à la hauteur des
classes les plus élevées—W. BERGER.
[38]On croit qu'il représentait la Femme adultère. Vers le même temps,
il peignit une Fuite en Égypte dans un admirable paysage, d'un grand
effet jusque-là inconnu.
[39]«Rembrandt aurait été un plus grand peintre si Rome avait été sa
patrie ou s'il en avait fait le voyage; il n'a dû son talent qu'à la nature et
à son instinct, et il aurait appris à trouver, sans se méprendre, le beau
dont il s'est toujours écarté. S'il en a quelquefois approché, ç'a été
moins par réflexion que par hasard.» DESCAMPS.
[40]La vie de Rembrandt est semée de pages pittoresques.
«Il avait une servante extrêmement babillarde: après avoir peint son
portrait, il l'exposa à une fenêtre où elle faisait souvent de longues
conversations. Les voisins prirent le tableau pour la servante même, et
vinrent aussitôt dans le dessein de discourir avec elle; mais étonnés de
lui parler pendant plusieurs heures, sans qu'elle répondit un seul mot, ils
trouvèrent ce silence fort singulier et s'aperçurent enfin de leur erreur.»
C'est toujours l'histoire des oiseaux qui allaient becqueter les raisins du
peintre grec.
[41]On sait qu'elle fut surnommée la courtisane, parce que tout le
monde la voyait pour de l'argent.
[42]Dans la gravure d'Eisen, il est encadré entre un portrait d'ami et un
philosophe qui médite dans le demi-jour. On voit d'un côté sa palette, de
l'autre sa pointe sur une eau-forte ébauchée. Qui n'a vu l'eau-forte où il
s'est gaiement représenté lui-même avec sa femme?
[43]Couvent de Sainte-Marie du Salut.
[44]«Il sentait si bien son incapacité à dessiner les mains, qu'il les
cachait le plus qu'il pouvait.» Ainsi parle Descamps. C'est d'une grande
injustice, quand Rembrandt faisait un portrait, c'était le plus souvent en
toute hâte. Pourquoi se fût-il attardé en peignant des mains inutiles? S'il
cachait les mains, c'était par paresse et non par impuissance. Du reste,
Descamps se contredit, selon sa coutume: «J'ai vu de ses tableaux où
quelques traces de brosse qu'on ne distingue pas trop de prés
représentent, à une certaine distance, des mains peu décidées, mais qui
font autant d'effet que si le peintre y eut mis plus de sollicitude.»
[45]Cette Vénus n'est pas le portrait de sa femme, mais la rappelle. Du
reste, sa femme posait habituellement pour ses Vénus et ses Madeleine.
[46]Les cinquante portraits qu'il a laissés de lui-même ne prouvent-ils
pas tout son zèle à proclamer l'œuvre du Créateur, la royauté de
l'homme? C'était là sa religion. Du reste, quand il met en scène la
sublime tragédie du christianisme, n'a-t-il pas une éloquence toute
biblique?
[47]«Rembrandt n'a jamais voulu graver devant personne; son secret
était un trésor et il était avare. On n'a jamais deviné de quelle manière il
commençait et finissait ses planches; tout ce qu'on a su, c'est qu'à peine
avait-il fait le trait et donné quelques ombres qu'il faisait tirer un nombre
d'épreuves. Il mettait de nouveau le vernis sur sa planche et en
augmentait le travail; cela se faisait jusqu'à trois ou quatre fois. Lorsque
la planche était usée, il ébarbait les fonds et changeait les effets, en
sorte que la partie qui avait été ombrée devenait claire: cette dernière
transposition n'a pas toujours réussi; les épreuves de quelques-unes en
sont grises, approchant de la manière noire. Il ne calquait guère ses
dessins, de peur d'en refroidir l'esprit.» DESCAMPS.
[48]La Leçon d'anatomie représente le docteur Tulp devant un cadavre
baigné d'ombre et de lumière, entouré de sept personnages distingués
qui l'écoutent avec une attention suprême. Bien n'est plus simple, rien
n'est plus saisissant. Ce corps blanc comme le marbre des tombeaux,
ces hommes vêtus de noir, à barbe blonde, à figure intelligente, se
gravent pour jamais dans l'esprit. La Ronde de nuit est une simple
convocation de la garde civique pour recevoir le prince d'Orange. Le
tambour surprend ces bons Hollandais. Pour animer cette scène,
Rembrandt a choisi l'instant où ils s'élancent à demi habillés, l'un
boulonnant son pourpoint, celui-ci mettant ses gants. C'est le triomphe
du mouvement et du désordre.
Parmi les chefs-d'œuvre de Rembrandt il faut citer aussi sa Descente de
croix, la Résurrection de Lazare, les Vendeurs chassés du temple,
l'Adoration des Mages, la Mort de la Vierge.
[49]«Un génie pénétrant, le sorcier hollandais Rembrandt, qui sut tout
deviner, dans son tableau lugubre, date de la grande joie du traité de
Westpbalie (1648), a parlé mieux que tous les politiques, tous les
historiens (le Christ à Emmaüs que nous avons au Louvre). On oublie la
peinture. On entend un soupir. Soupir profond, et tiré de si loin! Les
pleurs de dix millions de veuves y sont entrés, et cette mélodie funèbre
flotte et pleure dans l'œil du pauvre homme, qui rompt le pain du
peuple.—Il est bien entendu que la tradition du moyen âge est finie et
oubliée, déjà à cent lieues de ce tableau. Une autre chose déjà est à la
place, un océan dans la petite toile. Et quoi?...—L'âme moderne.—La
merveille, dans cette œuvre profonde d'attendrissement et de pitié, c'est
qu'il n'y a rien pour l'espérance. «Seigneur, dit-il, multipliez ce pain!... Ils
si sont affamés!» Mais il ne l'attend guère, et tout indique ici que la faim
durera.—Ce misérable poisson sec qu'apporte le fiévreux hôtelier n'y fera
pas grand'chose. C'est la maison du jeûne, et la table de la famine.
Dessous rit, grince et gronde un affreux dogue, le diable, si l'on veut,
une bête robuste, aussi forte, aussi grasse que ces pauvres gens-là sont
maigres. Il a sujet de rire, carie monde lui appartient.»—MICHELET.
Portrait. Peint par Velasquez
De tous les grands maîtres, don Diego Velasquez de Silva est peut-être le
moins réellement connu, quoique sa réputation soit universelle et
incontestée. L'Espagne jalouse a gardé l'œuvre presque tout entier de son
peintre favori, et les autres musées n'en possèdent que des fragments
d'une importance médiocre et souvent d'une authenticité douteuse.
Ses tableaux sont restés au palais de Madrid, à l'Escurial, au Prado et
autres résidences royales, accrochés au clou même où on les avait
suspendus d'abord, pour venir, longues années après, prendre place
immuablement au Musée royal.
Autrefois, un voyage en Espagne était chose difficile et périlleuse; la chaîne
des Pyrénées de sa haute arête séparait bien véritablement la France de la
Péninsule. Le mot de Louis XIV n'était pas devenu encore une vérité. Il
fallait faire une route longue et mal tracée, à dos de mulet, en galère ou
dans quelque lourd coche aux durs coussins, entre une double haie de croix
sinistres indiquant des meurtres ou des accidents, n'ayant pour gîte que
des ventas, coupe-gorges nullement perfectionnés depuis don Quichotte, et
plus hospitalières aux bêtes qu'aux personnes. Rares étaient les voyageurs
qui franchissaient les monts, à moins qu'ils n'y fussent forcés par de sérieux
motifs de position, d'intrigue ou de diplomatie. Parmi ceux-là on comptait
peu d'amateurs de peinture. À peine jetaient-ils sur les toiles du maître,
trop profondément espagnol pour être goûté à première vue des étrangers,
ce regard vague, distrait, banalement admiratif de l'homme qui n'y entend
rien et a bien d'autres choses en tête. Cependant Velasquez, pour ainsi dire
ignoré de l'Europe, n'en voyait pas moins son nom cité à côté de Titien, de
Véronèse, de Rubens, de Rembrandt et de tous les rois de la couleur. Il
rayonnait tranquillement dans sa gloire lointaine, révéré sur parole comme
ces monarques invisibles à leurs sujets et dont la majesté est faite de
mystère.
On peut maintenant admirer Velasquez sur place. Il est plus facile
aujourd'hui d'aller à Madrid qu'autrefois à Corinthe, et ce n'est pas par vain
amour-propre de touriste que nous nous prévaudrons, pour parler du grand
maître, de deux voyages faits en Espagne à une époque où une telle
entreprise offrait encore quelque danger. Sans imiter sir David Wilkie qui,
dans son fanatisme, analysait chaque jour un pouce carré du tableau des
Borrachos, nous avons soigneusement étudié le grand don Diego Velasquez
de Silva au Museo real, où se trouvent réunies ses œuvres les plus
célèbres; les Menines, les Forges de Vulcain, la Reddition de Bréda ou
tableau des lances, les Filleuses, les Buveurs, les portraits équestres de
Philippe III, de Philippe IV, de doña Isabelle de Bourbon, de Marguerite
d'Autriche, de l'infant d'Espagne, du comte-duc d'Olivarès et autres toiles
de la plus riche couleur et du caractère le plus original.
Avant de commencer la description et la critique de ces chefs-d'œuvre, il
serait bon, pour n'y plus revenir, d'esquisser en quelques traits la
physionomie biographique de ce maître souverain. L'exact Cean-Bermudez
nous servira de guide.
Don Diego Velasquez de Silva, qu'il vaudrait mieux appeler D. Diego
Rodriguez de Silva y Velasquez, puisque son père se nommait Juan
Rodriguez et sa mère doña Geronima Velasquez, naquit à Séville, en 1599,
et non en 1594, comme le dit Palomino. Il fut baptisé le 6 juin à l'église
Saint-Pierre, ainsi que les registres de la paroisse en font foi. Ses ancêtres
paternels, venus de Portugal, s'étaient établis dans cette ville, et ses
parents le destinèrent à l'étude du latin et de la philosophie; mais,
remarquant chez l'enfant, qui couvrait de bons-hommes les marges de ses
livres et de ses cahiers, une inclination décidée pour le dessin, ils le mirent
à l'atelier d'Herrera le Vieux.
C'était un terrible homme que cet Herrera! Homme de génie après tout,
mais d'un génie violent, bizarre et féroce. Une fougue effrénée d'exécution
suffisait à peine aux emportements de sa pensée. Il dessinait avec des
morceaux de charbon attachés an bout d'un appui-main et faisait lancer par
une vieille servante des baquets de couleur contre une toile. De ce chaos il
tirait son œuvre, peignant avec des balais, des éponges, des dos de
cuillers, la lame du couteau à palette, tout ce qui lui tombait sous la main;
souvent avec le pouce, comme s'il modelait dans l'argile. Cette façon
sauvage était nouvelle à Séville, dont les peintres cherchaient la grâce et le
fini, mais elle s'imposait par sa truculence magistrale. Il existe à la galerie
du Louvre un superbe échantillon d'Herrera: c'est un saint Basile présidant
un concile d'évêques et de moines; on dirait Satan haranguant le
Pandæmonium, tant les figures sont farouches, sinistres, et diaboliques.
Une méchanceté infernale crispe ces têtes convulsées et le Saint-Esprit qui
secoue ses ailes effarées au-dessus du saint a l'air du corbeau d'Odin ou
d'un oiseau de proie qui veut lui manger la cervelle; tout cela est enlevé
avec une rage de brosse inimaginable et semble comme flamboyant d'un
reflet d'auto-da-fé. À côté de ce frénétique, le Caravage, l'Espagnolet et
Salvator sont des peintres à l'eau de rose.
Le caractère répondait au génie. Le paroxysme de la fureur était l'état
habituel d'Herrera. Les élèves épouvantés fuyaient, quelque désir qu'ils
eussent de ses savantes leçons; d'autres leur succédaient qui bientôt n'y
pouvaient tenir. L'atelier restait désert et ne contenait plus que l'artiste
démoniaque s'escrimant contre ses tableaux comme s'il eût eu affaire à des
ennemis mortels. Son fils se sauva emportant l'épargne paternelle, et ne se
crut en sûreté qu'à Rome. Sa fille se fit religieuse. On pense bien que
Velasquez ne put se plaire bien longtemps sous une tyrannie pareille, et
quoique le maître fût grand dessinateur, savant anatomiste, comme il le fit
bien voir dans son Jugement dernier de l'église Saint-Bernard à Séville,
plein d'invention, de génie et de feu, il passa sous la direction de Pacheco,
moins grand artiste sans doute, mais dont l'humeur aimable convenait
mieux à son tempérament paisible et doux.
Pacheco, qui était littérateur autant que peintre, et qui a écrit un livre
estimé sur «l'art de la peinture,» lui apprit les préceptes et les règles et
tout ce que peut enseigner un bon professeur. Cependant, le jeune
Velasquez, tout en profitant des leçons de son nouveau maître, se disait
que le meilleur enseignement est encore celui que donne la nature, et, dès
lors, il fit vœu de ne jamais rien dessiner ou peindre qu'il n'eût l'objet
devant les yeux, c'est-à-dire de travailler toujours d'après le vif, ad vivum.
Aussi avait-il sans cesse près de lui un jeune garçon apprenti, qui lui servait
de modèle en diverses actions et postures, soit riant, soit pleurant, dans les
altitudes les plus difficiles, et il fit, d'après lui, beaucoup de têtes au crayon
noir avec rehauts de crayon blanc sur papier bleu, ainsi que d'après
d'autres personnes. Par cette étude persistante, il arriva à exceller si bien
dans les têtes que peu d'Italiens l'égalèrent. Ses rivaux mêmes en
convenaient et disaient que là se bornait son mérite. À quoi il répondait
avec une noble fierté: «Ils me font beaucoup d'honneur, car moi je ne
connais personne qui sache bien peindre une tête.»
En ce temps-là, les artistes ne cherchaient plus l'idéal poétique ou religieux.
C'était le règne des naturalistes (nous dirions aujourd'hui réalistes).
Caravage, le Guerchin, le Calabrèse se contentaient de rendre avec une
énergie intense le modèle qu'ils avaient devant les yeux; mais comme
c'étaient, après tout, de grands peintres, par la force du rendu, la violence
de l'effet, la singularité du type, ils arrivaient malgré eux à une sorte
d'idéal, car la nature prise au hasard ne présente pas cet aspect éclatant et
sombre. Elle n'offre pas, à moins qu'on ne la mette sous un jour particulier,
ces vives lumières, ces intenses ténèbres. Il y a dans les tableaux les plus
vrais de ces maîtres le choix de l'effet, l'angle d'incidence, l'outrance du
rendu qui font monter la réalité jusqu'à l'art.
Velasquez partageait ces principes. Son génie exact, lucide et
mathématique avait besoin de certitude, et quelle meilleure pierre de
touche que la nature toujours consultée et copiée? Avec elle, point
d'erreurs, point de fausse route. Si elle ne possède pas le beau absolu, elle
contient le vrai, et c'est assez. Aussi le jeune artiste, qui devait devenir un
si grand maître, ne donne-t-il jamais un coup de crayon sans l'aide et le
contrôle de cette infaillible institutrice.
Quelquefois il arrive aux jeunes élèves qui se sont attardés dans l'étude du
dessin de ne pouvoir se rendre maîtres du pinceau et de la palette. Cet art
du coloris leur reste longtemps de difficile accès. Quelques-uns y échouent
entièrement et font dire de leurs tableaux qu'on préférerait des cartons ou
des grisailles.
Aussi, pour s'exercer, Velasquez peignait-il des fruits, des légumes, des
citrouilles, du poisson, du gibier et autres sujets de nature morte, groupés
de manière à former ce que les Espagnols appellent un bodegon. Ces
études ne semblaient pas au-dessous de lui au jeune maître; il y apportait
déjà cette simplicité souveraine et cette largeur grandiose qui forment le
fond de sa manière dédaigneuse de tout détail inutile. Ainsi traités, ces
fruits auraient pu être posés dans un plat d'or, sur une crédence royale; ces
victuailles, d'un sérieux historique, figurer aux noces de Cana et remplacer
les mets que Paul Véronèse a oublié de servir à ses convives. Ces modèles,
d'une immobilité complaisante, se prêtaient plus à ce genre d'études ayant
pour but de s'assimiler la couleur et de s'assurer le libre maniement de la
brosse, que le corps humain avec sa structure compliquée et profonde, ses
trépidations de vie et ses reflets de passions intérieures, ce qui ne veut pas
dire que Velasquez négligeât le nu, cette base de tout art plastique. Son
Christ en croix, passé du couvent de Saint-Placide au Musée royal, ses
Forges de Vulcain et sa Tunique de Joseph, montrent assez qu'il savait faire
autre chose que des têtes et des étoiles. S'il ne cherche pas la beauté
comme les grands artistes d'Italie, Velasquez ne poursuit pas la laideur
idéale comme les réalistes de nos jours: il accepte franchement la nature
telle qu'elle est, et il la rend dans sa vérité absolue avec une vie, une
illusion et une puissance magiques, belle, triviale ou laide, mais toujours
relevée par le caractère et l'effet. Comme le soleil qui éclaire
indifféremment tous les objets de ses rayons, faisant d'un tas de paille un
monceau d'or, d'une goutte d'eau un diamant, d'un haillon une pourpre,
Velasquez épanche sa radieuse couleur sur toutes choses et, sans les
changer, leur donne une valeur inestimable. Touchée par ce pinceau, vraie
baguette de fée, la laideur elle-même devient belle; un nain difforme, au
nez camard, à la face écrasée et vieillotte, vous fait autant de plaisir à
regarder qu'une Vénus ou qu'un Apollon. Lorsque Velasquez rencontre la
beauté, comme il sait l'exprimer sans fade galanterie, mais en lui
conservant sa fleur, son velouté, sa grâce, son charme et en l'augmentant
d'un attrait mystérieux, d'une force délicate et suprême! Faites poser
devant lui la Perfection, il la peindra avec une aisance de gentilhomme et
ne sera pas vaincu par elle. Rien de ce qui existe ne saurait désormais
mettre sa brosse en défaut.
Grâce à ces fortes études il fera les rois, les reines, les infants galopant sur
les genets d'Espagne en costume de chasse ou de gala, aussi bien que les
nains, les philosophes et les ivrognes; la tête pâle et délicate, dont la
blancheur blafarde se colore à peine du sang d'azur (sangre azul) des races
royales dégénérées, ne lui coûtera pas plus de peine que la trogne hâlée et
vineuse du soudard, ou le teint sordide du mendiant; sa brosse rendra
l'orfroi des brocarts constellés de pierreries, comme les rugosités du haillon
de toile. Ce luxe ne lui coûtera pas plus que celle misère; il ne s'étonnera
pas de l'un, il ne méprisera pas l'autre; à son aise dans le palais comme
dans la chaumière; fidèle à la nature, il sera partout chez lui.
Pour se rompre la main, il lit ensuite des figures vêtues, des sujets familiers
et domestiques à la manière de David Téniers, des bambochades dans le
goût des peintres flamands et hollandais. Ces tableaux, malgré leur mérite
par l'imitation trop exacte, trop littérale et trop minutieuse de la nature,
avaient un peu de sécheresse et de dureté. À cette période, qui forme la
première manière de Velasquez, peuvent se rapporter l'Aguador de Séville
qui est au musée de Madrid, une Nativité, appartenant jadis au comte
d'Aguila, et quelques autres toiles dont on a perdu la trace.
Tout en travaillant, il profitait de la conversation des lettrés et des poëtes
qui fréquentaient alors son maître Pacheco; il entendait leurs discours
enthousiastes, leurs raisonnements philosophiques, leurs dissertations
érudites sur les beaux-arts, et il apprenait, dans cette académie du bon
goût, ce qu'un peintre doit savoir pour être autre chose qu'un praticien
vulgaire. Il lisait aussi les bons livres dont était composée la bibliothèque de
l'artiste-littérateur, et il se préparait à sa fortune future.
Velasquez passa cinq ans dans cette école, qu'on pouvait vraiment appeler
une académie des beaux-arts, et Pacheco fut si content de la douceur de
caractère, de la régularité de mœurs et des brillantes dispositions que
montrait son élève, qu'il lui donna en mariage sa fille doña Juana. Il venait
en ce temps-là à Séville beaucoup de peintures de Flandre, d'Italie et de
Madrid, dont le jeune artiste se fit un sujet d'étude, mais aucunes ne lui
firent autant d'impression que celles de don Luis de Tristan. Il trouvait chez
ce maître un coloris analogue à sa propre manière de voir, une grande
vivacité de conception et une façon de dégrader les teintes qui le
satisfaisait complètement; dès lors il se déclara l'admirateur de Tristan,
copia ses toiles et quitta, pour un faire gras, large et souple, le style un peu
sec qu'il avait suivi jusque-là et qu'il tenait de Pacheco. À dater de cette
époque, il était entré en possession de son originalité, il possédait la
plénitude de son talent; c'était déjà le Velasquez que la postérité devait
regarder à bon droit comme un des souverains de la peinture. Arrivé à ce
point, il eut le désir de voir Madrid, et, au printemps de l'année 1622, il
partit de Séville. Il trouva dans la capitale un accueil cordial et une
protection efficace chez ses compatriotes, don Luis et don Melchor de
Alcazar, et surtout chez don Juan de Fonseca y Figueroa, amateur distingué
qui peignait pour son agrément et lui facilita les moyens d'étudier les chefs-
d'œuvre des collections de Madrid, du Prado et de l'Escurial. Fonseca
voulait procurer à son protégé les portraits des personnes royales; mais,
quelque mal qu'il se donnât, quoique bien en cour, où il avait une charge, et
frère du marquis d'Orellana, il n'y put, cette fois, parvenir. Cependant
Velasquez peignit le portrait du célèbre poëte don Luis de Gongora, que
Pacheco l'avait chargé de faire, et regagna Séville, laissant à Madrid un
protecteur qui remuait pour lui ciel et terre.
L'année suivante, il revint à Madrid en vertu d'une lettre du comte-duc
d'Olivarès, ministre d'État et favori de Philippe IV, qui lui accordait
cinquante ducats pour frais de route. Son beau-père l'accompagna pour
être témoin d'une gloire qu'il pressentait. Ils reçurent l'hospitalité dans la
maison de Fonseca, dont Velasquez lit aussitôt le portrait;—ce portrait, un
chef-d'œuvre qui décida la fortune du peintre, fut porté au palais et, en une
heure, vu du roi, de la famille royale, des grands de service, et loué de
tous, mais particulièrement de Sa Majesté, qui prit Velasquez à son service
en qualité de peintre, avec vingt ducats d'appointements par mois.
Notre artiste, entré en fonctions, fit, sur l'ordre du roi, le portrait du
cardinal infant, bien qu'il eût préféré peindre le roi lui-même, retenu alors
par de graves occupations. Malgré la difficulté d'obtenir des séances, il
acheva, le 30 août de la même année, le portrait du monarque dont il
devait, tant de fois retracer la face pâle. Le succès de cette admirable
peinture fut tel que le comte-duc d'Olivarès déclara publiquement que
personne n'avait jamais si bien réussi le roi, encore que Bartholomé et
Vincent Carducho, Caxes et Nardi s'y fussent essayés. Comme Alexandre,
qui ne voulut plus être peint par d'autres qu'Apelles, Philippe IV donna le
privilège de reproduire son effigie royale au seul Velasquez. Dans ce portrait
le roi est représenté à cheval, armé, le bâton de commandement à la main,
avec une fierté d'attitude et une majesté d'expression incomparables. On
permit à l'artiste d'exposer son tableau dans la calle Mayor, en face de
Saint-Philippe du Roi, un jour de fête, de sorte qu'il fût vu et admiré de tout
le peuple. Les peintres faillirent crever d'envie, mais personne n'écouta
leurs critiques intéressées, et les poëtes composèrent une multitude de
sonnets en l'honneur de Velasquez. On a conservé celui que rima Pacheco,
son beau-père. De plus en plus charmé, le roi lui ordonna de s'établir à
Madrid, d'y faire venir sa famille, et lui accorda pour le voyage une
indemnité de trois cents ducats; il lui fit, en outre de ses appointements
mensuels, une pension de trois cents ducats, ses ouvrages payés à part et
lui accorda l'usage gratuit du médecin et du chirurgien de la cour.
Accaparé tout jeune par ce fin connaisseur, Velasquez ne travailla presque
que pour son royal Mécène, dans le palais même où il avait un atelier, dont
le monarque possédait une clef double afin de venir visiter, quand cela lui
plaisait, son peintre bien-aimé. Cette longue faveur se maintint jusqu'à la
mort de l'artiste, sans caprice, intermittence, ingratitude ou fatigue.
Velasquez avait alors de vingt-trois à vingt-quatre ans, et il en vécut
soixante et un. Il fut peintre du roi, huissier de chambre, maréchal des
logis, chevalier de Santiago; mais ces charges et ces honneurs ne nuisirent
en rien à son talent. Son pinceau conserva toute sa franchise et sa
puissance. L'artiste, sous les yeux du roi, sut se préserver de la froideur
officielle et manifester librement son génie. Jamais la cour ne lui fit oublier
la nature.
Cet amour de la nature ne l'empêchait pas d'étudier les chefs-d'œuvre de
l'art et d'en discuter la théorie. Il était en correspondance réglée avec
Rubens, et quand le grand peintre d'Anvers vint à Madrid ce fut Velasquez
qui lui en fit les honneurs: les deux maîtres visitèrent ensemble les tableaux
des résidences royales et les discours de Rubens ne tirent que renouveler le
désir qu'avait le pensionnaire de Philippe IV, de visiter l'Italie, ce rêve de sa
jeunesse. Rien approvisionné d'argent, de lettres de recommandation,
accrédité comme un ambassadeur, Velasquez partit de Barcelone le 10 août
1629, et aborda à Venise où les peintures de Titien, de Tintoret, de
Véronèse, lui firent une vive impression. Tout le temps de son séjour il ne
cessa de dessiner et de copier d'après ces maîtres, particulièrement d'après
le Crucifiement, de Tintoret, dont il reproduisit un tableau qu'il donna au
roi, à son retour. À Rome, le pape Urbain VIII lui accorda un logement au
Vatican et lui fit offrir la clef de certaines pièces réservées pour qu'il put
travailler en toute liberté. Avec toute l'ardeur d'un élève, Velasquez copia au
crayon et au pinceau une grande partie du Jugement universel, des
Prophètes et des Sibylles, de Michel-Ange, dans la chapelle Sixtine, et
différentes figures et groupes de la Théologie, de l'École d'Athènes, du
Parnasse et de l'Incendie du Borgo et autres fresques de Raphaël.
Pendant son séjour à Rome, Velasquez, outre ces utiles études, peignit son
propre portrait qu'il envoya à son beau-père, la Forge de Vulcain et la
Tunique de Joseph. Il eut bien voulu rester encore, mais Philippe IV ne
pouvait pas se passer plus longtemps de son peintre et le rappelait, et il
retourna en Espagne vers le commencement de 1631, après avoir
embrassé Joseph Ribera en passant à Naples où il fit le portrait de la reine
de Hongrie.
Ce voyage ne changea en rien sa manière; il sut admirer les grands
maîtres, profiter de leurs leçons muettes sans leur sacrifier son originalité.
Chose singulière pour un artiste espagnol et bon catholique, comme il l'était
sans doute, Velasquez ne s'est pas adonné à la peinture religieuse; on ne
connaît de lui qu'un très-petit nombre de tableaux de sainteté. Le
mysticisme n'allait pas à cette nature robuste et positive: la terre lui
suffisait; peut-être se fût-elle égarée dans le ciel où Murillo se jouait d'un
essor si libre et si facile à travers les gloires, les auréoles et les guirlandes
de petits séraphins. Velasquez n'aimait pas à peindre de pratique; et
comme les anges ne posèrent pas devant lui, il ne put faire leur portrait. Il
s'en dédommagea en faisant vivre à jamais dans ses cadres les hommes et
les femmes de son temps.
Mais c'était là une préférence et non une impuissance. Pour s'en
convaincre, il suffit de regarder le magnifique Christ en croix passé du
couvent de Saint-Placide au musée de Madrid: une figure pale à la
chevelure pendante projetant sur son masque l'ombre de la couronne
d'épines, et se détachant, rayée de pourpre, d'un fond d'épaisses ténèbres.
Rien de plus émouvant et de plus sinistre que ce corps exsangue, d'une
beauté douloureuse, étendant ses bras morts sur ces nuées sombres,
comme un christ d'ivoire jauni sur son fond de velours noir. Par cette
simplicité terrible, Velasquez, dans ce tableau, s'est élevé au plus haut
pathétique.
Le Couronnement de la Vierge, sans être d'un profond sentiment religieux,
a toute la noblesse et la gravité que réclame le sujet. À demi agenouillés
sur des nuages, le Père Éternel et Jésus-Christ tiennent une couronne
suspendue au-dessus de la Vierge qui monte vers eux sur une nuée
soutenue par des têtes de chérubins. Dominant tout le groupe, le Saint-
Esprit souffle son effluve lumineuse et complète la Trinité. La tête de la
Vierge est d'une beauté humaine, il est vrai, mais si rare et si parfaite
qu'elle peut bien passer pour céleste. Le Christ et Jéhovah sont peints
d'une façon si magistrale, dans une attitude si digne et si sérieuse et d'une
si splendide couleur, qu'on oublie qu'ils ressemblent peut-être un peu trop à
des hommes.
Dans la Visite de saint Antoine à saint Paul l'Ermite, Velasquez, d'après une
liberté encore permise alors, a représenté son sujet sous trois aspects
divers. À la droite du tableau on voit saint Antoine qui frappe à la porte de
l'ermitage que le saint s'est creusé dans le roc. Au milieu, les deux
vénérables personnages, après s'être édifiés dans une pieuse conversation,
attendent la ration quotidienne, que le corbeau apporte double cette fois,
puisque le saint a un hôte à héberger. À gauche, saint Antoine enterre saint
Paul avec l'aide de deux lions, étranges et miraculeux fossoyeurs qui
creusent le sable de leurs ongles. Le paysage a l'âpreté sévère et grandiose
d'un paysage historique du Poussin, et les figures s'y dessinent avec une
singulière puissance de relief.
Par son tempérament réaliste Velasquez ne comprenait guère l'antiquité ni
la mythologie; il l'évita comme la peinture religieuse. Il n'avait pas vu les
dieux de l'Olympe et n'avait pas le secret de les faire descendre à son
atelier.
La Forge de Vulcain, malgré la mythologie de son titre, n'a rien qui rappelle
l'idéalité antique. Apollon vient trouver Vulcain à sa forge et l'avertir de sa
mésaventure conjugale. Cette dénonciation de mouchard olympien et
solaire à qui rien n'échappe ne fait pas grand honneur au frère de Diane, et
le pauvre dieu forgeron, tout noir de limaille, dessine en l'écoutant une
assez laide grimace. Les cyclopes dressent l'oreille, suspendant leur travail,
tout réjouis d'ailleurs de l'infortune de leur maître. Rien n'est moins grec et
moins homérique assurément. Mais quelles chairs jeunes, souples et
vivantes que celles de l'Apollon à demi drapé de son manteau de pourpre!
quelle vérité dans l'altitude de Vulcain et le geste des cyclopes! quelle
pittoresque rencontre de la lumière blanche du jour et du reflet rouge de la
forge! quelle science de modelé et de couleur! quelle inimitable force de
rendu, quels torses et quels dos! et comme ceux qui prétendaient que
Velasquez ne savait pas peindre le nu devaient rester confus devant cette
merveilleuse toile!
Argus et Mercure est un tableau composé, sans être beaucoup plus grec,
avec beaucoup de sentiment pittoresque et d'effet. Argus, vaincu par les
sons de la flûte de Mercure, s'est endormi enfin. Son corps, adossé à un
tertre, flotte dans le sommeil, ses bras ballants pendent à terre et son
attitude affaissée indique une somnolence surnaturelle. Ne croyez pas que
Velasquez lui ait donné les cent yeux et la forme héroïque du prince argien
qu'on nommait Panoptès parce qu'il voyait tout. Il en fait tout bonnement
un jeune berger espagnol vêtu d'une souquenille; mais comme il dort et
que le mouvement de Mercure, se soulevant à demi et s'approchant avec
précaution pour lui couper la tête est admirablement saisi! Quel accent
féroce prennent sur le ciel orageux les deux ailes du pétase dont est coiffé
Mercure et qui semblent les ailes d'un oiseau de proie s'abattant sur sa
victime! Io, sous la forme de génisse où Jupiter l'a cachée, attend que
Mercure l'emmène avec une impassibilité bovine. Oubliez les noms
mythologiques et ne voyez là qu'un vol de bétail, et vous aurez un chef-
d'œuvre de l'art.
Le tableau connu sous le nom de las Hilanderas (les Fileuses) est une toile
de genre grandie aux proportions historiques. Des dames de la cour visitent
une fabrique de tapisserie comme on le ferait maintenant de la
manufacture des Gobelins. Ce sujet, si simple qu'il ne semble pas même
offrir matière à peinture, est disposé par Velasquez de la manière la plus
ingénieuse. Les premiers plans, baignés d'une ombre légère et
transparente, montrent une sorte d'atelier où travaillent des ouvrières qui,
pour être plus à l'aise, n'ont gardé que leur jupon et leur chemise, comme
en usent encore les cigarreras à la manutention des tabacs, à Séville. Dans
l'angle, à gauche, une jeune fille relève avec un geste plein de naturel le
pan d'un rideau rouge; au milieu, une vieille fait mouvoir du pied un rouet;
à droite, une jeune ouvrière, tournant vers le spectateur une épaule que
laisse à découvert la chemise glissée, dévide distraitement un écheveau de
laine, car son attention est occupée par la présence de ces personnes de
haut parage. Il est impossible de peindre des chairs plus souples, plus
fraîches et plus vivantes que ce dos et cette nuque où se tordent des
cheveux bruns. On y devine jusqu'à la moiteur perlée produite par la
chaleur d'Espagne. Au fond, l'atelier s'ouvre sur une galerie que garnissent
les hautes et basses lisses exposées. Une tapisserie, représentant un sujet
allégorique, occupe les regards des visiteurs; tout le jour ménagé au reste
du tableau illumine d'une vive lumière cette partie de la toile et produit un
effet vraiment magique. On entrerait dans le cadre comme dans une
chambre réelle, tant la perspective aérienne est bien observée, tant l'air
circule autour des personnages, les séparant les uns des autres et les
mettant à leur plan réciproque. C'est là un des mérites de Velasquez; il
n'oublie jamais l'atmosphère ambiante, et personne mieux que lui n'a peint
l'air, cet élément insaisissable.
Nulle part cette qualité n'est plus visible que dans le célèbre tableau des
Ménines, que Luca Giordano appelait «la théologie de la peinture,» pour
marquer que là étaient la vérité, le dogme, l'orthodoxie, et que s'en
éloigner c'était devenir un hérésiarque de l'art. En effet, devant ce cadre,
l'illusion est complète, toute trace de travail a disparu; il semble qu'on voie
la scène même reproduite par une glace; les Ménines représentent, comme
on sait, Velasquez en train de faire le portrait de l'infante doña Marguerite.
Il est à son chevalet, dont la toile ne montre au spectateur que son envers;
pour distraire la petite infante, immobile sons sa raide parure, les Ménines
lui font la conversation, et l'une d'elles lui offre à boire dans un bucaro ou
vase des Indes, qui a la propriété de tenir l'eau fraîche. La dame qui offre le
bucaro est doña Maria Agustina, menine de la reine et fille de don Diego
Sanniento; celle qui parle, doña Isabel de Velasco, fille du comte de
Fuensalida. Au premier plan, Nicolasito Pertusano et Mari Borbola, nains de
cour, lutinent un grand chien qui se laisse faire; un peu en arrière du
groupe principal, plus vers le fond de l'appartement, on voit doña Maria
d'Ulloa, dame d'honneur, et un garde, et tout au bout, une porte ouverte
sur un escalier laisse apercevoir dans une vive lumière Josef Nieto,
aposentador de la reine. Tout dans ce cadre est peint d'après nature,
jusqu'aux tableaux qui ornent les parois de la galerie et au miroir qui reflète
le roi et la reine assis en face, contre la paroi de la chambre, que le peintre
a dû abattre pour en montrer l'intérieur. Ainsi leur image, sinon leur
personne, assiste à la scène. La chambre noire, dont Velasquez d'ailleurs se
servait beaucoup, ne donnerait pas une perspective plus exacte, une
dégradation de teintes mieux suivie, une lumière aussi douce et aussi
fondue, une impression plus forte de nature. En face des Ménines, on est
tenté de dire: «Où donc est le tableau?»
En examinant ce chef-d'œuvre en détail, vous apercevrez sur le pourpoint
noir de Velasquez une croix rouge de forme particulière; c'est celle de
chevalier de Saint-Jacques. Il existe sur cette croix une petite légende qui
n'est peut-être pas plus vraie que l'historiette de Charles-Quint ramassant le
pinceau du Titien, et de François Ier recevant le dernier soupir de Léonard
de Vinci, mais elle est la forme synthétique de l'admiration générale, et, à
ce juste titre, elle a sa valeur. Quand Velasquez eut achevé sa toile, le roi lui
dit «qu'il y manquait une chose essentielle,» et passant au pouce la palette,
et prenant un pinceau, comme pour donner la touche suprême, il traça sur
la poitrine du peintre, représenté dans le tableau, cette croix de cinabre
qu'on y voit encore aujourd'hui. Certes, c'était une gracieuse et noble façon
de récompenser le talent, et le roi se montrait ainsi digne de l'artiste.
Par malheur, sans infirmer tout à fait la légende, des recherches savantes
présentent les choses sous un autre jour. Philippe IV, en effet, par cédule
royale datée du Buen-Retiro, le 12 juin 1658, accorda l'habit de chevalier à
Velasquez, qui se présenta au conseil de l'ordre avec sa généalogie, pour
faire ses preuves, dont l'insuffisance nécessita une dispense que le roi
obtint du pape Alexandre VII, après quoi Velasquez fut reçu et prit l'habit
dans l'église des religieuses de la Carbonera.
Les Buveurs, plus connus sous le nom de los Borrachos (les ivrognes), sont
une des merveilles de la peinture. C'est une sorte de bacchanale, sans
mythologie et entendue à la façon réaliste. Un jeune drôle, nu jusqu'à la
ceinture, couronné de pampres, ayant un tonneau pour trône, coiffe d'une
guirlande en feuilles de vignes comme s'il lui conférait un ordre de
chevalerie bachique, un soudard dévotement agenouillé devant lui; à ses
pieds s'arrondit une cruche à large panse et roule une coupe vide. Un
gaillard demi-nu aussi et tenant un verre à la main s'accoude
nonchalamment, sur un tertre derrière le præses de la cérémonie. Au coin,
à gauche, un autre personnage assis à terre enveloppe amoureusement de
ses bras une jarre qui n'est pas pleine d'eau, à coup sûr; ces deux
confrères ont tous deux la couronne de pampres; ils sont reçus comme
biberons émérites dans l'ordre de la dive bouteille. Derrière le soudard se
tiennent trois postulants qu'il serait bien injuste de ne pas admettre; car ils
ont l'air de francs ivrognes et de parfaites canailles; armés d'écuelles et de
gobelets ils sont tout prêts à officier. Plus loin, un gueux déguenillé et dont
la souquenille laisse voir une poitrine sans linge, contemple la scène avec
extase et la main sur son cœur; il est un peu délabré pour se mêler à ces
nobles seigneurs, mais il a tant de zèle, une soif si inextinguible! Au fond,
un mendiant, voyant des gens rassemblés, profile de l'occasion et,
soulevant son feutre avachi, tend la main pour quêter une aumône.
Ce n'est pas là, comme on pourrait se l'imaginer, un simple tableau de
chevalet à la manière flamande, les figures sont de grandeur naturelle et
ont la proportion qu'on nomme historique. Ce sujet vulgaire a semblé à
Velasquez aussi important que le triomphe de Bacchus, l'ivresse de Silène,
la danse des Ménades, ou toute autre fiction prise de l'antiquité; il avait
même pour lui l'avantage d'être vrai. Il y a donc mis, avec un sérieux
profond, tout son art, toute sa science et tout son génie. Le torse du jeune
garçon, dont la blancheur contraste avec la teinte bistrée des visages qui
l'entourent, forme à la composition le plus heureux centre de lumière;
aucun pinceau ne fit chairs plus souples, mieux modelées et si vivantes;
l'œil a la molle hébétude et la bouche le vague sourire de l'ivresse. Quant
aux têtes des autres compagnons halées, tannées, fauves, comme du cuir
de Cordoue, montrant de longues dents d'un appétit féroce, faisant luire
dans des pattes d'oie de rides le regard mouillé des convoitises bachiques,
elles rappellent les types caractérisés de la Tuna, cette bohème espagnole
si amusante, si pittoresque et si ardemment colorée.
L'Espagne, malgré son amour du faste, son étiquette et son orgueil, n'a
jamais eu le mépris du haillon; dans son art souvent d'un spiritualisme si
éthéré les gueux ont toujours été les bienvenus. Il y a toute une littérature
picaresque consacrée à retracer les exploits et les aventures des pauvres
diables à la recherche d'un dîner problématique; Rinconete et Cortadillo des
nouvelles exemplaires de Cervantes, Guzman d'Alfarache, Lazarille de
Tormes, El gran Tacaño représentent tout un monde famélique, déguenillé
et hasardeux, d'une amusante misère. Dans ce pays si fier, nul dédain pour
la pauvreté. Après tout, ce compagnon au feutre roussi tombant sur les
yeux, au manteau d'amadou déchiqueté, qui de sa main cachée gratte sa
poitrine est peut-être un gentilhomme, un descendant de Pélage, un
chrétien de la vieille roche. Son galion a échoué; il a été captif en Alger,
blessé dans les Flandres, sa requête a été repoussée par la cour. Qui n'a
pas ses malheurs! Murillo lui-même le suave, le vaporeux, l'angélique, ne
dédaigne pas les loques du petit pouilleux et de cet enfant cherchant sa
vermine au soleil, il fait un chef-d'œuvre! Velasquez bien qu'il eût son
atelier au palais parcourait les quartiers perdus et s'il trouvait au Rastro ou
ailleurs un gredin farouchement déguenillé, un mendiant superbement
crasseux, à souquenille effilochée, à barbe inculte, il le peignait avec le
même amour, la même maestria que s'il eût eu pour modèle un roi ou un
infant, sauf à écrire dans le coin du cadre pour donner un air philosophique
à la chose, Ésope ou Ménippe. Les nains avec leurs difforme laideur, ne le
rebutaient pas; il leur prêtait la beauté de l'art et les revêtait de sa
puissante couleur comme d'un manteau royal; il acceptait même les
phénomènes de la nature, les monstruosités à montrer en foire. El niño de
Vallecas (l'enfant de Vallecas) est un de ces tours de force auxquels se
plaisait Velasquez. C'était un enfant prodige, d'une grandeur étonnante
pour son âge et né avec toutes ses dents; aussi Velasquez, dans son
tableau, l'a-t-il représenté la bouche ouverte pour laisser voir cette denture
prématurée, objet de la curiosité publique. Eh bien! ce phénomène est un
merveille de vie, de couleur et de relief; ces bizarreries plaisaient aux
peintres naturalistes; Ribera ne fit-il pas le portrait d'une femme à barbe?
Cependant ce n'était pas la clientèle illustre qui manquait à Velasquez. Il
suffisait à peine aux rois, aux reines, aux infants et aux infantes, aux
papes, aux princes, aux ministres et aux grands désireux d'avoir un portrait
de sa main.
La Reddition de Bréda, plus connue sous le nom de tableau des lances,
mêle dans la proportion la plus exacte la réalité à la grandeur. La vérité
poussée jusqu'au portrait, n'y diminue en rien la fierté du style historique.
Un vaste ciel aéré de lumière et de vapeur, richement peint en pleine pâle
d'outremer, fond son azur avec les lointains bleuâtres d'une immense
campagne où luisent des nappes d'eau traînées par des luisants argentés.
Çà et là des fumées d'incendie montent du sol et vont rejoindre les nuages
du ciel en tourbillons fantasques. Au premier plan, de chaque côté, se
masse un groupe nombreux: ici les troupes flamandes; là, les troupes
espagnoles laissant libre pour l'entrevue du général vaincu et du général
vainqueur un espace dont Velasquez a fait une trouée lumineuse, une fuite
vers les profondeurs où brillent les régiments et les enseignes indiqués en
quelques touches savantes.
Le marquis de Spinola, tête nue, le chapeau et le bâton de commandement
à la main, revêtu de son armure noire damasquinée d'or, accueille avec une
courtoisie chevaleresque, affable et presque caressante, comme cela se
pratique entre ennemis généreux et faits pour s'estimer, le gouverneur de
Bréda, qui s'incline et lui offre les clefs de la ville dans une attitude
noblement humiliée.
Des drapeaux écartelés de blanc et d'azur dont le veut tourmente les plis
rompent heureusement les lignes droites des lances tenues hautes par les
Espagnols. Le cheval du marquis se présentant presque en raccourci du
côté de la croupe en retournant la tête, est d'une habile invention pour
dissimuler la symétrie militaire, si peu favorable à la peinture.
On ne saurait rendre par des paroles la fierté chevaleresque et la grandesse
espagnole qui distinguent les têtes des officiers formant l'état-major du
général. Elles expriment la joie calme du triomphe, le tranquille orgueil de
race, l'habitude des grands événements. Ces personnages n'auraient pas
besoin de faire leurs preuves pour être admis dans les ordres de Santiago
et de Calatrava. Ils seraient reçus sur la mine, tant ils sont naturellement
hidalgos. Leurs longs cheveux, leurs moustaches retroussées, leur royale
taillée en pointe, leurs gorgerins d'acier, leurs corselets ou leurs justes de
buffle en font d'avance des portraits d'ancêtres à suspendre, blasonnés
d'armoiries au coin de la toile, dans la galerie des châteaux. Personne n'a
su, comme Velasquez, peindre le gentilhomme avec une familiarité superbe
et pour ainsi dire d'égal à égal. Ce n'est point un pauvre artiste embarrassé
qui ne voit ses modèles qu'au moment de la pose et n'a jamais vécu avec
eux. Il les suit dans les intimités des appartements royaux, aux grandes
chasses, aux cérémonies d'apparat. Il connaît leur port, leur geste, leur
attitude, leur physionomie; lui-même est un des favoris du roi (privados del
rey). Comme eux et même plus qu'eux, il a les grandes et les petites
entrées. La noblesse d'Espagne ayant Velasquez pour portraitiste, ne
pouvait pas dire comme le lion de la fable: «Ah! si les lions savaient
peindre.»
Velasquez se place naturellement entre Titien et Van Dyck comme peintre
de portraits. Sa couleur est d'une harmonie profonde et solide, d'une
richesse sans faux luxe et qui n'a pas besoin d'éblouir. Sa magnificence est
celle des vieilles fortunes héréditaires. Elle est tranquille, égale, intime.
Point de grands tapages de rouges, de verts et de bleus, point de
scintillement neuf, point de fanfreluches brillantes. Tout est rompu, amorti,
mais d'un ton chaud comme de l'or ancien ou d'un ton gris comme l'argent
mal d'une vaisselle de famille. Les choses voyantes et criardes sont bonnes
pour les parvenus et don Diego Velasquez de Silva est trop bon
gentilhomme pour se faire remarquer de la sorte, et aussi, disons-le, trop
excellent peintre. Quoique naturaliste, il apporte dans son art une largeur
hautaine, un dédain du détail inutile, une entente du sacrifice qui montrent
bien le maître souverain. Ces sacrifices n'étaient pas toujours ceux qu'un
autre peintre aurait faits. Velasquez choisit pour le mettre en évidence ce
qui parfois semblait devoir être laissé dans l'ombre. Il éteint et il allume
avec un caprice apparent, mais l'effet lui donne toujours raison.
Sa justesse de coup d'œil était telle, qu'en prétendant ne faire que copier, il
amenait l'âme à la peau et peignait en même temps l'homme intérieur et
l'homme extérieur. Ses portraits racontent mieux que tous les chroniqueurs
les Mémoires secrets de la cour d'Espagne. Qu'il les représente en habit de
gala, chevauchant des genets, en costume de chasse, une arquebuse à la
main, un lévrier aux pieds, on reconnaît dans ces figures blafardes de rois,
de reines et d'infants à la face pâle, à la lèvre rouge, au menton massif, la
dégénérescence de Charles-Quint et l'abâtardissement des dynasties
épuisées. Quoique peintre de cour, il ne les a pas flattés ses royaux
modèles! Cependant, malgré l'hébétation du type, la qualité de ces hauts
personnages ne saurait être douteuse. Ce n'est pas qu'il ne sût peindre le
génie; le portrait du comte-duc d'Olivarès, si noble, si impérieux et si plein
d'autorité le prouve d'une façon irrécusable. Ne pouvant prêter de la
flamme à ces tristes sires, il leur donnait la majesté froide, la dignité
ennuyée, le geste et la pose d'étiquette, et il enveloppait le tout dans sa
couleur magnifique; c'était bien payer la protection de son ami couronné.
M. Paul de Saint-Victor a nommé quelque part Victor Hugo le grand
d'Espagne de la poésie; qu'il nous permette, en détournant un peu son
mot, d'appeler Velasquez «le grand d'Espagne de la peinture.» Nulle
qualification ne saurait mieux lui convenir.
Comme nous l'avons dit, Velasquez était maréchal des logis de la cour, et ce
fut lui qui fut chargé de préparer les logements du roi dans le voyage que
Philippe IV fit à Iran, pour remettre l'infante doña Maria Teresa au roi de
France, Louis XIV, qui la devait épouser. Ce fut encore lui qui fit dresser et
orner, dans l'île des Faisans, le pavillon où l'entrevue des deux rois eut lieu.
Velasquez se distingua parmi la foule des courtisans par la dignité de sa
personne, l'élégance, la richesse et le bon goût de ses costumes, sur
lesquels il plaçait avec art les diamants et les joyaux, présents des
souverains; mais, à son retour à Madrid, il tomba malade de fatigue et
mourut le 7 août 1660. Sa veuve doña Juana Pacheco ne lui survécut que
de sept jours et fut enterrée près de lui, dans la paroisse de Saint-Jean. Les
funérailles de Velasquez avaient été splendides; de grands personnages, les
chevaliers des ordres militaires, la maison du roi, les artistes y assistaient
tristes et soucieux, comme s'ils sentaient qu'avec Velasquez ils enterraient
l'art espagnol.
L’Assomption d’après Murillo
Our website is not just a platform for buying books, but a bridge
connecting readers to the timeless values of culture and wisdom. With
an elegant, user-friendly interface and an intelligent search system,
we are committed to providing a quick and convenient shopping
experience. Additionally, our special promotions and home delivery
services ensure that you save time and fully enjoy the joy of reading.
ebooknice.com