Python Concurrency Tutorial

Este é um resumo do meu tutorial PyCon 2020. Você pode encontrar o vídeo original e o código fonte aqui: https://github.com/santiagobasulto/pycon-concurrency-tutorial-2020

https://www.youtube.com/watch?v=18B1pznaU1o

Este é um guia rápido/tutorial sobre como escrever eficazmente programas concorrentes usando Python. A simultaneidade em Python pode ser confusa. Existem vários módulos (threading, _thread, multiprocessing, subprocess). Há também o muito odiado GIL, mas apenas para o CPython (PyPy e Jython não têm um GIL). As coleções não são seguras, exceto por alguns detalhes de implementação com CPython.

O objetivo deste tutorial é fornecer recomendações de como abordar cada caso de uso de código concorrente (ou paralelo).

Você notará que, ao contrário de alguns outros tutoriais mais tradicionais de Python “somente multithreading”, eu começo com um resumo tanto da Arquitetura de Computadores quanto dos conceitos de Sistemas Operacionais. Entender estes conceitos básicos é fundamental para construir corretamente programas simultâneos. Por favor, pule estas seções se você já está familiarizado com estes tópicos.

Este tutorial está dividido nas seguintes seções:

Concurrency vs Parallelism
Arquitetura de Computador
O papel do Sistema Operacional
Temas com Python
Sincronização de Tópicos
Multiprocessamento
Bibliotecas de alto nível: concurrent.futures e parallel

Concurrency vs Parallelism

Parallelism é quando várias tarefas estão em execução ao mesmo tempo. É o objetivo final dos programas simultâneos. Concorrência é menos que paralelismo, significa que estamos iniciando várias tarefas e fazendo malabarismos no mesmo período de tempo. Entretanto, em qualquer momento em particular, estamos fazendo apenas uma de cada vez.

Aplicado ao cozimento, estes seriam exemplos de concurrência e paralelismo.

A moeda tem apenas uma pessoa na cozinha:

Comece a cortar as cebolas
Comece a aquecer a panela
Conclua a cortar as cebolas

Neste caso, é claro que não podemos fazer várias coisas na mesma hora. Podemos começar todas elas, mas temos de saltar para trás e para a frente para as controlar.

Paralelismo tem várias pessoas na cozinha:

Pessoa 1 está a cortar cebolas
Pessoa 2 está a cortar pimentos vermelhos
Pessoa 3 espera que a panela aqueça

Neste caso há várias tarefas a serem feitas ao mesmo tempo.

Arquitetura do computador

Todos os computadores modernos podem ser simplificados usando a arquitetura von Neumann, que tem 3 componentes principais: Computação (CPU), Memória (RAM), E/S (discos rígidos, redes, saída de vídeo).

O Processo

Um Processo é a abstração que o Sistema Operacional usa para executar seu código. Ele envolve seu código neste processo, e atribui memória e outros recursos compartilhados. A abstração do processo permite ao sistema operacional “distinguir” entre os programas em execução, de modo que eles criam conflitos entre si. Por exemplo, o Processo 1 não pode acessar a memória reservada pelo Processo 2. Também é importante em termos de segurança dos usuários. Se o Usuário 1 iniciar um processo, esse processo será capaz de ler os arquivos acessíveis por esse usuário.

O diagrama seguinte contém uma representação visual de um Processo. O processo contém o código que deve executar, a RAM alocada e todos os dados criados pelo programa (variáveis, arquivos abertos, etc).