Python Concurrency Tutorial

Acesta este un rezumat al tutorialului meu de la PyCon 2020. Puteți găsi videoclipul original și codul sursă aici: https://github.com/santiagobasulto/pycon-concurrency-tutorial-2020

https://www.youtube.com/watch?v=18B1pznaU1o

Acesta este un ghid/tutorial rapid despre cum să scrieți eficient programe concurente folosind Python. Concurrența în Python poate fi confuză. Există mai multe module (threading, _thread, multiprocessing, subprocess). Există, de asemenea, mult urâtul GIL, dar numai pentru CPython (PyPy și Jython nu au un GIL). Colecțiile nu sunt thread safe, cu excepția unor detalii de implementare cu CPython.

Obiectivul acestui tutorial este de a oferi recomandări concrete privind modul de abordare a fiecărui caz de utilizare a codului concurent (sau paralel).

Vă veți da seama că, spre deosebire de alte tutoriale Python mai tradiționale „multithreading only”, încep cu un rezumat atât al arhitecturii calculatoarelor, cât și al conceptelor de sisteme de operare. Înțelegerea acestor concepte de bază este fundamentală pentru a construi corect programe concurente. Vă rugăm să săriți peste aceste secțiuni dacă sunteți deja familiarizați cu aceste subiecte.

Acest tutorial este împărțit în următoarele secțiuni:

Concurență vs. paralelism
Arhitectura calculatoarelor
Rolul sistemului de operare
Threads cu Python
Sincronizarea firelor
Multiprocesare
Biblioteci de nivel înalt: concurrent.futures și parallel

Concursivitate vs paralelism

Paralelismul este atunci când mai multe sarcini rulează în același timp. Este obiectivul final al programelor concurente. Concurrența este mai puțin decât paralelismul, înseamnă că pornim mai multe sarcini și jonglăm cu ele în aceeași perioadă de timp. Cu toate acestea, la un moment dat, facem doar unul la un moment dat.

Aplicat la gătit, acestea ar fi exemple de concurență și paralelism.

Concurența are o singură persoană în bucătărie:

Începeți să tăiați ceapa
Începeți să încălziți tigaia
Finalizați tăierea cepei

În acest caz este clar că nu putem face mai multe lucruri ÎN ACELAȘI TIMP. Le putem începe pe toate, dar trebuie să sărim înainte și înapoi pentru a le controla.

Paralelismul are mai multe persoane în bucătărie:

Persoana 1 taie ceapa
Persoana 2 taie ardeii roșii
Persoana 3 așteaptă ca tigaia să se încălzească

În acest caz sunt mai multe sarcini care se fac în același timp.

Arhitectura calculatoarelor

Toate calculatoarele moderne pot fi simplificate folosind arhitectura von Neumann, care are 3 componente principale: Calculator (CPU), Memorie (RAM), I/O (hard disk-uri, rețele, ieșire video).