# Fondammentaux de Python

Ce notebook est *légèrement adapté* à partir d'un notebook de Baptiste Gregorutti. 

Pour chacune des méthodes, il vous faudra bien comprendre leur fonctionnement et vous pourrez vous documenter sur internet (docs officielles et forums).
N'hésitez pas à modifier les cellules pour tester d'autres configurations que celles données ici.

Si vous souhaitez connaitre les méthodes disponibles d'un objet particulier, utilisez la function ``dir(obj)``.

## Syntaxe, types et structures de contrôle

### Syntaxe générale : des blocs de code indentés

La syntaxe de Python repose sur
* Une série d'instructions formant des **blocs de code indentés**. Ces séries d'instructions sont organiées en **structures de contrôle**. A l'inverse de la plupart des langages de programmation, l'indentation en Python n'est pas uniquement esthétique. Elle a pour but d'indiquer à l'interpréteur les instructions qui appartiennent à des structures de contrôle. Par convention, une indentation de 4 espaces est généralement utilisée.
* Les noms de variables sont libres à l'exception de quelques mots clés réservés.
* L'utilisation du caractère # permet de commenter une ligne de code 

In [1]:
def fct(n):
    """
    Docstring
    """
    for item in range(n):
        # un commentaire
        if not item % 2:
            local_variable = item
        else:
            local_variable = None
        print(local_variable)

In [2]:
fct(10)

0
None
2
None
4
None
6
None
8
None


Les mots clés suivants sont réservés et ne peuvent être utilisés comme noms de variables :

`False, await, else, import, pass, None, break, except, in, raise, True, class, finally, is, return, and, continue, for, lambda, try, as, def, from, nonlocal, while, assert, del, global, not, with, async, elif, if, or`

Exception associée : `SyntaxError`

In [4]:
class = 1
print(class)

SyntaxError: invalid syntax (3039032224.py, line 1)

### Typage dynamique fort

Le type d'un objet est déterminé par l'ensemble de ses méthodes et attributs

* Dynamique : le type d'un objet est déterminé au moment de l'exécution
* Fort : Python interdit des opérations ayant peu de sens et ne cherche pas à convertir lui même.

Par exemple :
* **On ne peut pas** ajouter une chaîne de caractère et un entier
* **On peut** multiplier une chaîne de caractère et un entier

Exception associée : `TypeError`

In [5]:
def calcul(a, b, c):
    return (a + b) * c

In [6]:
print(calcul(1, 2, 3))

9


In [7]:
print(calcul("titi", "toto ", 2))

tititoto tititoto 


In [8]:
print(calcul("titi", 2, "toto "))

TypeError: can only concatenate str (not "int") to str

In [9]:
print("python" * 2)

pythonpython


In [11]:
print("python" + 2)

TypeError: can only concatenate str (not "int") to str

Ajoutez ici une cellule qui permet d'afficher "python3", c'est-à-dire de concaténer "python" avec 3.

Mots clés `type` et `isinstance`

In [12]:
a = 1
print(type(a))

b = .5   # idem que b = 0.5
print(type(b))

c = 1.+2.j
print(type(c))

<class 'int'>
<class 'float'>
<class 'complex'>


In [13]:
isinstance(a, int)

True

### Types numériques

Les types numériques sont les types associés aux entiers (`int`), aux nombres réel (`float`) ou aux booléens (`bool`). Les opérations mathématiques standards sont intégrées nativement à Python : addition, différence, multiplication et division euclidienne

In [14]:
print(10 + 4)
print(10 - 4)
print(10 * 4)

14
6
40


In [15]:
print(10 ** 4)
print(10 / 4)
print(10 / float(4))
print(7 // 3)
print(7 % 3)

10000
2.5
2.5
2
1


### Opérations sur les booléens et comparaison

Les opérations logiques sont également intégrée nativement à Python via les mots clés `and`, `or` et `not`.

In [16]:
a = True
b = a and False   # idem que b = a & False
c = not a
d = bool(0)
e = bool(1)

Comparer des objets de type numérique revient à créer un objet booléen

In [17]:
print(5 > 3)
print(5 >= 3)
print(5 != 3)
print(5 == 5)
print(5 > 3 and 6 > 3)
print(5 > 3 or 5 < 3)
print(not False)
print(False or not False and True)

True
True
True
True
True
True
True
True


### Structures de contrôle

Un programme est une séquence d’instructions dont l’ordre doit être respecté. Au-delà de cet aspect séquentiel, on peut souhaiter :
    
* n’effectuer certaines instructions que si une condition est vérifiée ;
* répéter certaines instructions ;
* factoriser une sous-séquence d’instructions au sein d’une fonction pour pouvoir y faire appel à plusieurs reprises dans le programme.

Les structures de contrôle associées à ces différents comportements sont décrits dans la suite de cette section.

In [18]:
# Boucle for
for i in range(10):
    print(i)

0
1
2
3
4
5
6
7
8
9


In [19]:
# Boucle while
i = 0
while i < 10:
    print(i)
    i += 1

0
1
2
3
4
5
6
7
8
9


In [20]:
# Conditionnelle
i = 0
if i == 0:
    a = 1
    print(a)
else:
    a = 2

1


In [21]:
# Version one-liner d'une conditionnelle
a = 1 if not i else 2
print(a)

1


Attention à l'erreur très classique suivante :

In [22]:
i = 0
if i == 0:
    a = True
else:
    a = False

Ce n'est pas incorrect au niveau syntaxique mais il est préférable d'écrire plus simplement :

In [23]:
i = 0
a = i == 0

## Listes

Une liste est une structure de données qui contient une suite d'objets Python. Les éléments de la liste ne sont pas nécessairement de types numériques mais peuvent être également des listes ou des objets plus complexes. On dit des listes qu'elles sont des **objets itérables**. 

Principales fonctionnalités sur les listes :
* Extraire / remplacer un élément
* Extraire / remplacer une sous-séquence (slicing)
* Supprimer des éléments
* Concaténer deux listes
* Répeter les élements d'une liste
* Ajout d'un élement en fin de liste

Quelques méthodes utiles :
* append
* clear
* copy
* count
* extend
* index
* insert
* pop
* remove
* reverse
* sort

### Les listes sont des objets mutables

Les listes sont dites **mutables** car elles peuvent être modifiées après leur création (contenu et/ou taille) via des méthodes spécifiques.

Nous préciserons ce concept plus bas.

### Revue des fonctionnalités de base

In [24]:
my_list = [True, 2, "3", 4]
my_list[0]

True

In [25]:
print(2 in my_list)
print([2, "3"] in my_list)

True
False


In [26]:
list_of_int = list(range(10))
n = len(list_of_int)
list_of_int[0:n:2]

[0, 2, 4, 6, 8]

In [27]:
list_of_int = list(range(10))
n = len(list_of_int)
sub_list = [0, 20, 40, 60, 80]
list_of_int[0:n:2] = sub_list
print(list_of_int)

[0, 1, 20, 3, 40, 5, 60, 7, 80, 9]


Que s'est-il passé ici ?

In [28]:
list_of_int.insert(-1, 1000)
print(list_of_int)

[0, 1, 20, 3, 40, 5, 60, 7, 80, 1000, 9]


In [29]:
item = list_of_int.pop(2)
print(item, list_of_int)

20 [0, 1, 3, 40, 5, 60, 7, 80, 1000, 9]


In [30]:
item = list_of_int.pop(list_of_int.index(1000))
print(item, list_of_int)

1000 [0, 1, 3, 40, 5, 60, 7, 80, 9]


In [31]:
print(list_of_int + [-1])

[0, 1, 3, 40, 5, 60, 7, 80, 9, -1]


In [32]:
print([1, 2] * 3)

[1, 2, 1, 2, 1, 2]


In [33]:
my_list = [1, 2, 3]
my_list.reverse()
print(my_list)

[3, 2, 1]


### Boucler sur une liste

In [34]:
my_list = [1, 3, 5, 2, 4, 6]

print("Exemple 1")
for item in my_list:
    print(item)

print("Exemple 2, à éviter")
for i in range(len(my_list)):
    print(my_list[i])

print("Exemple 3, avec enumerate")
for i, item in enumerate(my_list):
    print(i, item)

Exemple 1
1
3
5
2
4
6
Exemple 2, à éviter
1
3
5
2
4
6
Exemple 3, avec enumerate
0 1
1 3
2 5
3 2
4 4
5 6


In [35]:
# Exemple : calculer les carrés des éléments d'une liste de n éléments

n = 10

# Cas 1 : à éviter !
new_list = []
for item in range(n):
    new_list.append(item**2)
print(new_list)

# Cas 2 : listes de compréhension
print([item**2 for item in range(n)])

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


### Conditionnelle avec une liste

In [36]:
my_list = [1, 2, 3]
if my_list != []:
    print("Not empty")

if my_list:
    print("Not empty")

Not empty
Not empty


In [37]:
my_list = []
if my_list == []:
    print("Empty")

if not my_list:
    print("Empty")

Empty
Empty


## Chaînes de caractères

Les chaînes de caractères sont des suites de caractères. Objets itérables également, elles s'apparentent à des listes de caractères même si elles contients des méthodes spécifiques.

In [38]:
s = "une chaine de caracteres"
print("Exemple 1", s, end="\n\n")

s = 'une chaine de caracteres'
print("Exemple 2", s, end="\n\n")

s = """une chaine 
de caracteres"""
print("Exemple 3", s, end="\n\n")


s = """une chaine
\tde caracteres"""
print("Exemple 4", s, end="\n\n")


Exemple 1 une chaine de caracteres

Exemple 2 une chaine de caracteres

Exemple 3 une chaine 
de caracteres

Exemple 4 une chaine
	de caracteres



L'opérateur `in` permet de tester si un caractère est inclus dans la chaine. A noter que cet opérateurs fonctionne également pour des listes et d'autres types itérables.

In [39]:
print("u" in s)
print("une" in s)

True
True


### Concaténation de chaînes de caractères et formattage

L'opérateur `+` permet la concaténation de deux chaînes de caractères.

In [40]:
s = "une chaine" + "de" + "caracteres"
print(s)

une chainedecaracteres


Plusieurs manières existent pour formatter une chaîne de caractères à partir d'objets de types différents

* Formattage "old-school"
* Avec la fonction `format`
* f-strings (depuis python3.6, voir [PEP498](https://peps.python.org/pep-0498/))

Voir : https://realpython.com/python-f-strings

In [41]:
pi = 3.14159
print("pi = {}".format(pi))
print("pi = {:.2f}".format(pi))
print("pi = {:8.2f}".format(pi))

pi = 3.14159
pi = 3.14
pi =     3.14


In [42]:
pi = 3.14159
print(f"pi = {pi}")
print(f"pi = {pi:.2f}")
print(f"pi = {pi:8.2f}")

pi = 3.14159
pi = 3.14
pi =     3.14


In [43]:
s = "python"
print(s[0])
print(s[1:3])
print(s[1:6:2])

p
yt
yhn


### Quelques autres méthodes sur les chaînes de caractères

In [44]:
# Méthode join
print("_".join("python"))
print("_".join(["p", "y", "t", "h", "o", "n"]))

list_of_strings = ["je", "suis", "dans", "jupyter"]
print(" ".join(list_of_strings))

p_y_t_h_o_n
p_y_t_h_o_n
je suis dans jupyter


In [45]:
# Méthode lower
print("AZERTY".lower())

# Méthode upper
print("azerty".upper())

# Méthode replace
my_str = "python"
new_str = my_str.replace("t", "T")
print(new_str)

# Méthode split, exemple 1
my_str = "je suis dans jupyter"
print(my_str.split(" "))

# Méthode split, exemple 2
path = "data/dataset.csv"
file_name = path.split("/")[-1]
print(file_name)

file_name = path.split("/")[-1].split(".")[0]
print(file_name)

# Remarque : pour la gestion des dossiers et l'intéraction avec l'OS, voir la librairie pathlib


azerty
AZERTY
pyThon
['je', 'suis', 'dans', 'jupyter']
dataset.csv
dataset


### Boucler sur une chaîne de caractères

In [46]:
for item in "python":
    print(item)

p
y
t
h
o
n


### Conditionnelle avec des chaînes de caractères

In [47]:
s = "python"
if s != "":
    print("Not empty")

if s:
    print("Not empty")

Not empty
Not empty


In [48]:
s = ""
if s == "":
    print("Empty")

if not s:
    print("Empty")

Empty
Empty


## Tuples

Les tuples sont des séquences d'objets de types différents. Contrairement aux listes, les tuples ne peuvent pas être modifiés après leur création. Ils sont donc immuables.

Définis par des parenthèses, les tuples permettent un accès à ces éléments par indices comme pour les listes. Par exemple :


In [49]:
my_tuple = (1, 2, 3, "test", 2.71, 5)
print(my_tuple[0])
print(my_tuple[0:4:2])

1
(1, 3)


De part sa caractéristique immuable, il est impossible de modifier un ou plusieurs éléments composant la séquence. L'opération suivante est donc impossible :

In [51]:
my_tuple[0] = 10

TypeError: 'tuple' object does not support item assignment

De fait, les opérations sur les tuples sont limitées aux opérations suivantes :

In [52]:
# Compter le nombre d'occurrences d'un élément
print(my_tuple.count(3))
print(my_tuple.count("hello"))

1
0


In [54]:
# Trouver la position de la première occurrence d'un élément
print(my_tuple.index(3))
print(my_tuple.index("hello"))

2


ValueError: tuple.index(x): x not in tuple

In [55]:
# Concaténer plusieurs tuples via l'opérateur "+"
# Le résultat de l'opération est un nouvel objet de classe Tuple. 

my_tuple = (1, 2, 3, "test", 2.71, 5)

# Cas 1
print(my_tuple + (1, 2) + ("hello",))

# Cas 2
my_tuple = my_tuple + (1, 2) + ("hello",)
print(my_tuple)

(1, 2, 3, 'test', 2.71, 5, 1, 2, 'hello')
(1, 2, 3, 'test', 2.71, 5, 1, 2, 'hello')


Deux remarques :

1. Définir un tuple ne contenant qu'un seul élément se fait en mettant le caractère "," : `my_tuple = (1,)`. A votre avis, de quel type de l'objet `(1)` et de l'objet `("hello")` ? Tester en utilisant la fonction `type`.
2. Dans le cas 2, on assigne le résultat de la concaténation à l'objet `my_tuple`. Cela n'est-il pas incompatible avec la caractéristique immutable du type Tuple ? En réalité, l'objet résultant n'est pas le même objet que celui défini auparavant. Autrement dit, c'est un nouvel objet qui est créé avec une nouvelle valeurs.

In [56]:
# Répéter les élements via l'opérateur "*"
# Tout comme les listes, l'opérateur "*" permet de dupliquer les éléments de l'objet. Par exemple :
my_tuple * 2

(1,
 2,
 3,
 'test',
 2.71,
 5,
 1,
 2,
 'hello',
 1,
 2,
 3,
 'test',
 2.71,
 5,
 1,
 2,
 'hello')

### Boucler sur un tuple

Boucler sur les éléments un tuple est identique au cas des listes car l'accès aux éléments se fait de la même façon. De fait, les fonctions `range`, `len`, `enumerate`, etc. s'adaptent aux tuples.


In [57]:
my_tuple = (1, 2, 3, "test", 2.71, 5)
for item in my_tuple:
    print(item*2)

2
4
6
testtest
5.42
10


Attention : il n'existe pas directement un équivalent des listes de compréhension pour les tuples. Même si la syntaxe suivante est correcte, le résultat **n'est pas un tuple** mais un [generator](https://realpython.com/introduction-to-python-generators/), qui ne stocke pas le résultat avant d'avoir accès aux différents éléments via une boucle, par exemple.

### Tuple de compréhension = generator

In [58]:
# Crée un objet generator
gen = (item*2 for item in my_tuple)
type(gen)

generator

In [59]:
for item in gen:
    print(item)

2
4
6
testtest
5.42
10


Dans cet exemple, les éléments du tuple sont stockés en mémoire les uns après les autres et ce à chaque itération de la boucle ou bien à l'appel de la fonction next.L'intérêt est de préserver la mémoire pour un très grand nombre d'objets stockés. Une fois la boucle terminée, le générateur ne contient plus rien.

In [61]:
# Lève une exception StopIteration, c-à-d qu'il ne reste plus aucun élément dans le tuple
next(gen)

StopIteration: 

Il est en revanche possible de convertir un générateur en tuple (ou list d'ailleurs). Mais l'intérêt est limité dans ce cas. Autant utiliser une liste de compréhension

In [62]:
gen = tuple(item*2 for item in my_tuple)

## Dictionnaires

Les dictionnaires sont des séquences de paires clé-valeur. Chaque clé est associée à une valeur, et les clés doivent être uniques. Les dictionnaires sont définis par des accolades et permettent d'accéder aux éléments par leurs clés.

Principales fonctionnalités sur les dictionnaires :
* Ajouter un élément
* Remplacer un élément
* Supprimer des éléments

Quelques méthodes utiles :
* get
* keys
* values
* update

### Création d'un dictionnaire

In [63]:
my_dict = {}
print(my_dict)

my_dict = {"key1": 1, "key2": "value_2"}
print(my_dict)

my_dict = dict(key1=1, key2="value_2")
print(my_dict)

{}
{'key1': 1, 'key2': 'value_2'}
{'key1': 1, 'key2': 'value_2'}


In [64]:
# Lister les clés
print(my_dict.keys())

# Lister les valeurs
print(my_dict.values())

# Lister les clés et les valeurs
print(my_dict.items())

# Les résultats ne sont pas des objets itérables conventionnels et doivent être convertis pour les manipuler, dans certains cas.

dict_keys(['key1', 'key2'])
dict_values([1, 'value_2'])
dict_items([('key1', 1), ('key2', 'value_2')])


### Accès à la valeur associée à une clé

Il existe deux manières d'accéder à une valeur d'un dictionnaire : accès direct en utilisant les crochets ou accès via la méthode `get`.

**Cas où la clé existe**

In [65]:
# Cas 1
print(my_dict["key1"])

1


In [66]:
# Cas 2
print(my_dict.get("key1"))

1


**Cas où la clé n'existe pas**

In [68]:
# Cas 1
print(my_dict["key3"])

KeyError: 'key3'

In [69]:
# Cas 2
print(my_dict.get("key3"))

None


En réalité, la méthode `get` contient une valeur par défaut lorsque la clé n'existe pas. Cette valeur est `None`. Il est possible de mettre une valeur par défaut différente :

In [70]:
# Cas 3
print(my_dict.get("key3", -1))

-1


Notez que le cas 2 est équivalent à `my_dict.get("key3", None)`

Conseil : pour l'accès des valeurs d'un dictionnaire, préférer la méthode `get`

### Vérifier si une clé existe

A l'instar des listes, des tuples ou des chaînes de caractères, l'oipérateur `in` teste si une clé existe.

In [71]:
print("key3" in my_dict)

# Ou de façon équivalente
print("key3" in my_dict.keys())

False
False


### Modifier une valeur ou un clé/valeur

Les dictionnaires peuvent être modifiés après leur création, directement ou via la méthode `update`

In [72]:
my_dict["key3"] = "val_3"
print(my_dict)
print("key3" in my_dict)

{'key1': 1, 'key2': 'value_2', 'key3': 'val_3'}
True


In [73]:
# via la méthode update

# Ajouter un élément
new_elt = {"key5": 5}
my_dict.update(new_elt)
print(my_dict)

# Modifier un élément existant
my_dict.update({"key5": 50})
print(my_dict)

# Ajouter/Modifier plusieurs éléments
list_of_elements = [("key1", 10), ("key6", 6)]
my_dict.update(list_of_elements)
print(my_dict)

{'key1': 1, 'key2': 'value_2', 'key3': 'val_3', 'key5': 5}
{'key1': 1, 'key2': 'value_2', 'key3': 'val_3', 'key5': 50}
{'key1': 10, 'key2': 'value_2', 'key3': 'val_3', 'key5': 50, 'key6': 6}


### Fusionner deux dictionnaires

Jusqu'à python3.9, il n'existait pas de méthode pour fusionner deux dictionnaires (ou plus). La version 3.9 de python introduit la façon suivante

```python
dict_1 = {"key1": 1, "key2": 2}
dict_2 = {"key3": 3, "key4": 4}
new_dict = dict_1 | dict_2
```

In [74]:
# Fusionner deux dictionnaires, python<3.9
dict_1 = {"key1": 1, "key2": 2}
dict_2 = {"key3": 3, "key4": 4}
new_dict = {**dict_1, **dict_2}
new_dict

{'key1': 1, 'key2': 2, 'key3': 3, 'key4': 4}

### Boucler sur un dictionnaire


L'accès à l'ensemble des clés et valeurs se fait via les méthodes `keys`, `values` et `items`, comme suit :

```python
>>> my_dict.keys()
dict_keys(["nom", "age", "ville"])
>>> my_dict.values()
dict_values(["Alice", "30", "Paris"])
>>> my_dict.items()
dict_items([("nom", "Alice"), ("age", 30), ("ville", "Paris")])
```

Le résultat de l'appel de ces trois fonctions sont des objets itérables que l'on peut utiliser dans des boucles ou des structures conditionnelles.

In [75]:
# Pour boucler sur les clés :
for key in my_dict:
    value = my_dict[key]
    print(key, value)

key1 10
key2 value_2
key3 val_3
key5 50
key6 6


In [76]:
# ou de façon alternative
for key in my_dict.keys():
    value = my_dict[key]
    print(key, value)

key1 10
key2 value_2
key3 val_3
key5 50
key6 6


In [77]:
# Pour boucler sur les valeurs :
for value in my_dict.values():
    print(value)

10
value_2
val_3
50
6


In [78]:
# Pour boucler sur les clés et les valeurs :
for key, value in my_dict.items():
    print(key, value)

key1 10
key2 value_2
key3 val_3
key5 50
key6 6


Dans le dernier cas, étant donné que `my_dict.items()` s'apparente à une liste de tuples, la boucle for récupère les couples (clé, valeur) à chaque itération. On parle alors de concept de dépaquetage (ou `unpack` en anglais).

### Dictionnaire de compréhension

Les dictionnaires de compréhension existent nativement en Python. Le résultat est un dictionnaire.

In [79]:
print({item: item**2 for item in range(10)})
print({f"key_{item}": item**2 for item in range(10)})

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}
{'key_0': 0, 'key_1': 1, 'key_2': 4, 'key_3': 9, 'key_4': 16, 'key_5': 25, 'key_6': 36, 'key_7': 49, 'key_8': 64, 'key_9': 81}


### Conditionnelle avec des dictionnaires

In [80]:
my_dict = {"key1": 1, "key2": 2}
if my_dict != {}:
    print("Not empty")

if my_dict:
    print("Not empty")

Not empty
Not empty


In [81]:
my_dict = {}
if my_dict == {}:
    print("Empty")

if not my_dict:
    print("Empty")

Empty
Empty


## Ensembles

Un ensemble est une séquence mutable contenant **des éléments uniques et ordonnés** et est créé en utilisant des accolades :

```python
>>> mon_ensemble = {1, 2, 3, 4, 4, 5}  # cas 1
>>> mon_ensemble = set([1, 2, 3, 4, 4, 5])  # cas 2
>>> len(mon_ensemble)
5
```

Dans l'exemple, les doublons sont automatiquement supprimés et la taille est adaptée.
Pour éviter une ambiguité avec les dictionnaires, un ensemble vide est créé par `set()`.

Cette structure particulière est utile pour :
* éliminer les doublons d'une séquence telle qu'une liste

```python
>>> set([1, 2, 3, 4, 4, 5])
{1, 2, 3, 4, 5}
```

* effectuer des opérations mathématiques : unions, intersections, etc.
* tester l'appartenance d'un élément à une séquence

En tant qu'objet itérable, les structures de contrôles (boucles, conditions) s'utilisent de la même manière que pour les listes ou les tuples.
D'autre part, bien qu'un ensemble soit muable, les éléments qui le composent doivent doivent être obligatoirement immuables (int, float, str, tuples, etc.).

Principales fonctionnalités :
* Tests d'appartenance d'un élément à une séquence
* Suppression de doublons
* Opérations mathématiques : unions, intersections, etc.

Quelques méthodes associées :
* difference
* intersection
* pop
* isdisjoint
* issubset
* union

In [82]:
print(set())
print({1, 2, 2, 3, 3, 3, 4, 4, 4})

set()
{1, 2, 3, 4}


### Eliminer les doublons d'un objet itérable

Un des intérêts de l'utilisation des ensembles est l'élimination des doublons d'un objet itérable, tel qu'une liste

In [83]:
my_dict = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
print(set(my_dict))

{1, 2, 3, 4}


## Précision sur le concept de mutabilité

Comme évoqué plus haut, la mutabilité se rapporte à la capacité de modification d'un objet après sa création et il est important d'en comprendre les mécanisme lors de la manipulation de ceux-ci.

Les types d'objets mutables sont
* list
* dict
* set

Les types d'objets non mutables sont
* int, float, bool
* str
* tuple
* byte

**Fonction id et opérateur is**

En Python, la fonction `id` et l'opérateur `is` permettent de comprendre comment les objets sont stockés.

La fonction `id` qui renvoie l'"identité" d'un objet : un nombre entier garanti unique et constant pour cet objet durant sa durée de vie. Ce nombre est l'adresse mémoire de objet au sens de l'interpréteur Python (CPython pour être précis).

In [84]:
a = 1
id(a)

129525120701232

L'opérateur `is` renvoie vrai si l'identité de deux objets est égale. Les deux exemples ci-dessous illustrent l'utilisation de cet opérateur

Exemple 1 : `a` et `b` sont deux objets avec deux valeurs distinctes stockées dans deux espaces mémoires différents.

In [85]:
a = 1
b = 2
print(a is a)
print(b is a)

True
False


Exemple 2 : `a` et `b` sont deux objets avec la même valeur. Que se passe-t-il ?

In [86]:
a = 1
b = 1
print(b is a)

True


On a l'impression qu'en définissant distinctement les variables `a` et `b`, Python stocke les valeurs dans deux espaces mémoire différents. Ce n'est pas le cas : les variables `a` et `b` sont des **références** à un seul espace mémoire dans lequel est stocké la valeur 1. Autrement dit, rien ne sert à stocker plusieurs fois la même valeur en mémoire si l'on peut simplement en faire référence.

**Objets mutables et immutables**

Les objets immutables sont des objets dont la valeur ne peut pas être modifié après leur création. Autrement dit, l'espace mémoire dans lequel est stocké la valeur de l'objet ne sera pas modifié. Cela implique que si l'on souhaite modifier un objet immutable, un nouvel objet est créé avec sa valeur stockée dans un nouvel espace mémoire (ou un espace déjà référencé).

Les types concernés sont :
* int
* float
* str
* tuple

Exemple 1 : modification d'un type numérique

In [87]:
a = 1
print(id(a))
a += 1 # équivalent à a = a + 1
print(id(a))

129525120701232
129525120701264


En modifiant la valeur de `a`, on stocke la nouvelle valeur dans un autre espace mémoire.

Exemple 2 : modification d'un type numérique

In [88]:
a = 1
b = 2
c = 3

print(id(a))
print(id(b))
print(id(c))

a += 1
print(id(a))

a += 1
print(id(a))

129525120701232
129525120701264
129525120701296
129525120701264
129525120701296


Dans ce cas, la première modification de `a` change la référence vers l'espace mémoire dans lequel est stockée la valeur de `b`. Et quand on modifie une seconde fois la variable `a`, on modifie à nouveau la référence vers l'espace occupé par `c`.

Exemple 3 :

In [89]:
a = 1
b = a
b is a

True

Les variables `a` et `b` font référence au même espace mémoire. Supposons maintenant que `b` est incrémenté :

In [90]:
b += 1 # équivalent à b = b + 1
b is a

False

La variable `b` n'est plus une copie de l'objet `a` qui reste inchangé.

En bref, lorsque vous effectuez des opérations de modification sur un objet immuable, Python crée un nouvel objet plutôt que de modifier l'objet d'origine. Dans le cas des types `int`, `float` ou `str`, une copie implicite est faite.

En revanche, dans le cas des tuples, la modification est impossible sans créer explicitement un nouvel objet. Par exemple :

In [93]:
tu = (1, 2, 3)
tu[0] += 1 # on incrémente le premier élément

TypeError: 'tuple' object does not support item assignment

On peut procéder par exemple en utilisant une liste de compréhension :

In [94]:
tmp_list = list(tu)
tmp_list[0] += 1
new_tuple = tuple(tmp_list)

Inversement, les objets mutables sont des objets dont la valeur peut être modifiée après leur création. C'est le cas pour les listes, les ensembles et les dictionnaires. A la différence des objets immutable, lorsque vous modifiez un objet mutable, vous travaillez sur le même objet en mémoire. Autrement dit, vous modifiez la valeur stockée sans changer l'espace mémoire.

Exemple 1 : modification d'un élément d'une liste

In [95]:
my_list = [1, 2, 3]
print(id(my_list))

my_list[0] += 1 # on incrémente le premier élément

print(my_list)
print(id(my_list))

129524762624320
[2, 2, 3]
129524762624320


Exemple 2 : modification d'un élément d'une liste et égalité entre deux listes

In [96]:
my_list = [1, 2, 3]
my_list_2 = my_list
print(my_list is my_list_2)

my_list[0] += 1 # on incrémente le premier élément
print(my_list is my_list_2)

True
True






**Conséquences de la mutabilité**

La mutabilité a des implications importantes pour la gestion des données et la prévention des erreurs. Voici quelques points clés :

- **Modification d'objets mutables :** lorsque vous modifiez un objet mutable, toutes les références à cet objet dans votre code seront affectées. De plus, lorsque vous affectez un objet à une nouvelle variable, Python crée une copie de la référence à cet objet. Cela signifie que si vous affectez un objet mutable à une nouvelle variable, les modifications sur cette variable se répercuteront sur l'objet d'origine, car il s'agit de la même référence. Pour éviter cela, vous devez créer explicitement une copie de l'objet (par exemple, avec la méthode `copy()` pour les listes).

- **Objets immutables :** les objets immutables sont plus prévisibles car ils ne changent pas. Cela les rend adaptés pour représenter des valeurs constantes et des identifiants uniques. En revanche, certains types d'objets mutables effectuent une copie implicite lorsque l'on essaie d'en modifier leur valeur. Les objets immutables sont également utiles pour garantir l'intégrité des données dans certaines situations.


## Fonctions

Lorsqu'une tâche doit être réalisée plusieurs fois par un programme avec seulement des paramètres différents, on peut l’isoler au sein d’une fonction.

In [97]:
# Exemple de fonction
def fct(a, b, c):
    d = (a + b) * c
    return d

Dans cette fonction `a`, `b` et `c` sont les arguments, `d` est une variable locale et sa valeurs est retournée par la fonction.

Les arguments peuvnt être soit **nommés**, soit **positionnels**, soit **les deux** (par défaut en python)

De ce fait, l'appel de la fonction peut se faire :
1. par position : on place les valeurs des arguments suivant leur ordre dans la définition de la fonction
2. par nommage : on spécifie le nom de l'argument et la valeur en même temps

Notez que les types des arguments ne sont pas spécifiés dans la définition de la fonction. C'est dû au typage de python : si les opérations ont du sens quelques soit les types utilisés, alors pas de problème.

In [98]:
# Appel par position
print(fct(1, 2, 3))

9


In [99]:
# Appel par position, types différents
print(fct("py", "thon", 2))

pythonpython


In [101]:
# Appel par position, types différents
print(fct("py", 2, "thon"))

TypeError: can only concatenate str (not "int") to str

Les arguments peuvent avoir des valeurs par défaut, comme suit :

In [102]:
def fct(a="py", b="thon", c=2):
    d = (a + b) * c
    return d

Dans ce cas, si l'on ne spécifie pas de valeurs pour ces arguments, c'est la valeur par défaut qui sera utilisée.

In [103]:
print(fct())
print(fct(b=1, c=2, a=3))

pythonpython
8


### Mutabilité des objets dans les fonctions

Attention à l'utilisation d'objets de types mutable en argument des fonctions. En effet, si une fonction tente de modifier la valeurs d'un arguments, le comportement ne sera pas le même si l'objet est mutable ou non.

In [104]:
# Cas 1 : l'argument est de type non mutable
def cast(integer):
    integer = str(integer)
    print("Dans la fonction :", integer)

a = 1
print("Avant la fonction :", a, type(a))
cast(a)
print("Après la fonction :", a, type(a))

Avant la fonction : 1 <class 'int'>
Dans la fonction : 1
Après la fonction : 1 <class 'int'>


In [105]:
# Cas 2 : l'argument est de type mutable et la fonction en modifie le contenu
def cast_list(l, idx):
    l[idx] = str(l[idx])
    print("Dans la fonction :", l)

l = [1, 2]
print("Avant la fonction :", l)
cast_list(l, 0)
print("Après la fonction :", l)

Avant la fonction : [1, 2]
Dans la fonction : ['1', 2]
Après la fonction : ['1', 2]


In [106]:
# Cas 3 : faire une copie explicite de l'objet passé en argument pour ne pas le modifier
def cast_list(l, idx):
    l = l.copy()
    l[idx] = str(l[idx])
    print("Dans la fonction :", l)

l = [1, 2]
print("Avant la fonction :", l)
cast_list(l, 0)
print("Après la fonction :", l)

Avant la fonction : [1, 2]
Dans la fonction : ['1', 2]
Après la fonction : [1, 2]
