Apprendre Haskell vous fera le plus grand bien !

VII. Modules▲

VII-A. Charger des modules▲

Un module Haskell est une collection de fonctions, types et classes de types en rapport les uns avec les autres. Un programme Haskell est une collection de modules où le module principal charge les autres modules et utilise les fonctions qu'ils définissent. Séparer son code dans plusieurs modules a plusieurs avantages. Si un module est assez générique, les fonctions qu'il exporte peuvent être utilisées dans une multitude de programmes. Si votre propre code est séparé dans des modules assez indépendants (on dit qu'ils ont un couplage faible), vous pourrez les réutiliser plus tard. Cela rend la programmation plus facile à gérer en séparant des entités avec des buts précis.

La bibliothèque standard Haskell est découpée en modules, chacun d'eux contenant des fonctions et des types qui sont reliés et servent un but partagé. Il y a un module de manipulation de listes, un module de programmation concurrente, un module pour les nombres complexes, etc. Tous les fonctions, types et classes de types que nous avons utilisés jusqu'à présent faisaient partie du module Prelude, qui est importé par défaut. Dans ce chapitre, on va explorer quelques modules utiles et les fonctions qu'ils contiennent. Mais d'abord, voyons comment importer un module.

La syntaxe d'import de modules dans un script Haskell est import <module name>. Cela doit être fait avant de définir des fonctions, donc généralement, les imports sont faits en début de fichier. Un script peut bien sûr importer plusieurs modules. Écrivez simplement une ligne d'import par module. Importons le module Data.List, qui a un paquet de fonctions utiles pour travailler sur des listes et utilisons une des fonctions que le module exporte afin de savoir combien d'éléments uniques une liste comporte.

Sélectionnez

1.
2.
3.
4.

import Data.List

numUniques :: (Eq a) => [a] -> Int
numUniques = length . nub

Quand vous écrivez import Data.List, toutes les fonctions que Data.List exporte deviennent disponibles dans votre espace de nommage global, donc vous pouvez les appeler de n'importe où dans le script. nub est une fonction définie dans Data.List qui prend une liste et supprime les éléments en double. Composer length et nub en faisant length . nub produit une fonction équivalente à \xs -> length (nub xs).

Vous pouvez aussi importer des fonctions d'un module dans l'espace de nommage global de GHCi. Si vous êtes dans GHCi et que vous désirez appeler des fonctions exportées par Data.List, faites :

Sélectionnez

ghci> :m + Data.List

Pour charger plusieurs modules, pas besoin de taper :m + plusieurs fois, vous pouvez en charger plusieurs à la fois.

Sélectionnez

ghci> :m + Data.List Data.Map Data.Set

Cependant, en chargeant un script qui importe des modules, vous n'avez même pas besoin d'utiliser :m + pour accéder à ces modules.

Si vous n'avez besoin que de quelques fonctions d'un module, vous pouvez importer sélectivement juste ces fonctions. Si nous ne voulions que nub et sort de Data.List, on ferait :

Sélectionnez

import Data.List (nub, sort)

Vous pouvez aussi choisir d'importer toutes les fonctions d'un module, sauf certaines. C'est souvent utile quand plusieurs modules exportent des fonctions qui ont le même nom et que vous voulez vous débarrasser de celles qui ne vous concernent pas. Mettons qu'on ait défini une fonction nub et qu'on veuille importer toutes les fonctions de Data.List à part nub :

Sélectionnez

import Data.List hiding (nub)

Un autre moyen de gérer les collisions de noms est d'utiliser les imports qualifiés. Le module Data.Map, qui offre une structure de données pour trouver des valeurs grâce à une clé, exporte un paquet de fonctions qui ont les mêmes noms que celles du Prelude, comme filter ou null. Donc, quand on importe Data.Map et qu'on appelle filter, Haskell ne sait pas de laquelle on parle. Voici comment on résout cela :

Sélectionnez

import qualified Data.Map

Cela nous force à écrire Data.Map.filter pour désigner la fonction filter de Data.Map, alors que filter tout court correspond à la fonction du Prelude qu'on connaît et qu'on aime tous. Mais écrire Data.Map devant chaque fonction du module est un peu fastidieux. C'est pourquoi on peut renommer les imports qualifiés :

Sélectionnez

import qualified Data.Map as M

Maintenant, pour parler de la fonction filter de Data.Map, on peut utiliser M.filter.

Utilisez cette référence très pratique pour savoir quels modules font partie de la bibliothèque standard. Un bon moyen d'apprendre des choses sur Haskell est de se balader dans cette référence et d'explorer des modules et leurs fonctions. Pour chaque module, le code source Haskell est disponible. Lire le code source de certains modules est un très bon moyen d'apprendre Haskell et de se faire une idée solide de ce dont il s'agit.

Pour trouver des fonctions et savoir dans quel module elles résident, utilisez Hoogle. C'est un moteur de recherche pour Haskell génial, vous pouvez chercher quelque chose par son nom, par le nom de son module ou même par son type !

VII-B. Data.List▲

Le module Data.List s'occupe des listes, évidemment. Il contient des fonctions très pratiques. Nous en avons déjà croisé quelques-unes (comme map et filter) parce que le module Prelude exporte quelques fonctions de Data.List par commodité. Vous n'avez pas besoin d'importer Data.List de manière qualifiée, il n'a de collision avec aucun nom du Prelude, à part évidemment les fonctions que le Prelude lui avait empruntées. Intéressons-nous à d'autres fonctions que nous n'avions pas encore vues.

intersperse prend un élément et une liste et place cet élément entre chaque paire d'éléments de la liste. Démonstration :

Sélectionnez

1.
2.
3.
4.

ghci> intersperse '.' "MONKEY"
"M.O.N.K.E.Y"
ghci> intersperse 0 [1,2,3,4,5,6]
[1,0,2,0,3,0,4,0,5,0,6]

intercalate prend une liste de listes et une liste. Elle insère cette dernière entre toutes les listes de la première et aplatit le résultat.

Sélectionnez

1.
2.
3.
4.

ghci> intercalate " " ["hey","there","guys"]
"hey there guys"
ghci> intercalate [0,0,0] [[1,2,3],[4,5,6],[7,8,9]]
[1,2,3,0,0,0,4,5,6,0,0,0,7,8,9]

transpose transpose une liste de listes. Si vous pensez à une liste de listes comme à une matrice bidimensionnelle, les colonnes deviennent des lignes et vice versa.

Sélectionnez

1.
2.
3.
4.

ghci> transpose [[1,2,3],[4,5,6],[7,8,9]]
[[1,4,7],[2,5,8],[3,6,9]]
ghci> transpose ["hey","there","guys"]
["htg","ehu","yey","rs","e"]

Mettons qu'on ait les polynômes 3x² + 5x + 9, 10x³ + 9 et 8x³ + 5x² + x - 1 et que l'on souhaite les additionner. On peut utiliser les listes [0, 3, 5, 9], [10, 0, 0, 9] et [8, 5, 1, -1] pour les représenter en Haskell. Maintenant, pour les sommer, il suffit de faire :

Sélectionnez

ghci> map sum $ transpose [[0,3,5,9],[10,0,0,9],[8,5,1,-1]]
[18,8,6,17]

Lorsqu'on transpose ces trois listes, les coefficients de degré 3 se retrouvent sur la première ligne, les coefficients de degré 2 sur la deuxième et ainsi de suite. Mapper sum sur cette liste produit le résultat désiré.

foldl' et foldl1' sont des versions strictes de leur équivalent paresseux. Si vous faites des plis paresseux sur des listes très grandes, vous pouvez souvent avoir des erreurs de débordement de pile. Le coupable est la nature paresseuse des plis, la valeur de l'accumulateur n'étant pas réellement mise à jour pendant la phase de pli. Ce qui se passe en réalité, c'est que l'accumulateur fait en quelque sorte la promesse qu'il se rappellera comment calculer sa valeur quand on la lui demandera (NDT : pour cela, ce qu'on appelle un glaçon, traduction de thunk, est créé). Cela a lieu pour chaque accumulateur intermédiaire, et tous les glaçons sont empilés sur votre pile et finissent par la faire déborder. Les plis stricts ne sont pas de vils paresseux et calculent les valeurs intermédiaires en route au lieu de remplir votre pile de glaçons. Donc, si jamais vous rencontrez des problèmes de débordement de pile en faisant des plis paresseux, essayez d'utiliser plutôt les versions strictes.

concat aplatit une liste de listes en une liste simple.

Sélectionnez

1.
2.
3.
4.

ghci> concat ["foo","bar","car"]
"foobarcar"
ghci> concat [[3,4,5],[2,3,4],[2,1,1]]
[3,4,5,2,3,4,2,1,1]

Elle enlèvera seulement un niveau d'imbrication. Si vous voulez complètement aplatir la liste [[[2,3],[3,4,5],[2]],[[2,3],[3,4]]], qui est une liste de listes de listes, vous devrez la concaténer deux fois.

concatMap équivaut à d'abord mapper une fonction, puis concaténer la liste à l'aide de concat.

Sélectionnez

ghci> concatMap (replicate 4) [1..3]
[1,1,1,1,2,2,2,2,3,3,3,3]

and prend une liste de valeurs booléennes et retourne True seulement si toutes les valeurs de la liste sont True.

Sélectionnez

1.
2.
3.
4.

ghci> and $ map (>4) [5,6,7,8]
True
ghci> and $ map (==4) [4,4,4,3,4]
False

or est comme and, mais retourne True si n'importe laquelle des valeurs booléennes est True.

Sélectionnez

1.
2.
3.
4.

ghci> or $ map (==4) [2,3,4,5,6,1]
True
ghci> or $ map (>4) [1,2,3]
False

any et all prennent un prédicat et vérifient respectivement si l'un ou tous les éléments d'une liste satisfont ce prédicat. On les utilise généralement en lieu et place d'un mappage du prédicat sur la liste suivi de and ou or.

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.

ghci> any (==4) [2,3,5,6,1,4]
True
ghci> all (>4) [6,9,10]
True
ghci> all (`elem` ['A'..'Z']) "HEYGUYSwhatsup"
False
ghci> any (`elem` ['A'..'Z']) "HEYGUYSwhatsup"
True

iterate prend une fonction et une valeur initiale. Elle applique la fonction à la valeur, puis applique la fonction au résultat, puis applique la fonction au résultat à nouveau, etc. Elle retourne tous ces résultats sous la forme d'une liste infinie.

Sélectionnez

1.
2.
3.
4.

ghci> take 10 $ iterate (*2) 1
[1,2,4,8,16,32,64,128,256,512]
ghci> take 3 $ iterate (++ "haha") "haha"
["haha","hahahaha","hahahahahaha"]

splitAt prend un nombre et une liste. Ensuite, elle coupe la liste au nombre d'éléments spécifié, retournant chaque bout dans une paire.

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.

ghci> splitAt 3 "heyman"
("hey","man")
ghci> splitAt 100 "heyman"
("heyman","")
ghci> splitAt (-3) "heyman"
("","heyman")
ghci> let (a,b) = splitAt 3 "foobar" in b ++ a
"barfoo"

takeWhile est très utile. Elle prend des éléments de la liste tant que le prédicat est satisfait et s'arrête dès qu'un élément l'invalide. C'est très utile.

Sélectionnez

1.
2.
3.
4.

ghci> takeWhile (>3) [6,5,4,3,2,1,2,3,4,5,4,3,2,1]
[6,5,4]
ghci> takeWhile (/=' ') "This is a sentence"
"This"

Si l'on cherchait la somme de toutes les puissances de 3 inférieures à 10 000, on ne pourrait pas mapper (^3) à [1..], puis appliquer un filtre et sommer le résultat, parce que filter ne termine pas sur des listes infinies. Vous savez peut-être que les éléments sont croissants, mais Haskell ne le sait pas. Vous pouvez donc faire ça :

Sélectionnez

ghci> sum $ takeWhile (<10000) $ map (^3) [1..]
53361

On applique (^3) à une liste infinie et on coupe dès que ça dépasse 10 000. Il ne reste plus qu'à sommer aisément.

dropWhile est similaire, mais elle jette les éléments tant que le prédicat est vrai. Une fois que le prédicat est invalidé, elle retourne ce qui reste de la liste. Fonction très utile et adorable !

Sélectionnez

1.
2.
3.
4.

ghci> dropWhile (/=' ') "This is a sentence"
" is a sentence"
ghci> dropWhile (<3) [1,2,2,2,3,4,5,4,3,2,1]
[3,4,5,4,3,2,1]

Imaginons qu'on ait une liste des valeurs d'un stock par date. La liste est composée de tuples dont la première composante est la valeur du stock, la deuxième est l'année, la troisième le mois, la quatrième le jour. On désire savoir quand la valeur du stock a dépassé 1000 $ pour la première fois !

Sélectionnez

1.
2.
3.

ghci> let stock = [(994.4,2008,9,1),(995.2,2008,9,2),(999.2,2008,9,3),(1001.4,2008,9,4),(998.3,2008,9,5)]
ghci> head (dropWhile (\(val,y,m,d) -> val < 1000) stock)
    (1001.4,2008,9,4)

span est un peu comme takeWhile, mais retourne une paire de listes. La première liste contient tout ce que contiendrait la liste retournée par takeWhile appelée avec le même prédicat et la même liste. La seconde liste correspond à ce qui aurait été laissé.

Sélectionnez

ghci> let (fw, rest) = span (/=' ') "This is a sentence" in "First word:" ++ fw ++ ", the rest:" ++ rest
"First word: This, the rest: is a sentence"

Alors que span s'étend sur la liste tant que le prédicat est vrai, break la coupe dès qu'il devient vrai. Ainsi, break p est équivalent à span (not . p).

Sélectionnez

1.
2.
3.
4.

ghci> break (==4) [1,2,3,4,5,6,7]
([1,2,3],[4,5,6,7])
ghci> span (/=4) [1,2,3,4,5,6,7]
([1,2,3],[4,5,6,7])

Dans le tuple retourné par break, la seconde liste débute avec le premier élément ayant satisfait le prédicat.

sort trie une liste. Le type des éléments de la liste doit être membre de la classe de types Ord, parce que si l'on ne peut pas ordonner les éléments, eh bien on ne peut pas les trier.

Sélectionnez

1.
2.
3.
4.

ghci> sort [8,5,3,2,1,6,4,2]
[1,2,2,3,4,5,6,8]
ghci> sort "This will be sorted soon"
"    Tbdeehiillnooorssstw"

group prend une liste et groupe les éléments adjacents en sous-listes s'ils sont égaux.

Sélectionnez

ghci> group [1,1,1,1,2,2,2,2,3,3,2,2,2,5,6,7]
[[1,1,1,1],[2,2,2,2],[3,3],[2,2,2],[5],[6],[7]]

Si l'on trie une liste avant de grouper ses éléments, on peut savoir combien de fois chaque élément apparaît dans la liste.

Sélectionnez

ghci> map (\l@(x:xs) -> (x,length l)) . group . sort $ [1,1,1,1,2,2,2,2,3,3,2,2,2,5,6,7]
[(1,4),(2,7),(3,2),(5,1),(6,1),(7,1)]

inits et tails sont comme init et tail, sauf qu'elles appliquent ces fonctions récursivement à une liste jusqu'à ce qu'il ne reste plus rien. Observez :

Sélectionnez

1.
2.
3.
4.
5.
6.

ghci> inits "w00t"
["","w","w0","w00","w00t"]
ghci> tails "w00t"
["w00t","00t","0t","t",""]
ghci> let w = "w00t" in zip (inits w) (tails w)
[("","w00t"),("w","00t"),("w0","0t"),("w00","t"),("w00t","")]

Utilisons un pli pour implémenter la recherche d'une liste dans une sous-liste.

Sélectionnez

1.
2.
3.
4.

search :: (Eq a) => [a] -> [a] -> Bool
search needle haystack =
    let nlen = length needle
    in  foldl (\acc x -> if take nlen x == needle then True else acc) False (tails haystack)

D'abord, on appelle tails avec la liste qu'on cherche. Puis on parcourt chaque queue retournée pour voir si elle commence par ce qu'on cherche.

On vient de faire une fonction qui se comporte comme isInfixOf. isInfixOf cherche une sous-liste dans une liste et retourne True si la sous-liste qu'on cherche apparaît quelque part dans la liste cible.

Sélectionnez

1.
2.
3.
4.
5.
6.

ghci> "cat" `isInfixOf` "im a cat burglar"
True
ghci> "Cat" `isInfixOf` "im a cat burglar"
False
ghci> "cats" `isInfixOf` "im a cat burglar"
False

isPrefixOf et isSuffixOf cherchent une sous-liste respectivement au début et à la fin d'une liste.

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.

ghci> "hey" `isPrefixOf` "hey there!"
True
ghci> "hey" `isPrefixOf` "oh hey there!"
False
ghci> "there!" `isSuffixOf` "oh hey there!"
True
ghci> "there!" `isSuffixOf` "oh hey there"
False

elem et notElem cherchent si un élément appartient ou n'appartient pas à une liste.

partition prend une liste et un prédicat, et retourne une paire de listes. La première liste contient tous les éléments qui satisfont le prédicat, la seconde tous les autres.

Sélectionnez

1.
2.
3.
4.

ghci> partition (`elem` ['A'..'Z']) "BOBsidneyMORGANeddy"
("BOBMORGAN","sidneyeddy")
ghci> partition (>3) [1,3,5,6,3,2,1,0,3,7]
([5,6,7],[1,3,3,2,1,0,3])

Il est important de saisir la différence avec span et break :

Sélectionnez

ghci> span (`elem` ['A'..'Z']) "BOBsidneyMORGANeddy"
("BOB","sidneyMORGANeddy")

Alors que span et break s'arrêtent dès qu'ils rencontrent le premier élément qui ne satisfait pas ou qui satisfait le prédicat, partition traverse toute la liste et la découpe conformément au prédicat.

find prend une liste et un prédicat et retourne le premier élément de la liste satisfaisant le prédicat. Mais il retourne ce prédicat encapsulé dans une valeur de type Maybe. Nous couvrirons les types de données algébriques plus en profondeur dans le prochain chapitre, mais pour l'instant, voilà ce que vous avez besoin de savoir : une valeur Maybe peut soit être Just something, soit Nothing. Tout comme une liste peut être soit la liste vide, soit une liste avec des éléments, une valeur Maybe peut contenir soit aucun, soit un élément. Et comme le type d'une liste d'entiers est par exemple [Int], le type d'un éventuel entier est Maybe Int. Bon, faisons un tour de find :

Sélectionnez

1.
2.
3.
4.
5.
6.

ghci> find (>4) [1,2,3,4,5,6]
Just 5
ghci> find (>9) [1,2,3,4,5,6]
Nothing
ghci> :t find
find :: (a -> Bool) -> [a] -> Maybe a

Prêtez attention au type de find. Elle retourne un Maybe a. C'est un peu comme s'il y avait un [a], seulement qu'une valeur de type Maybe ne peut contenir qu'un ou zéro élément, alors qu'une liste peut en contenir zéro, un ou plus.

Vous vous souvenez quand nous cherchions la première fois que notre stock dépassait 1000 $ ? On avait fait head (dropWhile (\(val,y,m,d) -> val < 1000) stock). Rappelez-vous que head n'est pas sûre. Que se serait-il passé si le stock n'avait jamais dépassé 1000 $ ? Notre application de dropWhile aurait retourné la liste vide, et essayer de prendre sa tête aurait été une erreur. Cependant, si l'on réécrivait cela find (\(val,y,m,d) -> val > 1000) stock, on serait beaucoup plus tranquille. Si notre stock ne dépassait jamais 1000 $ (donc, aucun élément ne satisfait le prédicat), on récupérerait Nothing. Mais s'il y avait une réponse correcte dans la liste, on récupérerait, mettons, Just (1001.4, 2008, 9, 4).

elemIndex est un peu comme elem, mais ne retourne pas une valeur booléenne. Elle retourne éventuellement l'indice de l'élément qu'on cherche. Si cet élément n'est pas dans la liste, elle retourne Nothing.

Sélectionnez

1.
2.
3.
4.
5.
6.

ghci> :t elemIndex
elemIndex :: (Eq a) => a -> [a] -> Maybe Int
ghci> 4 `elemIndex` [1,2,3,4,5,6]
Just 3
ghci> 10 `elemIndex` [1,2,3,4,5,6]
Nothing

elemIndices est comme elemIndex, seulement qu'elle retourne une liste d'indices dans le cas où l'élément que l'on cherche apparaîtrait plusieurs fois dans la liste. Puisqu'on utilise des listes pour représenter les indices, on n'a pas besoin d'un type Maybe, il suffit de représenter un échec comme une liste vide, qui sera donc très synonyme de Nothing.

Sélectionnez

ghci> ' ' `elemIndices` "Where are the spaces?"
[5,9,13]

findIndex est comme find, mais retourne éventuellement l'indice du premier élément qui satisfait le prédicat. findIndices retourne les indices de tous les éléments qui satisfont le prédicat sous forme d'une liste.

Sélectionnez

1.
2.
3.
4.
5.
6.

ghci> findIndex (==4) [5,3,2,1,6,4]
Just 5
ghci> findIndex (==7) [5,3,2,1,6,4]
Nothing
ghci> findIndices (`elem` ['A'..'Z']) "Where Are The Caps?"
[0,6,10,14]

Nous avons déjà couvert zip et zipWith. Nous avions vu qu'elles zippent ensemble deux listes, soit sous la forme d'un tuple, soit en appliquant une fonction binaire (c'est-à-dire qui prend deux paramètres). Mais comment zipper ensemble trois listes ? Ou zipper trois listes à l'aide d'une fonction qui attend trois paramètres ? Pour cela, il existe zip3, zip4, etc. et zipWith3, zipWith4, etc. Ces variantes existent jusqu'à 7. Bien que ça ait l'air un peu arbitraire et ad hoc, ça s'avère plutôt suffisant, car vous ne voudrez sûrement jamais zipper ensemble 8 listes. Il existe un moyen astucieux de zipper ensemble une infinité de listes, mais nous ne sommes pas assez avancé pour couvrir ça maintenant.

Sélectionnez

1.
2.
3.
4.

ghci> zipWith3 (\x y z -> x + y + z) [1,2,3] [4,5,2,2] [2,2,3]
[7,9,8]
ghci> zip4 [2,3,3] [2,2,2] [5,5,3] [2,2,2]
[(2,2,5,2),(3,2,5,2),(3,2,3,2)]

Comme un zip normal, des listes plus longues que la plus courte des listes zippées seront coupées.

lines est une fonction très utile pour traiter des fichiers ou une entrée. Elle prend une chaîne de caractères et retourne une liste des différentes lignes.

Sélectionnez

ghci> lines "first line\nsecond line\nthird line"
["first line","second line","third line"]

'\n' est le caractère UNIX pour aller à la ligne. L'antislash a une signification spéciale dans les caractères et les chaînes de caractères.

unlines est la fonction réciproque de lines. Elle prend une liste de chaînes de caractères et les joint ensemble avec des '\n'.

Sélectionnez

ghci> unlines ["first line", "second line", "third line"]
"first line\nsecond line\nthird line\n"

words et unwords servent à séparer une ligne de texte en plusieurs mots ou à joindre une liste de mots en un texte. Très pratique.

Sélectionnez

1.
2.
3.
4.
5.
6.

ghci> words "hey these are the words in this sentence"
["hey","these","are","the","words","in","this","sentence"]
ghci> words "hey these           are    the words in this\nsentence"
["hey","these","are","the","words","in","this","sentence"]
ghci> unwords ["hey","there","mate"]
"hey there mate"

Nous avons déjà mentionné nub. Elle prend une liste et retire les éléments en double, retournant une liste où chaque élément est aussi unique qu'un flocon de neige ! Le nom de la fonction est un peu bizarre. Il s'avère que « nub » désigne l'essence, le cœur de quelque chose. À mon avis, ils devraient plutôt utiliser des vrais noms pour les fonctions, pas des mots de vieilles personnes.

Sélectionnez

1.
2.
3.
4.

ghci> nub [1,2,3,4,3,2,1,2,3,4,3,2,1]
[1,2,3,4]
ghci> nub "Lots of words and stuff"
"Lots fwrdanu"

delete prend un élément, une liste et supprime la première occurrence de cet élément dans la liste.

Sélectionnez

1.
2.
3.
4.
5.
6.

ghci> delete 'h' "hey there ghang!"
"ey there ghang!"
ghci> delete 'h' . delete 'h' $ "hey there ghang!"
"ey tere ghang!"
ghci> delete 'h' . delete 'h' . delete 'h' $ "hey there ghang!"
"ey tere gang!"

\\ est la fonction de différence sur les listes. Elle se comporte comme la différence ensembliste. Pour chaque élément de la liste de droite, elle supprime un élément correspondant dans la liste de gauche.

Sélectionnez

1.
2.
3.
4.

ghci> [1..10] \\ [2,5,9]
[1,3,4,6,7,8,10]
ghci> "Im a big baby" \\ "big"
"Im a  baby"

Faire [1..10] \\ [2, 5, 9] est comme faire delete 2 . delete 5 . delete 9 $ [1..10].

union se comporte aussi comme une fonction sur les ensembles. Elle retourne l'union de deux listes. En gros, elle parcourt toute la liste de droite et ajoute les éléments en queue de celle de gauche s'ils n'y sont pas déjà. Attention, elle supprime les doublons dans la liste de droite !

Sélectionnez

1.
2.
3.
4.

ghci> "hey man" `union` "man what's up"
"hey manwt'sup"
ghci> [1..7] `union` [5..10]
[1,2,3,4,5,6,7,8,9,10]

intersect fonctionne comme l'intersection ensembliste. Elle ne retourne que les éléments apparaissant dans les deux listes.

Sélectionnez

ghci> [1..7] `intersect` [5..10]
[5,6,7]

insert prend un élément et une liste d'éléments qui peuvent être triés et insère l'élément à la dernière position où il reste inférieur au prochain élément. insert va parcourir la liste jusqu'à trouver un élément plus grand que celui passé en paramètre et va alors insérer ce dernier devant l'autre.

Sélectionnez

1.
2.
3.
4.

ghci> insert 4 [3,5,1,2,8,2]
[3,4,5,1,2,8,2]
ghci> insert 4 [1,3,4,4,1]
[1,3,4,4,4,1]

Le 4 est inséré juste après le 3 et juste avant le 5 dans le premier exemple et entre le 3 et le 4 dans le second.

Propriété intéressante : si l'on utilise insert pour insérer dans une liste triée, la liste reste triée.

Sélectionnez

1.
2.
3.
4.
5.
6.

ghci> insert 4 [1,2,3,5,6,7]
[1,2,3,4,5,6,7]
ghci> insert 'g' $ ['a'..'f'] ++ ['h'..'z']
"abcdefghijklmnopqrstuvwxyz"
ghci> insert 3 [1,2,4,3,2,1]
[1,2,3,4,3,2,1]

Ce que length, take, drop, splitAt, !! et replicate ont de commun, c'est qu'elles prennent ou retournent un Int, alors qu'elles pourraient être plus générales en utilisant plutôt un type appartenant aux classes Integral ou Num (en fonction de la fonction). Elles ne le font pas pour des raisons historiques. Réparer cela détruirait certainement beaucoup de code existant. C'est pourquoi Data.List contient les équivalents plus génériques, nommés genericLength, genericTake, genericDrop, genericSplitAt, genericIndex et genericReplicate. Par exemple, length a pour signature length :: [a] -> Int. Si l'on essaie de récupérer la moyenne d'une liste en faisant let xs = [1..6] in sum xs / length xs, on obtient une erreur de type, parce que / ne fonctionne pas sur les Int. genericLength, au contraire, a pour signature genericLength :: (Num a) => [b] -> a. Puisqu'un Num peut se faire passer pour un nombre à virgule flottante, trouver la moyenne en faisant let xs = [1..6] in sum xs / genericLength xs marchera.

Les fonctions nub, delete, union, intersect et group ont toute un équivalent plus général, respectivement nubBy, deleteBy, unionBy, intersectBy et groupBy. La différence entre les deux, c'est que les premières utilisent == pour tester l'égalité, alors que les versions en By prennent en paramètre une fonction utilisée pour tester l'égalité. group est donc équivalente à groupBy (==).

Par exemple, mettons qu'on a une liste qui décrit les valeurs d'une fonction à chaque seconde, et on voudrait la segmenter entre les valeurs positives et les valeurs négatives. Un group normal ne regrouperait que les valeurs adjacentes égales entre elles. On voudrait les grouper en fonction de leur signe. C'est là que groupBy entre en jeu ! La fonction d'égalité des fonctions en By doit prendre deux éléments de même type et retourne True si elle les considère égales selon ses propres critères.

Sélectionnez

1.
2.
3.

ghci> let values = [-4.3, -2.4, -1.2, 0.4, 2.3, 5.9, 10.5, 29.1, 5.3, -2.4, -14.5, 2.9, 2.3]
ghci> groupBy (\x y -> (x > 0) == (y > 0)) values
[[-4.3,-2.4,-1.2],[0.4,2.3,5.9,10.5,29.1,5.3],[-2.4,-14.5],[2.9,2.3]]

On voit ici clairement quelles sections sont positives et négatives. La fonction d'égalité fournie prend deux éléments et retourne True seulement s'ils sont tous les deux positifs ou tous les deux négatifs. Elle pourrait aussi être écrite \x y -> (x > 0) && (y > 0) || (x <= 0) && (y <= 0), bien que je trouve la première version plus lisible. Une manière encore plus claire d'écrire les fonctions d'égalité pour les fonctions en By consiste à importer on depuis Data.Function. on est définie ainsi :

Sélectionnez

on :: (b -> b -> c) -> (a -> b) -> a -> a -> c
f `on` g = \x y -> f (g x) (g y)

Ainsi, faire (==) `on` (> 0) retourne une fonction d'égalité qui ressemble à \x y -> (x > 0) == (y > 0). on est très utilisée avec les fonctions By parce qu'avec elle, on peut faire :

Sélectionnez

ghci> groupBy ((==) `on` (> 0)) values
[[-4.3,-2.4,-1.2],[0.4,2.3,5.9,10.5,29.1,5.3],[-2.4,-14.5],[2.9,2.3]]

Super lisible, non ? Vous pouvez le lire tout haut : groupe ceci par égalité sur le fait que les éléments soient plus grands que zéro.

De façon similaire, les fonctions sort, insert, maximum et minimum ont aussi un équivalent plus général. Les fonctions comme groupBy prenaient une fonction pour déterminer si deux éléments étaient égaux. sortBy, insertBy, maximumBy et minimumBy prennent une fonction pour déterminer si un élément est plus petit, plus grand ou égal à l'autre. La signature de sortBy est sortBy :: (a -> a -> Ordering) -> [a] -> [a]. Si vous vous souvenez bien, le type Ordering peut prendre pour valeurs LT, EQ ou GT. sort est équivalent à sortBy compare, car compare prend juste deux éléments dont le type est membre de la classe Ord et retourne leur relation d'ordre.

Les listes peuvent être comparées, mais lorsqu'elles le sont, elles sont comparées lexicographiquement. Et si l'on avait une liste de listes et que l'on souhaitait la trier non pas par rapport au contenu des listes internes, mais plutôt en fonction de leur longueur ? Vous l'avez peut-être déjà deviné, on utilisera la fonction sortBy.

Sélectionnez

1.
2.
3.

ghci> let xs = [[5,4,5,4,4],[1,2,3],[3,5,4,3],[],[2],[2,2]]
ghci> sortBy (compare `on` length) xs
[[],[2],[2,2],[1,2,3],[3,5,4,3],[5,4,5,4,4]]

Génial ! compare `on` length… man, on dirait presque de l'anglais naturel ! Si vous n'êtes pas certain de ce que fait on ici, compare `on` length est équivalent à y -> length x `compare` length y. Quand vous utilisez des fonctions en By qui attendent une fonction d'égalité, vous ferez souvent (==) `on` something, et quand vous utilisez des fonctions en By qui attendent une fonction de comparaison, vous ferez souvent compare `on` length.

VII-C. Data.Char▲

Le module Data.Char fait ce que son nom indique. Il exporte des fonctions qui agissent sur des caractères. Et qui servent aussi pour filtrer ou mapper sur des chaînes de caractères, puisque ce ne sont que des listes de caractères.

Data.Char exporte tout un tas de prédicats sur les caractères. C'est-à-dire, des fonctions qui prennent un caractère et nous indiquent s'il satisfait une condition. Les voici :

isControl vérifie si c'est un caractère de contrôle (NDT : caractères non affichables du sous-ensemble Latin-1 d'Unicode) ;

isSpace vérifie si c'est un caractère d'espacement. Cela inclut les espaces, les tabulations, les nouvelles lignes, etc. ;

isLower vérifie si le caractère est minuscule ;

isUpper vérifie si le caractère est majuscule ;

isAlpha vérifie si le caractère est une lettre ;

isAlphaNum vérifie si le caractère est une lettre ou un chiffre ;

isPrint vérifie si le caractère est affichable. Les caractères de contrôle, par exemple, ne le sont pas ;

isDigit vérifie si le caractère est un chiffre ;

isOctDigit vérifie si le caractère est un chiffre octal ;

isHexDigit vérifie si le caractère est un chiffre hexadécimal ;

isLetter vérifie si le caractère est une lettre ;

isMark vérifie les caractères Unicode de marque. Ce sont des caractères qui se combinent au précédent pour créer des caractères accentués. Utile pour nous Français ;

isNumber vérifie si un caractère est numérique ;

isPunctuation vérifie si le caractère est un caractère de ponctuation ;

isSymbol vérifie si le caractère est un symbole mathématique ou monétaire ;

isSeparator vérifie les espaces et séparateurs Unicode ;

isAscii vérifie si un caractère fait partie des 128 premiers caractères Unicode ;

isLatin1 vérifie si le code fait partie des 256 premiers caractères Unicode ;

isAsciiUpper vérifie si c'est un caractère ASCII majuscule ;

isAsciiLower vérifie si c'est un caractère ASCII minuscule.

Tous ces prédicats ont pour signature Char -> Bool. La plupart du temps, vous les utiliserez pour filtrer des chaînes de caractères. Par exemple, disons qu'on écrive un programme qui prend un nom d'utilisateur, et que ce nom doit être composé seulement de caractères alphanumériques. On peut utiliser la fonction all de Data.List en combinaison avec les prédicats de Data.Char pour vérifier la validité du nom de l'utilisateur.

Sélectionnez

1.
2.
3.
4.

ghci> all isAlphaNum "bobby283"
True
ghci> all isAlphaNum "eddy the fish!"
False

Cool ! Au cas où vous auriez oublié, all prend un prédicat et retourne True seulement si tous les éléments de la liste valident ce prédicat.

On peut aussi utiliser isSpace pour simuler la fonction words de Data.List.

Sélectionnez

1.
2.
3.
4.
5.

ghci> words "hey guys its me"
["hey","guys","its","me"]
ghci> groupBy ((==) `on` isSpace) "hey guys its me"
["hey"," ","guys"," ","its"," ","me"]
ghci>

Hmmm, ça marche à peu près comme words, mais il nous reste les éléments qui ne contiennent que des espaces. Que devrions-nous faire ? Je sais, filtrons ces importuns !

Sélectionnez

ghci> filter (not . any isSpace) . groupBy ((==) `on` isSpace) $ "hey guys its me"
["hey","guys","its","me"]

Ah !

Le module Data.Char exporte également un type de données similaire à Ordering. Ordering peut prendre pour valeur LT, EQ ou GT. C'est une sorte d'énumération. Cela décrit les éventualités du résultat d'une comparaison. Le type GeneralCategory est aussi une énumération. Il décrit les différentes catégories auxquelles un caractère peut appartenir. La fonction principale retournant la catégorie d'un caractère est generalCategory. Son type est generalCategory :: Char -> GeneralCategory. Il y a environ 31 catégories, donc on ne va pas les lister ici, mais jouons un peu avec la fonction.

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.

ghci> generalCategory ' '
Space
ghci> generalCategory 'A'
UppercaseLetter
ghci> generalCategory 'a'
LowercaseLetter
ghci> generalCategory '.'
OtherPunctuation
ghci> generalCategory '9'
DecimalNumber
ghci> map generalCategory " \t\nA9?|"
[Space,Control,Control,UppercaseLetter,DecimalNumber,OtherPunctuation,MathSymbol]

Puisque le type GeneralCategory est membre de la classe Eq, on peut aussi écrire des choses comme generalCategory c == Space.

toUpper convertit un caractère minuscule en majuscule. Les espaces, nombres et autres restent inchangés.

toLower convertit un caractère majuscule en minuscule.

toTitle convertit un caractère en casse de titre. Pour la plupart des caractères, la casse de titre est majuscule.

digitToInt convertit un caractère en un Int. Pour réussir, le caractère doit être dans les intervalles '0'..'9', 'a'..'f' ou 'A'..'F'.

Sélectionnez

1.
2.
3.
4.

ghci> map digitToInt "34538"
[3,4,5,3,8]
ghci> map digitToInt "FF85AB"
[15,15,8,5,10,11]

intToDigit est la fonction inverse de digitToInt. Elle prend un Int compris dans 0..15 et le convertit en caractère minuscule.

Sélectionnez

1.
2.
3.
4.

ghci> intToDigit 15
'f'
ghci> intToDigit 5
'5'

Les fonctions ord et chr convertissent un caractère vers sa valeur numérique et vice versa.

Sélectionnez

1.
2.
3.
4.
5.
6.

ghci> ord 'a'
97
ghci> chr 97
'a'
ghci> map ord "abcdefgh"
[97,98,99,100,101,102,103,104]

La différence entre les valeurs ord de deux caractères correspond à leur espacement dans la table Unicode.

Le chiffre de César est une méthode primitive d'encodage de messages à base de décalage de chaque caractère d'un nombre fixé de positions, par rapport à l'alphabet. On peut facilement créer un chiffre de César nous-même, sans se restreindre à l'alphabet.

Sélectionnez

1.
2.
3.
4.
5.

encode :: Int -> String -> String
encode shift msg =
    let ords = map ord msg
        shifted = map (+ shift) ords
    in  map chr shifted

Ici, on convertit d'abord la chaîne de caractères en une liste de nombres. Puis, on ajoute le décalage à chacun des nombres, avant de reconvertir cette liste de nombres en caractères. Si vous êtes un cowboy de la composition, vous pouvez écrire le corps de cette fonction comme map (chr . (+ shift) . ord) msg. Essayons d'encoder quelques messages.

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.

ghci> encode 3 "Heeeeey"
"Khhhhh|"
ghci> encode 4 "Heeeeey"
"Liiiii}"
ghci> encode 1 "abcd"
"bcde"
ghci> encode 5 "Marry Christmas! Ho ho ho!"
"Rfww~%Hmwnxyrfx&%Mt%mt%mt&"

C'est effectivement encodé. Décoder ces messages consiste simplement à les décaler dans le sens opposé et du même nombre de places que le décalage initial.

Sélectionnez

decode :: Int -> String -> String
decode shift msg = encode (negate shift) msg

Sélectionnez

1.
2.
3.
4.
5.
6.

ghci> encode 3 "Im a little teapot"
"Lp#d#olwwoh#whdsrw"
ghci> decode 3 "Lp#d#olwwoh#whdsrw"
"Im a little teapot"
ghci> decode 5 . encode 5 $ "This is a sentence"
"This is a sentence"

VII-D. Data.Map▲

Les listes associatives (ou dictionnaires) sont des listes utilisées pour stocker des paires clé-valeur, où l'ordre n'est pas important. Par exemple, on peut utiliser une liste associative pour stocker des numéros de téléphone, où les numéros de téléphone seraient les valeurs, et les noms des personnes les clés. On se fiche de l'ordre dans lequel c'est rangé, on souhaite seulement pouvoir récupérer le bon numéro de téléphone pour une personne donnée.

La façon la plus évidente de représenter des listes associatives en Haskell est sous forme de listes de paires. La première composante de la paire serait la clé, la seconde serait la valeur. Voici un exemple de liste associative de numéros de téléphone :

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.

phoneBook =
    [("betty","555-2938")
    ,("bonnie","452-2928")
    ,("patsy","493-2928")
    ,("lucille","205-2928")
    ,("wendy","939-8282")
    ,("penny","853-2492")
    ]

Malgré cette indentation bizarre, c'est bien une liste de paires de chaînes de caractères. L'opération la plus courante associée aux listes associatives est la recherche d'une valeur par sa clé. Créons une fonction qui trouve une valeur à partir d'une clé.

Sélectionnez

findKey :: (Eq k) => k -> [(k,v)] -> v
findKey key xs = snd . head . filter (\(k,v) -> key == k) $ xs

Plutôt simple. La fonction prend une clé, une liste, filtre la liste de façon à ce que seules les clés correspondantes ne restent, prend la première paire clé-valeur et en retourne la valeur. Mais que se passe-t-il si la clé que l'on cherche n'est pas dans la liste ? Hmmm. Ici, si la clé n'est pas dans la liste, on va essayer de prendre la tête d'une liste vide, ce qui génère une erreur à l'exécution. On ne devrait pas laisser notre programme planter si facilement, utilisons donc un type de données Maybe. Si l'on ne trouve pas la clé, on retourne Nothing. Si l'on trouve quelque chose, on retourne Just something, où something sera la valeur correspondant à la clé.

Sélectionnez

1.
2.
3.
4.
5.

findKey :: (Eq k) => k -> [(k,v)] -> Maybe v
findKey key [] = Nothing
findKey key ((k,v):xs) = if key == k
                            then Just v
                            else findKey key xs

Regardez la déclaration de type. Elle prend une clé qui dispose d'un test d'égalité, une liste associative et retourne éventuellement une valeur. Ça a l'air correct.

Ceci est un cas d'école de fonction récursive opérant sur une liste. Cas de base, découpage de la liste en queue et tête, appels récursifs, c'est tout ce qu'il se passe. C'est le motif classique du pli, implémentons-le donc comme un pli.

Sélectionnez

findKey :: (Eq k) => k -> [(k,v)] -> Maybe v
findKey key = foldr (\(k,v) acc -> if key == k then Just v else acc) Nothing

Note : il est généralement mieux d'utiliser des plis pour effectuer de la récursivité standard sur les listes plutôt que d'écrire explicitement la récursivité, car c'est plus simple à lire et à identifier. Tout le monde connaît les plis et sait en identifier un lorsqu'il voit un appel à foldr, mais cela prend plus de temps de déchiffrer une récursivité explicite.

Sélectionnez

1.
2.
3.
4.
5.
6.

ghci> findKey "penny" phoneBook
Just "853-2492"
ghci> findKey "betty" phoneBook
Just "555-2938"
ghci> findKey "wilma" phoneBook
Nothing

Ça fonctionne comme un charme ! Si on a le numéro de téléphone de cette fille, on récupère Just le numéro, sinon, on récupère Nothing.

On vient juste d'implémenter la fonction lookup de Data.List. Si l'on veut trouver la valeur correspondant à une clé, on doit traverser la liste jusqu'à ce qu'on la trouve. Le module Data.Map offre des listes associatives qui sont beaucoup plus rapides (car elles sont implémentées à l'aide d'arbres) et fournit également un paquet de fonctions utiles. À partir de maintenant, nous dirons qu'on travaille sur des maps plutôt que des listes associatives.

Data.Map exporte des fonctions qui collisionnent avec le Prelude et Data.List, donc on l'importe qualifié.

Sélectionnez

import qualified Data.Map as Map

Placez cette ligne dans un script et chargez-le dans GHCi.

Allons à présent voir ce que Data.Map a en magasin pour nous ! Voilà la liste des fonctions.

fromList prend une liste associative (sous forme de liste) et retourne une map avec les mêmes associations.

Sélectionnez

1.
2.
3.
4.

ghci> Map.fromList [("betty","555-2938"),("bonnie","452-2928"),("lucille","205-2928")]
fromList [("betty","555-2938"),("bonnie","452-2928"),("lucille","205-2928")]
ghci> Map.fromList [(1,2),(3,4),(3,2),(5,5)]
fromList [(1,2),(3,2),(5,5)]

S'il y a des clés en doublon dans la liste originale, les doublons sont ignorés. Voici la signature de type de fromList :

Sélectionnez

Map.fromList :: (Ord k) => [(k, v)] -> Map.Map k v

Elle indique qu'elle prend une liste de paires k et v et retourne une map qui mappe des clés de type k sur des valeurs de type v. Remarquez que lorsqu'on faisait des listes associatives sous forme de liste, on avait juste besoin de l'égalité sur les clés (leur type appartenait à Eq), mais à présent elles doivent être ordonnables. C'est une contrainte essentielle pour le module Data.Map. Il a besoin de pouvoir ordonner les clés afin de les arranger en arbre.

Vous devriez toujours utiliser Data.Map pour associer des clés-valeurs, à moins que vous ayez des clés qui ne sont pas membres d'Ord.

empty représente une map vide. Elle ne prend pas d'argument et retourne une map vide.

Sélectionnez

ghci> Map.empty
fromList []

insert prend une clé, une valeur et une map, et retourne une nouvelle map identique à l'ancienne, avec en plus la nouvelle clé-valeur insérée.

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.

ghci> Map.empty
fromList []
ghci> Map.insert 3 100 Map.empty
fromList [(3,100)]
ghci> Map.insert 5 600 (Map.insert 4 200 ( Map.insert 3 100  Map.empty))
fromList [(3,100),(4,200),(5,600)]
ghci> Map.insert 5 600 . Map.insert 4 200 . Map.insert 3 100 $ Map.empty
fromList [(3,100),(4,200),(5,600)]

On peut implémenter notre propre fromList en utilisant la map vide, insert et un pli. Observez :

Sélectionnez

fromList' :: (Ord k) => [(k,v)] -> Map.Map k v
fromList' = foldr (\(k,v) acc -> Map.insert k v acc) Map.empty

C'est un pli plutôt simple. On commence avec la map vide et on la plie depuis la droite, en insérant les paires clé-valeur dans l'accumulateur tout du long.

null vérifie si une map est vide.

Sélectionnez

1.
2.
3.
4.

ghci> Map.null Map.empty
True
ghci> Map.null $ Map.fromList [(2,3),(5,5)]
False

size retourne la taille d'une map.

Sélectionnez

1.
2.
3.
4.

ghci> Map.size Map.empty
0
ghci> Map.size $ Map.fromList [(2,4),(3,3),(4,2),(5,4),(6,4)]
5

singleton prend une clé et une valeur et crée une map qui contient uniquement cette association.

Sélectionnez

1.
2.
3.
4.

ghci> Map.singleton 3 9
fromList [(3,9)]
ghci> Map.insert 5 9 $ Map.singleton 3 9
fromList [(3,9),(5,9)]

lookup fonctionne comme lookup de Data.List, mais opère sur des maps. Elle retourne Just something si elle trouve quelque chose, Nothing sinon.

member est un prédicat qui prend une clé, une map et indique si la clé est dans la map.

Sélectionnez

1.
2.
3.
4.

ghci> Map.member 3 $ Map.fromList [(3,6),(4,3),(6,9)]
True
ghci> Map.member 3 $ Map.fromList [(2,5),(4,5)]
False

map et filter fonctionnent comme leur équivalent.

Sélectionnez

1.
2.
3.
4.

ghci> Map.map (*100) $ Map.fromList [(1,1),(2,4),(3,9)]
fromList [(1,100),(2,400),(3,900)]
ghci> Map.filter isUpper $ Map.fromList [(1,'a'),(2,'A'),(3,'b'),(4,'B')]
fromList [(2,'A'),(4,'B')]

toList est l'inverse de fromList.

Sélectionnez

ghci> Map.toList . Map.insert 9 2 $ Map.singleton 4 3
[(4,3),(9,2)]

keys et elems retournent des listes de clés et de valeurs respectivement. keys est l'équivalent de map fst . Map.toList, et elems l'équivalent de map snd . Map.toList.

fromListWith est une petite fonction assez cool. Elle agit un peu comme fromList, mais elle ne jette pas les clés en double et utilise une fonction passée en paramètre pour décider quoi faire d'elles. Disons qu'une fille peut avoir plusieurs numéros de téléphone, et qu'on a une liste associative comme celle-ci :

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.

phoneBook =
    [("betty","555-2938")
    ,("betty","342-2492")
    ,("bonnie","452-2928")
    ,("patsy","493-2928")
    ,("patsy","943-2929")
    ,("patsy","827-9162")
    ,("lucille","205-2928")
    ,("wendy","939-8282")
    ,("penny","853-2492")
    ,("penny","555-2111")
    ]

Maintenant, si on utilise seulement fromList pour transformer cela en map, on va perdre quelques numéros ! Voilà ce qu'on va faire :

Sélectionnez

phoneBookToMap :: (Ord k) => [(k, String)] -> Map.Map k String
phoneBookToMap xs = Map.fromListWith (\number1 number2 -> number1 ++ ", " ++ number2) xs

Sélectionnez

1.
2.
3.
4.
5.
6.

ghci> Map.lookup "patsy" $ phoneBookToMap phoneBook
"827-9162, 943-2929, 493-2928"
ghci> Map.lookup "wendy" $ phoneBookToMap phoneBook
"939-8282"
ghci> Map.lookup "betty" $ phoneBookToMap phoneBook
"342-2492, 555-2938"

Si une clé en double est trouvée, la fonction qu'on passe est utilisée pour combiner les valeurs en une nouvelle valeur. On aurait aussi pu transformer toutes les valeurs de la liste en listes singleton, puis utiliser (++) comme combinateur.

Sélectionnez

phoneBookToMap :: (Ord k) => [(k, a)] -> Map.Map k [a]
phoneBookToMap xs = Map.fromListWith (++) $ map (\(k,v) -> (k,[v])) xs

Sélectionnez

ghci> Map.lookup "patsy" $ phoneBookToMap phoneBook
["827-9162","943-2929","493-2928"]

Plutôt chic ! Un autre cas d'utilisation est celui où l'on veut créer une map à partir d'une liste d'association, et lors d'un doublon, l'on souhaite conserver la plus grande des valeurs par exemple.

Sélectionnez

ghci> Map.fromListWith max [(2,3),(2,5),(2,100),(3,29),(3,22),(3,11),(4,22),(4,15)]
fromList [(2,100),(3,29),(4,22)]

On pourrait tout aussi bien choisir d'additionner des valeurs de même clé.

Sélectionnez

ghci> Map.fromListWith (+) [(2,3),(2,5),(2,100),(3,29),(3,22),(3,11),(4,22),(4,15)]
fromList [(2,108),(3,62),(4,37)]

insertWith est à insert ce que fromListWith est à fromList. Elle insère une paire clé-valeur dans la map, et si la map contient déjà cette clé, utilise la fonction passée afin de déterminer quoi faire.

Sélectionnez

ghci> Map.insertWith (+) 3 100 $ Map.fromList [(3,4),(5,103),(6,339)]
fromList [(3,104),(5,103),(6,339)]

Ce n'était qu'un aperçu de Data.Map. Vous pouvez voir la liste complète des fonctions dans la documentation.

VII-E. Data.Set▲

Le module Data.Set nous offre des ensembles. Comme les ensembles en mathématiques. Les ensembles sont un peu comme un mélange de listes et de maps. Tous les éléments d'un ensemble sont uniques. Et comme ils sont implémentés en interne à l'aide d'arbres (comme les maps de Data.Map), ils sont ordonnés. Vérifier l'appartenance, insérer, supprimer, etc. sont des opérations bien plus rapides sur les ensembles que sur les listes. Les opérations les plus courantes sur les ensembles sont l'insertion, le test d'appartenance et la conversion en liste.

Les noms dans Data.Set collisionnent beaucoup avec le Prelude et Data.List, on fait donc un import qualifié.

Placez cette déclaration dans un script :

Sélectionnez

import qualified Data.Set as Set

Puis chargez ce script via GHCi.

Supposons qu'on ait deux bouts de texte. On souhaite trouver les caractères utilisés dans les deux chaînes.

Sélectionnez

text1 = "I just had an anime dream. Anime... Reality... Are they so different?"
text2 = "The old man left his garbage can out and now his trash is all over my lawn!"

La fonction fromList fonctionne comme on peut s'y attendre. Elle prend une liste et la convertit en un ensemble.

Sélectionnez

1.
2.
3.
4.
5.
6.

ghci> let set1 = Set.fromList text1
ghci> let set2 = Set.fromList text2
ghci> set1
fromList " .?AIRadefhijlmnorstuy"
ghci> set2
fromList " !Tabcdefghilmnorstuvwy"

Comme vous pouvez le voir, les éléments sont ordonnés et chaque élément est unique. Maintenant, utilisons la fonction intersection pour voir les éléments qu'ils partagent.

Sélectionnez

ghci> Set.intersection set1 set2
fromList " adefhilmnorstuy"

On peut utiliser la fonction difference pour voir quelles lettres sont dans le premier ensemble, mais pas le second, et vice versa.

Sélectionnez

1.
2.
3.
4.

ghci> Set.difference set1 set2
fromList ".?AIRj"
ghci> Set.difference set2 set1
fromList "!Tbcgvw"

Ou bien, on peut voir les lettres uniques à chaque ensemble en utilisant union.

Sélectionnez

ghci> Set.union set1 set2
fromList " !.?AIRTabcdefghijlmnorstuvwy"

Les fonctions null, size, member, empty, singleton, insert et delete fonctionnent toutes comme on peut s'y attendre.

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.

ghci> Set.null Set.empty
True
ghci> Set.null $ Set.fromList [3,4,5,5,4,3]
False
ghci> Set.size $ Set.fromList [3,4,5,3,4,5]
3
ghci> Set.singleton 9
fromList [9]
ghci> Set.insert 4 $ Set.fromList [9,3,8,1]
fromList [1,3,4,8,9]
ghci> Set.insert 8 $ Set.fromList [5..10]
fromList [5,6,7,8,9,10]
ghci> Set.delete 4 $ Set.fromList [3,4,5,4,3,4,5]
fromList [3,5]

On peut aussi tester si un ensemble est un sous-ensemble (ou sous-ensemble strict) d'un autre. Un ensemble A est sous-ensemble de B si B contient tous les éléments de A. A est un sous-ensemble strict de B si B contient tous les éléments de A, mais a strictement plus d'éléments.

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.

ghci> Set.fromList [2,3,4] `Set.isSubsetOf` Set.fromList [1,2,3,4,5]
True
ghci> Set.fromList [1,2,3,4,5] `Set.isSubsetOf` Set.fromList [1,2,3,4,5]
True
ghci> Set.fromList [1,2,3,4,5] `Set.isProperSubsetOf` Set.fromList [1,2,3,4,5]
False
ghci> Set.fromList [2,3,4,8] `Set.isSubsetOf` Set.fromList [1,2,3,4,5]
False

On peut aussi map et filter les ensembles.

Sélectionnez

1.
2.
3.
4.

ghci> Set.filter odd $ Set.fromList [3,4,5,6,7,2,3,4]
fromList [3,5,7]
ghci> Set.map (+1) $ Set.fromList [3,4,5,6,7,2,3,4]
fromList [3,4,5,6,7,8]

Les ensembles sont souvent utilisés pour supprimer les doublons d'une liste en la transformant avec fromList en ensemble, puis en la reconvertissant en liste à l'aide de toList. La fonction nub de Data.List fait aussi ça, mais supprimer les doublons d'une liste est beaucoup plus rapide en convertissant la liste en ensemble puis en liste plutôt qu'en utilisant nub. Mais nub ne nécessite qu'une contrainte de classe Eq sur le type des éléments, alors que pour la transformer en ensemble, le type doit être membre de Ord.

Sélectionnez

1.
2.
3.
4.
5.

ghci> let setNub xs = Set.toList $ Set.fromList xs
ghci> setNub "HEY WHATS CRACKALACKIN"
" ACEHIKLNRSTWY"
ghci> nub "HEY WHATS CRACKALACKIN"
"HEY WATSCRKLIN"

setNub est généralement plus rapide que nub sur des grosses listes, mais comme vous pouvez le voir, nub préserve l'ordre des éléments alors que setNub les mélange.

VII-F. Créer nos propres modules▲

On vient de regarder des modules plutôt cools, mais comment crée-t-on nos propres modules ? Presque tous les langages de programmation vous permettent de découper votre code en plusieurs fichiers et Haskell également. Lorsqu'on programme, il est de bonne pratique de prendre des fonctions et des types qui partagent un but similaire et de les placer dans un module. Ainsi, vous pouvez facilement réutiliser ces fonctions plus tard dans d'autres programmes juste en important le module.

Voyons comment faire nos propres modules en créant un petit module fournissant des fonctions de calcul de volume et d'aire d'objets géométriques. Commençons par créer un fichier Geometry.hs.

On dit qu'un module exporte des fonctions. Cela signifie que quand j'importe un module, je peux utiliser les fonctions que celui-ci exporte. Il peut définir des fonctions que ses propres fonctions appellent en interne, mais on peut seulement voir celles qu'il a exportées.

Au début d'un module, on spécifie le nom du module. On a créé un fichier Geometry.hs, nous devrions donc nommer notre module Geometry. Puis, nous spécifions les fonctions qu'il exporte, et après cela, on peut commencer à écrire nos fonctions. Démarrons.

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.

module Geometry
( sphereVolume
, sphereArea
, cubeVolume
, cubeArea
, cuboidArea
, cuboidVolume
) where

Comme vous pouvez le voir, nous allons faire des aires et des volumes de sphères, de cubes et de pavés droits. Définissons nos fonctions :

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.

module Geometry
( sphereVolume
, sphereArea
, cubeVolume
, cubeArea
, cuboidArea
, cuboidVolume
) where

sphereVolume :: Float -> Float
sphereVolume radius = (4.0 / 3.0) * pi * (radius ^ 3)

sphereArea :: Float -> Float
sphereArea radius = 4 * pi * (radius ^ 2)

cubeVolume :: Float -> Float
cubeVolume side = cuboidVolume side side side

cubeArea :: Float -> Float
cubeArea side = cuboidArea side side side

cuboidVolume :: Float -> Float -> Float -> Float
cuboidVolume a b c = rectangleArea a b * c

cuboidArea :: Float -> Float -> Float -> Float
cuboidArea a b c = rectangleArea a b * 2 + rectangleArea a c * 2 + rectangleArea c b * 2

rectangleArea :: Float -> Float -> Float
rectangleArea a b = a * b

De la géométrie élémentaire. Quelques choses à noter tout de même. Puisqu'un cube est un cas spécial de pavé droit, on a défini son aire et son volume comme ceux d'un pavé dont les côtés ont tous la même longueur. On a également défini la fonction auxiliaire rectangleArea, qui calcule l'aire d'un rectangle à partir des longueurs de ses côtés. C'est plutôt trivial puisqu'il s'agit d'une simple multiplication. Remarquez comme on l'utilise dans nos fonctions de ce module (dans cuboidArea et cuboidVolume), mais on ne l'exporte pas ! On souhaite que notre module présente des fonctions de calcul sur des objets en trois dimensions, donc on n'exporte pas rectangleArea.

Quand on crée un module, on n'exporte en général que les fonctions qui agissent en rapport avec l'interface de notre module, de manière à cacher l'implémentation. Si quelqu'un utilise notre module Geometry, il n'a pas à se soucier des fonctions que l'on n'a pas exportées. On peut décider de changer ces fonctions complètement ou de les effacer dans une nouvelle version (on pourrait supprimer rectangleArea et utiliser * à la place) et personne ne s'en souciera parce qu'on ne les avait pas exportées.

Pour utiliser notre module, on fait juste :

Sélectionnez

import Geometry

Geometry.hs doit tout de même être dans le même dossier que le programme qui souhaite l'importer.

Les modules peuvent aussi être organisés hiérarchiquement. Chaque module peut avoir un nombre de sous-modules et eux-mêmes peuvent avoir leurs sous-modules. Découpons ces fonctions de manière à ce que Geometry soit un module avec trois sous-modules, un pour chaque type d'objet.

D'abord, créons un dossier Geometry. Attention à la majuscule à G. Dans ce dossier, placez trois dossiers : Sphere.hs, Cuboid.hs et Cube.hs (NDT : « Cuboid » signifie pavé droit). Voici ce que les fichiers contiennent :

Sphere.hs

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

module Geometry.Sphere
( volume
, area
) where

volume :: Float -> Float
volume radius = (4.0 / 3.0) * pi * (radius ^ 3)

area :: Float -> Float
area radius = 4 * pi * (radius ^ 2)

Cuboid.hs

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.

module Geometry.Cuboid
( volume
, area
) where

volume :: Float -> Float -> Float -> Float
volume a b c = rectangleArea a b * c

area :: Float -> Float -> Float -> Float
area a b c = rectangleArea a b * 2 + rectangleArea a c * 2 + rectangleArea c b * 2

rectangleArea :: Float -> Float -> Float
rectangleArea a b = a * b

Cube.hs

Sélectionnez

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.

module Geometry.Cube
( volume
, area
) where

import qualified Geometry.Cuboid as Cuboid

volume :: Float -> Float
volume side = Cuboid.volume side side side

area :: Float -> Float
area side = Cuboid.area side side side

Parfait ! Tout d'abord, nous avons Geometry.Sphere. Remarquez comme on l'a placé dans le dossier Geometry puis nommé Geometry.Sphere. Idem pour le pavé. Remarquez aussi comme dans chaque sous-module, nous avons défini des fonctions avec le même nom. On peut le faire, car les modules sont séparés. On veut utiliser des fonctions de Geometry.Cuboid dans Geometry.Cube, mais on ne peut pas simplement import Geometry.Cuboid parce que ce module exporte des fonctions ayant le même nom que celles de Geometry.Cube. C'est pourquoi l'import est qualifié, et tout va bien.

Donc maintenant, si l'on se trouve dans un fichier qui se trouve au même niveau que le dossier Geometry, on peut par exemple :

Sélectionnez

import Geometry.Sphere

Et maintenant, on peut utiliser area et volume, qui nous donneront l'aire et le volume d'une sphère. Et si l'on souhaite jongler avec deux ou plus de ces modules, on doit utiliser des imports qualifiés, car ils exportent des fonctions avec des noms identiques. Tout simplement :

Sélectionnez

1.
2.
3.

import qualified Geometry.Sphere as Sphere
import qualified Geometry.Cuboid as Cuboid
import qualified Geometry.Cube as Cube

Et maintenant, on peut appeler Sphere.area, Sphere.volume, Cuboid.area, etc. et chacune calculera l'aire ou le volume de l'objet correspondant.

La prochaine fois que vous vous retrouverez en train d'écrire un fichier très gros avec plein de fonctions, essayez de voir lesquelles partagent un but commun et si vous pouvez les regrouper dans un module. Vous n'aurez plus qu'à importer ce module si vous souhaitez réutiliser ces fonctionnalités dans un autre programme.