Programming Computable Functions

En informatique théorique, Programming Computable Functions ou PCF est un langage de programmation théorique apparu pour la première fois en 1977 dans un article de Gordon Plotkin^[1], mais qui est basé sur des notes de Dana S. Scott de 1969 qui n'ont été publiées qu'en 1993^[2]. Ce langage consiste en une extension du lambda-calcul simplement typé avec des combinateurs de points fixes et des entiers naturels, ce qui permet de récupérer la complétude au sens de Turing, c'est-à-dire la possibilité d'exprimer n'importe quelle fonction calculable. En effet, l'ajout d'une discipline de types au lambda-calcul, donnant le lambda-calcul simplement typé, limite l'expressivité du langage et les fonctions qui y sont définissables ; l'ajout de combinateurs de point fixe et d'entiers résout ce problème.

Syntaxe et typage

PCF reprend les types du lambda-calcul simplement typé en y adjoignant un type représentant comme types de base les booléens, $o$ , et un type représentant les entiers, $ι$ ^[1]Modèle:,^[3]. Les types sont donc $o$ , $ι$ , ou $α \to β$ avec $α$ et $β$ des types déjà formés. Ce type représente le type des fonctions de $α$ vers $β$ . La notation $α \to β \to γ$ doit être lue comme $α \to (β \to γ)$ .

De plus, la syntaxe de PCF comprend la syntaxe du lambda-calcul simplement typé, et les constructions de base y sont les mêmes : il y a des variables, notées $x, y, z, \dots$ ; si $M$ est un terme de type $α \to β$ et $N$ un terme de type $α$ , $M N$ est un terme de type $β$ qui représente l'évaluation de la fonction $M$ en $N$ ; et si $M$ est un terme de type $β$ dans un contexte où la variable $x$ est de type $α$ , $λ x^{α} . M$ est de type $α \to β$ et représente la fonction $x \mapsto M$ . Si $M$ est un terme de type $α$ , on notera $M : α$ . Pour plus de détails, consulter les sections Syntaxe et Règles de typage de l'article sur le lambda-calcul simplement typé.

À cela se rajoutent les constantes propres permettant de manipuler les types de base. Pour chaque entier naturel $n \in ℕ$ , on ajoute une constante $\underline{n} : ι$ . De plus, il y a une constante pour chaque booléen, $true : o$ et $false : o$ . Pour chaque type de base $σ$ , c'est-à-dire $ι$ et $o$ , on a une constante $if then else : o \to σ \to σ \to σ$ représentant une instruction conditionnelle : l'idée étant que si $b$ vaut $true$ , l'expression $if b then M else N$ vaut $M$ , si $b$ vaut $false$ , elle s'évalue en $N$ . De plus, il y a deux fonctions pour manipuler les entiers, la fonction successeur $succ : ι \to ι$ et la fonction prédécesseur $pred : ι \to ι$ , qui correspondent à ajouter ou soustraire $1$ à leur argument. Enfin, il y a une fonction $zero ? : ι \to o$ qui renvoie $true$ si son argument vaut l'entier $\underline{0}$ , $false$ sinon.

Enfin, le principal ingrédient de PCF est sa construction de point fixe : pour chaque type $α$ , on dispose d'une constante $Y : (α \to α) \to α$ dont l'interprétation est qu'il renvoie le plus petit point fixe de la fonction qu'on lui passe en argument. Certains auteurs^[4] rajoutent à chaque type une constante $Ω : α$ qui répresente un programme qui ne termine pas. Cette construction n'est pas incluse dans la présentation originelle de Gordon Plotkin^[1], mais peut y être définie comme $Y (λ x^{α} . x)$ .

Sémantique opérationnelle

PCF peut être muni d'une sémantique opérationnelle $\to$ ^[5]. Si $M$ et $N$ sont des termes, on a $M \to N$ si $M$ se transforme en $N$ après une étape élémentaire de calcul. On note $M \to^{*} N$ pour dire que $M$ se transforme en $N$ en zéro ou plusieurs étapes. La relation $\to$ est définie comme suit :

$(λ x^{α} . M) N \to M [x : = N]$ : pour évaluer l'application de la fonction $x \mapsto M$ en $N$ , on remplace $x$ par $N$ dans $M$ ;
$Y M \to M (Y M)$ : cela exprime que $Y M$ est un point fixe de $M$ ;
$succ (\underline{n}) \to \underline{n + 1}$ ;
$pred (\underline{n + 1}) \to \underline{n}$ ;
$zero ? (\underline{n}) \to true$ ;
$zero ? (\underline{n + 1}) \to false$ ;
$if true then M else N \to M$ ;
$if false then M else N \to N$ ;
Les règles contextuelles sont les suivantes : si $M \to M^{'}$ alors $M N \to M^{'} N$ , $succ M \to succ M^{'}$ , $pred M \to pred M^{'}$ , $zero ? (M) \to zero ? (M^{'})$ et $if M then N else P \to if M^{'} then N else P$ . Elles donnent à PCF une sémantique d'appel par nom.

Cette sémantique est déterministe, c'est-à-dire que si $M \to N$ et $M \to N^{'}$ , alors $N = N^{'}$ . De plus, elle préserve le typage : si $M \to N$ et que $M$ est de type $α$ , alors $N$ aussi.

De plus, on pourrait autoriser la réduction dans tous les contextes, plutôt qu'uniquement dans ceux précisés dans la dernière règle (qui interdit, par exemple, la réduction $N M \to N M^{'}$ avec $M \to M^{'}$ et $N$ qui n'est pas une lambda-abstraction ou $succ$ ou $pred$ ou $zero ?$ ). Dans ce cas, la réduction obtenue préserve encore le typage et est confluente. De plus, si $M \to^{*} N$ avec cette réduction, et si $N$ est en forme normale, alors $M \to^{*} N$ avec la version restreinte. En clair, la sémantique opérationnelle définie ici est standardisante^[6].

Exemple

PCF permet par exemple de définir des programmes effectuant l'addition de deux entiers. En voici un^[6] : Modèle:Center Si on note $a d d^{'}$ la fonction à l'intérieur de $Y$ , la somme de deux et trois est calculée par la suite de réductions suivante : Modèle:CenterAinsi, $add \underline{2} \underline{3}$ se réduit bien en la valeur $\underline{5}$ .

Sémantique dénotationnelle

La sémantique opérationnelle présentée plus haut permet de déterminer comment exécuter un terme de PCF comme un programme. Mais pour étudier PCF, il peut être interéssant de traduire un terme comme $λ x^{α} . M$ en une fonction au sens mathématique du terme. C'est le rôle de la sémantique dénotationnelle^[7]. Mais contrairement au lambda-calcul simplement typé, on ne peut pas interpréter PCF directement dans les fonctions et les ensembles, puisqu'il existe des fonctions qui n'ont pas de point fixe. On va donc interpréter les termes de PCF comme des fonctions continues entre cpo. Un cpo est un ensemble ordonné dans lequel toutes les parties dirigées ont une borne supérieure, et qui possède un plus petit élément^[8]. L'intérêt des cpo réside dans ce cas chaque fonction continue possède un plus petit point fixe. La catégorie des cpo est cartésienne fermée^[9].

Modèle continu

Le modèle continu est l'interprétation usuelle de PCF^[10]Modèle:,^[11]. On va définir pour chaque type, chaque contexte et chaque terme une traduction $[[\cdot]]$ telle que l'interprétation d'un contexte ou d'un type soit un cpo, et si $Γ ⊢ M : α$ dans PCF, alors $[[M]] : [[Γ]] \to [[α]]$ est une fonction continue de l'interprétation du contexte vers l'interprétation du type de $M$ .

Les types de base sont interprétés comme des domaines plats : on a $[[ι]] = ℕ_{⊥}$ et $[[o]] = 𝔹_{⊥}$ , où $ℕ$ est l'ensemble des entiers naturels, $𝔹$ l'ensemble des booléens et pour tout ensemble $X$ , $X_{⊥}$ est le cpo défini sur l'ensemble $X$ auquel on adjoint un élément $⊥$ , avec l'ordre défini par $⊥ \leq x$ pour tout $x$ , et les éléments de $X$ sont incomparables entre eux. Le type $α \to β$ est interprété comme l'ensemble des fonctions continues de $[[α]]$ vers $[[β]]$ . Un contexte $x_{1} : α_{1}, \dots, x_{n} : α_{n}$ est interprété par $[[α_{1}]] \times \dots \times [[α_{n}]]$ . On remarque que chaque type est un cpo, donc a un plus petit élément $⊥$ .

Considérons maintenant un terme typé et son contexte $Γ ⊢ M : α$ , avec $Γ = x_{1} : α_{1}, \dots, x_{n} : α_{n}$ .

L'interprétation des constructions issues du lambda-calcul est la suivante :

$[[x_{i}]] = (x_{1}, \dots, x_{n}) \mapsto x_{i}$ .
$[[λ x^{α} . M]] = (x_{1}, \dots, x_{n}) \mapsto (x \mapsto [[M]] (x_{1}, \dots, x_{n}, x))$ .
$[[M N]] = (x_{1}, \dots, x_{n}) \mapsto [[M]] (x_{1}, \dots, x_{n}) ([[N]] (x_{1}, \dots, x_{n}))$ .

L'opérateur de point fixe est définie comme suit :

$[[Y]]$ est la fonction $([[T]] \to [[T]]) \to [[T]]$ qui à chaque $f : [[T]] \to [[T]]$ associe son plus petit point fixe. Il est défini comme $\underset{n \in ℕ}{⋁} f^{n} (⊥)$ , c'est-à-dire comme le supremum de la suite croissante $⊥, f (⊥), f (f (⊥)), \dots$ .
Puisque intuitivement, $Ω = Y (λ x . x)$ , et que le plus petit point fixe de la fonction identité est $⊥$ , $[[Ω]] = ⊥$ .

Les primitives sur les entiers et les booléens sont interprétées comme suit, l'idée étant que $⊥$ représente une valeur non déterminée, par exemple un programme qui ne termine pas :

$[[succ]] (n) = n + 1$ si $n \in ℕ$ et $[[succ]] (⊥) = ⊥$ .
$[[pred]] (n) = n - 1$ si $n \in ℕ$ et $n \neq 0$ , $[[pred]] (0) = ⊥$ et $[[pred]] (⊥) = ⊥$ .

$[[z e r o ?]] (0) = true$ , $[[z e r o ?]] (n) = false$ si $n \in ℕ$ et $n \neq 0$ , et $[[z e r o ?]] (⊥) = ⊥$ .
$[[if then else]] (true) (x) (y) = x$ , $[[if then else]] (false) (x) (y) = y$ et $[[if then else]] (⊥) (x) (y) = y$ .

Modèles standards

Plus généralement, on peut interpréter PCF dans des catégories cartésiennes fermées enrichies dans les cpo. Un tel modèle est appelé modèle standard de PCF. Une catégorie cartésienne fermée enrichie dans les cpo est une catégorie cartésienne fermée $𝒞$ telle que :

les hom-set $𝒞 (A, B)$ sont des cpo pour tous objets $A$ et $B$ ;
la composition, le pairage et la currification sont continues ;
l'évaluation et la composition sont strictes : pour tous objets $A$ , $B$ et $C$ et tout morphisme $f : A \to B$ , si l'on désigne par $⊥_{D}$ le plus petit élément d'un cpo $D$ , on a :Modèle:Center et si l'on désigne par $B \to C$ l'objet des fonctions de $B$ vers $C$ dans la catégorie cartésienne fermée, par $⟨ \cdot, \cdot ⟩$ l'opération de pairage et par $e v_{B, C} : (B \to C) \times B \to C$ le morphisme d'évaluation, on a :

Modèle:Center

la catégorie possède deux objets $D^{ι}$ et $D^{o}$ tels que $𝒞 (1, D^{ι})$ soit isomorphe à $ℕ_{⊥}$ et $𝒞 (1, D^{o})$ soit isomorphe à $𝔹_{⊥}$ en tant que cpo, où $1$ l'objet terminal de la catégorie $𝒞$ . Dans la catégorie des cpo, $1$ est l'ensemble à un élément muni de l'égalité comme relation d'ordre.

Dans ce cas, en interprétant dans $𝒞$ les constructions issues du lambda-calcul simplement typé de la façon uselle, en définissant $[[Ω]] = ⊥$ et $[[Y]] = \underset{n \in ℕ}{⋁} [[λ f . f^{n} Ω]]$ et en interprétant les constructions sur les types primitifs de la même façon que dans le modèle continu en posant $[[ι]] = D^{ι}$ et $[[o]] = D^{o}$ , ce qui est rendu possible par les isomorphismes $𝒞 (1, D^{ι}) ≃ ℕ_{⊥}$ et $𝒞 (1, D^{o}) ≃ 𝔹_{⊥}$ , on obtient la sémantique désirée.

Expressivité

Turing-complétude

Si $t : \overset{k}{\overset{⏞}{ι \to ι \to \dots}} \to ι$ est un programme dans PCF qui prend $k$ entiers en entrée et renvoie un entier, on peut montrer assez facilement que $t$ détermine une fonction calculable $f : ℕ^{k} \to ℕ$ par $f (n_{1}, \dots, n_{k}) = m$ si $f {\underline{n}}_{1} \dots {\underline{n}}_{k} \to^{*} \underline{m}$ et $f (n_{1}, \dots, n_{k})$ n'est pas définie sinon.

Réciproquement, étant donnée une fonction calculable $f : ℕ^{k} \to ℕ$ , on peut se demander si elle est représentée par un terme $t : \overset{k}{\overset{⏞}{ι \to ι \to \dots}} \to ι$ de PCF tel que pour tous entiers $n_{1}, \dots, n_{k}$ et $m$ , Modèle:Center Ce problème correspond à la notion de complétude au sens de Turing. La réponse est positive, donc PCF peut représenter toutes les fonctions calculables entre les entiers^[12]. Modèle:Démonstration

Bibliographie

Modèle:Ouvrage

Notes et références

Modèle:Références

Modèle:Portail

[:0-1] 1,0 ^1,1 et ^1,2 Modèle:Article

[2] Modèle:Article Modèle:Commentaire biblio SRL.

[3] Modèle:Référence Harvard sans parenthèses

[4] Modèle:Référence Harvard sans parenthèses

[5] Modèle:Référence Harvard sans parenthèses

[:1-6] 6,0 et ^6,1 Modèle:Référence Harvard sans parenthèses

[7] Modèle:Référence Harvard sans parenthèses

[8] Modèle:Référence Harvard sans parenthèses

[9] Modèle:Référence Harvard sans parenthèses

[10] Modèle:Référence Harvard sans parenthèses

[11] Modèle:Référence Harvard sans parenthèses

[12] Modèle:Référence Harvard sans parenthèses

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

Programming Computable Functions

Sommaire

Syntaxe et typage

Sémantique opérationnelle

Exemple

Sémantique dénotationnelle

Modèle continu

Modèles standards

Expressivité

Turing-complétude

Bibliographie

Notes et références

Menu de navigation

Programming Computable Functions

Syntaxe et typage

Sémantique opérationnelle

Exemple

Sémantique dénotationnelle

Modèle continu

Modèles standards

Expressivité

Turing-complétude

Bibliographie

Notes et références

Menu de navigation

Rechercher