Programming Computable Functions

De testwiki
Aller à la navigation Aller à la recherche

En informatique théorique, Programming Computable Functions ou PCF est un langage de programmation théorique apparu pour la première fois en 1977 dans un article de Gordon Plotkin[1], mais qui est basé sur des notes de Dana S. Scott de 1969 qui n'ont été publiées qu'en 1993[2]. Ce langage consiste en une extension du lambda-calcul simplement typé avec des combinateurs de points fixes et des entiers naturels, ce qui permet de récupérer la complétude au sens de Turing, c'est-à-dire la possibilité d'exprimer n'importe quelle fonction calculable. En effet, l'ajout d'une discipline de types au lambda-calcul, donnant le lambda-calcul simplement typé, limite l'expressivité du langage et les fonctions qui y sont définissables ; l'ajout de combinateurs de point fixe et d'entiers résout ce problème.

Syntaxe et typage

PCF reprend les types du lambda-calcul simplement typé en y adjoignant un type représentant comme types de base les booléens, o, et un type représentant les entiers, ι[1]Modèle:,[3]. Les types sont donc o, ι, ou αβ avec α et β des types déjà formés. Ce type représente le type des fonctions de α vers β. La notation αβγ doit être lue comme α(βγ).

De plus, la syntaxe de PCF comprend la syntaxe du lambda-calcul simplement typé, et les constructions de base y sont les mêmes : il y a des variables, notées x,y,z,  ; si M est un terme de type αβ et N un terme de type α, MN est un terme de type β qui représente l'évaluation de la fonction M en N ; et si M est un terme de type β dans un contexte où la variable x est de type α, λxα.M est de type αβ et représente la fonction xM. Si M est un terme de type α, on notera M:α. Pour plus de détails, consulter les sections Syntaxe et Règles de typage de l'article sur le lambda-calcul simplement typé.

À cela se rajoutent les constantes propres permettant de manipuler les types de base. Pour chaque entier naturel n, on ajoute une constante n_:ι. De plus, il y a une constante pour chaque booléen, true:o et false:o. Pour chaque type de base σ, c'est-à-dire ι et o, on a une constante if then else:oσσσ représentant une instruction conditionnelle : l'idée étant que si b vaut true, l'expression ifbthenMelseNvaut M, si b vaut false, elle s'évalue en N. De plus, il y a deux fonctions pour manipuler les entiers, la fonction successeur succ:ιι et la fonction prédécesseur pred:ιι, qui correspondent à ajouter ou soustraire 1 à leur argument. Enfin, il y a une fonction zero?:ιo qui renvoie true si son argument vaut l'entier 0_, false sinon.

Enfin, le principal ingrédient de PCF est sa construction de point fixe : pour chaque type α, on dispose d'une constante Y:(αα)α dont l'interprétation est qu'il renvoie le plus petit point fixe de la fonction qu'on lui passe en argument. Certains auteurs[4] rajoutent à chaque type une constante Ω:α qui répresente un programme qui ne termine pas. Cette construction n'est pas incluse dans la présentation originelle de Gordon Plotkin[1], mais peut y être définie comme Y(λxα.x).

Sémantique opérationnelle

PCF peut être muni d'une sémantique opérationnelle [5]. Si M et N sont des termes, on a MN si M se transforme en N après une étape élémentaire de calcul. On note M*N pour dire que M se transforme en N en zéro ou plusieurs étapes. La relation est définie comme suit :

  • (λxα.M)NM[x:=N] : pour évaluer l'application de la fonction xM en N, on remplace x par N dans M ;
  • YMM(YM) : cela exprime que YM est un point fixe de M ;
  • succ(n_)n+1_;
  • pred(n+1_)n_ ;
  • zero?(n_)true;
  • zero?(n+1_)false ;
  • iftruethenMelseNM ;
  • iffalsethenMelseNN ;
  • Les règles contextuelles sont les suivantes : si MM alors MNMN, succMsuccM, predMpredM, zero?(M)zero?(M) et ifMthenNelsePifMthenNelseP. Elles donnent à PCF une sémantique d'appel par nom.

Cette sémantique est déterministe, c'est-à-dire que si MN et MN, alors N=N. De plus, elle préserve le typage : si MN et que M est de type α, alors N aussi.

De plus, on pourrait autoriser la réduction dans tous les contextes, plutôt qu'uniquement dans ceux précisés dans la dernière règle (qui interdit, par exemple, la réduction NMNM avec MM et N qui n'est pas une lambda-abstraction ou succ ou pred ou zero?). Dans ce cas, la réduction obtenue préserve encore le typage et est confluente. De plus, si M*N avec cette réduction, et si N est en forme normale, alors M*N avec la version restreinte. En clair, la sémantique opérationnelle définie ici est standardisante[6].

Exemple

PCF permet par exemple de définir des programmes effectuant l'addition de deux entiers. En voici un[6] : Modèle:Center Si on note add la fonction à l'intérieur de Y, la somme de deux et trois est calculée par la suite de réductions suivante : Modèle:CenterAinsi, add2_3_ se réduit bien en la valeur 5_.

Sémantique dénotationnelle

La sémantique opérationnelle présentée plus haut permet de déterminer comment exécuter un terme de PCF comme un programme. Mais pour étudier PCF, il peut être interéssant de traduire un terme comme λxα.M en une fonction au sens mathématique du terme. C'est le rôle de la sémantique dénotationnelle[7]. Mais contrairement au lambda-calcul simplement typé, on ne peut pas interpréter PCF directement dans les fonctions et les ensembles, puisqu'il existe des fonctions qui n'ont pas de point fixe. On va donc interpréter les termes de PCF comme des fonctions continues entre cpo. Un cpo est un ensemble ordonné dans lequel toutes les parties dirigées ont une borne supérieure, et qui possède un plus petit élément[8]. L'intérêt des cpo réside dans ce cas chaque fonction continue possède un plus petit point fixe. La catégorie des cpo est cartésienne fermée[9].

Modèle continu

Le modèle continu est l'interprétation usuelle de PCF[10]Modèle:,[11]. On va définir pour chaque type, chaque contexte et chaque terme une traduction [[]] telle que l'interprétation d'un contexte ou d'un type soit un cpo, et si ΓM:α dans PCF, alors [[M]]:[[Γ]][[α]] est une fonction continue de l'interprétation du contexte vers l'interprétation du type de M.

Les types de base sont interprétés comme des domaines plats : on a [[ι]]= et [[o]]=𝔹, où est l'ensemble des entiers naturels, 𝔹 l'ensemble des booléens et pour tout ensemble X, X est le cpo défini sur l'ensemble X auquel on adjoint un élément , avec l'ordre défini par x pour tout x, et les éléments de X sont incomparables entre eux. Le type αβ est interprété comme l'ensemble des fonctions continues de [[α]] vers [[β]]. Un contexte x1:α1,,xn:αn est interprété par [[α1]]××[[αn]]. On remarque que chaque type est un cpo, donc a un plus petit élément .

Considérons maintenant un terme typé et son contexte ΓM:α, avec Γ=x1:α1,,xn:αn.

L'interprétation des constructions issues du lambda-calcul est la suivante :

  • [[xi]]=(x1,,xn)xi.
  • [[λxα.M]]=(x1,,xn)(x[[M]](x1,,xn,x)).
  • [[MN]]=(x1,,xn)[[M]](x1,,xn)([[N]](x1,,xn)).

L'opérateur de point fixe est définie comme suit :

  • [[Y]] est la fonction ([[T]][[T]])[[T]] qui à chaque f:[[T]][[T]] associe son plus petit point fixe. Il est défini comme nfn(), c'est-à-dire comme le supremum de la suite croissante ,f(),f(f()),.
  • Puisque intuitivement, Ω=Y(λx.x), et que le plus petit point fixe de la fonction identité est , [[Ω]]=.

Les primitives sur les entiers et les booléens sont interprétées comme suit, l'idée étant que représente une valeur non déterminée, par exemple un programme qui ne termine pas :

  • [[succ]](n)=n+1 si n et [[succ]]()=.
  • [[pred]](n)=n1 si n et n0, [[pred]](0)= et [[pred]]()=.
  • [[zero?]](0)=true, [[zero?]](n)=false si n et n0, et [[zero?]]()=.
  • [[if then else]](true)(x)(y)=x, [[if then else]](false)(x)(y)=y et [[if then else]]()(x)(y)=y.

Modèles standards

Plus généralement, on peut interpréter PCF dans des catégories cartésiennes fermées enrichies dans les cpo. Un tel modèle est appelé modèle standard de PCF. Une catégorie cartésienne fermée enrichie dans les cpo est une catégorie cartésienne fermée 𝒞 telle que :

  • les hom-set 𝒞(A,B) sont des cpo pour tous objets A et B ;
  • la composition, le pairage et la currification sont continues ;
  • l'évaluation et la composition sont strictes : pour tous objets A, B et C et tout morphisme f:AB, si l'on désigne par D le plus petit élément d'un cpo D, on a :Modèle:Center et si l'on désigne par BC l'objet des fonctions de B vers C dans la catégorie cartésienne fermée, par , l'opération de pairage et par evB,C:(BC)×BC le morphisme d'évaluation, on a :

Modèle:Center

  • la catégorie possède deux objets Dι et Do tels que 𝒞(1,Dι) soit isomorphe à et 𝒞(1,Do) soit isomorphe à 𝔹 en tant que cpo, où 1 l'objet terminal de la catégorie 𝒞. Dans la catégorie des cpo, 1 est l'ensemble à un élément muni de l'égalité comme relation d'ordre.

Dans ce cas, en interprétant dans 𝒞 les constructions issues du lambda-calcul simplement typé de la façon uselle, en définissant [[Ω]]= et [[Y]]=n[[λf.fnΩ]] et en interprétant les constructions sur les types primitifs de la même façon que dans le modèle continu en posant [[ι]]=Dι et [[o]]=Do, ce qui est rendu possible par les isomorphismes 𝒞(1,Dι) et 𝒞(1,Do)𝔹, on obtient la sémantique désirée.

Expressivité

Turing-complétude

Si t:ιιkι est un programme dans PCF qui prend k entiers en entrée et renvoie un entier, on peut montrer assez facilement que t détermine une fonction calculable f:k par f(n1,,nk)=m si fn_1n_k*m_ et f(n1,,nk) n'est pas définie sinon.

Réciproquement, étant donnée une fonction calculable f:k, on peut se demander si elle est représentée par un terme t:ιιkι de PCF tel que pour tous entiers n1,,nk et m, Modèle:Center Ce problème correspond à la notion de complétude au sens de Turing. La réponse est positive, donc PCF peut représenter toutes les fonctions calculables entre les entiers[12]. Modèle:Démonstration

Bibliographie

Notes et références

Modèle:Références

Modèle:Portail