Automates finis

Dans le chapitre sur les langages réguliers, nous avons défini les mots et les langages formels. Nous avons décrit une certaine famille de langages appelée langages réguliers, qui sont décrits par un motif appelé expression régulière.

Une faiblesse des expressions régulières est qu'il est a priori difficile d'énoncer un algorithme général permettant de vérifier si un mot \(u\) appartient au langage dénoté par une expression régulière. Le formalisme est expressif, facile à utiliser de notre point de vue, mais difficile à mettre en oeuvre sur une machine.

Dans ce chapitre on introduit la notion d'automate est qui une machine simple permettant de reconnaître des mots, et donc des langages. Contrairement aux expressions régulières, ce formalisme s'implémente facilement et efficacement sur un ordinateur.

Les automates sont aussi très importants en informatique car ils constitue un premier exemple de machine formelle, c'est-à-dire une représentation abstraite d'une machine capable de calculer. L'exemple le plus célèbre de machine formelle est la machine de Turing mais pour bien la comprendre, il faut commencer par comprendre les automates.

Dans tout ce chapitre, on se fixe un alphabet \(\Sigma\) sur lequel on travaille.

1. Automates finis déterministes

A. Définition

Commençons par donner une vision intuitive de la machine que nous allons construire :

un automate est une machine qui se situe à tout moment dans un certain état; elle a un nombre fini d'états possibles;
un automate prend en entrée un mot qu'elle lit de gauche à droite, lettre par lettre;
lorsque l'automate est dans un état \(q\) et qu'il lit une lettre \(c\), alors il transite vers un état \(\delta(q, c)\) qui ne dépend que de l'état actuel \(q\) et de la lettre lue \(c\).

Voici la définition formelle de cette machine :

Définition

Un automate fini déterministe (afd) est un quadruplet \(A = (Q, q_0, F, \delta)\) où :

\(Q\) est un ensemble fini d'états;
\(q_0 \in Q\) est un état particulier appelé état initial;
\(F \subset Q\) est un ensemble d'états finaux;
\(\delta : Q \times \Sigma \to Q\) est la fonction de transition de l'automate.

La fonction de transition \(\delta\) n'est pas nécessairement définie sur \(Q \times \Sigma\) en entier, autrement dit, pour certains états \(q\) et certaines lettres \(c\), \(\delta(q, c)\) peut ne pas être défini. Dans ce cas, on dit que l'automate bloque à la lecture de \(c\) dans l'état \(q\).

Un automate se représente plus volontier sous forme d'un graphe orienté, par exemple ainsi :

Dans cette représentation :

les sommets du graphe représentent les états de l'automate
les arcs représentent les transitions, l'étiquette d'un arc est la lettre lue
une flèche entrante marque l'état initial
un trait double entoure les états finaux

Ainsi, dans cet exemple, l'automate représenté est \(A = (Q, q_0, F, \delta)\) où :

\(Q = \{q_0, q_1, q_2\}\)
\(q_0 = q_0\)
\(F = \{q_1, q_2\}\)
\(\delta\) est la fonction de transition que l'on peut représenter sous forme de table de transition de l'automate :

état \(q\)	lettre \(c\)	arrivée \(\delta(q, c)\)
\(q_0\)	\(a\)	\(q_0\)
\(q_0\)	\(b\)	\(q_1\)
\(q_1\)	\(a\)	\(q_0\)
\(q_1\)	\(b\)	\(q_2\)
\(q_2\)	\(a\)	\(q_0\)

Remarque

Dans certains textes, les états finaux peuvent être marqués par une flèche sortante plutôt qu'un trait double.

B. Calcul d'un automate

Nous avons défini formellement un automate et il nous reste maintenant à décrire son fonctionnement c'est-à-dire décrire comment cette machine calcule.

Un automate est une machine capable de lire des mots. Lorsque l'automate est dans un état \(q_1\) et que l'on lit une lettre \(c\), l'automate transitionne vers l'état \(q_2 = \delta(q, c)\) (sauf s'il y a blocage). Pour tout état \(q_1\) et \(q_2\) et toute lettre \(c \in \Sigma\), on notera :

\[ q_1 \longrightarrow^c q_2 \]

lorsque \(q_2 = \delta(q_1, c)\).

Notation alternative

Il est aussi possible de noter \(q_1.c = q_2\) lorsque \(\delta(q_1, c) = q_2\).

Définition (calcul)

Un calcul d'un automate fini déterministe \(A = (Q, q_0, F, \delta)\) est un chemin dans l'automate, c'est-à-dire une suite d'états :

\[ u_0 \longrightarrow^{w_1} u_1 \longrightarrow^{w_2} u_2 \longrightarrow^{w_3} \cdots \longrightarrow^{w_{n-1}} u_{n-1} \longrightarrow^{w_n} u_n \]

où les \(w_i\) sont des lettres lues et qui vérifie bien :

\[ \forall k \in \{0, \dots, n-1\}, u_{k+1} = \delta(u_k, w_k). \]

Exemple (calcul d'un automate)

Dans l'automate :

\[ q_0 \longrightarrow^a q_0 \longrightarrow^b q_1 \longrightarrow^b q_2 \longrightarrow^a q_0 \longrightarrow^b q_1 \]

est un calcul de l'automate qui correspond à la lecture du mot \(abbab\) depuis l'état \(q_0\) et qui mène en \(q_1\).

On remarque que pour un état de départ \(q\), et un mot \(u\) donné, il ne peut exister qu'un seul calcul depuis cet état, c'est pour cette raison que l'on dit que l'automate est déterministe : il n'a qu'un seul comportement possible à la lecture d'un mot en entrée. Cela peut être rendu explicite par la définition de la fonction de transition étendue :

Définition (fonction de transition étendue)

Soit \(A = (Q, q_0, F, \delta)\) un automate fini déterministe. On définit la fonction de transition étendue \(\delta^* : Q \times \Sigma^* \to Q\) par :

\[ \begin{cases} \forall q \in Q,\ \delta^*(q, \varepsilon) = q \\ \forall q \in Q, \ \forall u \in \Sigma^*, \ \forall c \in \Sigma, \ \delta^*(q, uc) = \delta(\delta^*(q, u), c) \\ \end{cases} \]

Ainsi, la fonction \(\delta^*\) étend la fonction \(\delta\) aux mots. Tout comme la fonction \(\delta\), elle n'est pas forcément définie sur \(Q \times \Sigma^*\) : la lecture d'un mot peut provoquer un blocage.

Notations alternatives

Il est aussi possible de noter :

\(q_1.u = q_2\)
ou encore \(q_1 \rightarrow^u q_2\)

lorsque \(\delta^*(q_1, u) = q_2\). La première notation, plus mathématique, montre qu'on peut faire agir le monoïde \(\Sigma^*\) sur l'ensemble d'états \(Q\). La seconde notation met en évidence la notion de chemin dans l'automate.

C. Langage reconnu

Définition (mot reconnu)

Soit \(A = (Q, q_0, F, \delta)\) un automate fini déterministe. Un mot \(u \in \Sigma^*\) est reconnu (on dit aussi accepté) par \(A\) lorsque \(\delta^*(q_0, u) \in F\).

Autrement dit, un mot est reconnu est par un automate si sa lecture à partir l'état initial \(q_0\) :

ne provoque pas de blocage
mène l'automate dans un de ses états finaux

Définition (langage reconnu)

Soit \(A = (Q, q_0, F, \delta)\) un automate fini déterministe. Le langage reconnu (aussi appelé langage accepté) par l'automate \(A\), noté \(\mathcal{L}(A)\) est :

\[ \mathcal{L}(A) = \{ u \in \Sigma^*, \delta^*(q, u) \in F \} \]

Autrement dit, le langage reconnu est l'ensemble des mots reconnus par l'automate.

Définition (langage reconnaissable)

Un langage \(L\) est dit reconnaissable par automate fini s'il existe un automate fini déterministe \(A\) tel que \(\mathcal{L}(A) = L\).
L'ensemble des langages sur \(\Sigma\) reconnaissables par automate fini est appelé classe des langages reconnaissables. Elle sera notéee \(\def\rec#1{{\text{REC}(#1)}} \rec{\Sigma}\) dans ce cours.

Étudions maintenant quelques exemples de langages pouvant être reconnus par automate fini déterministe.

Exemple : mots commençant par ...

On souhaite reconnaître par automate le langage des mots sur \(\Sigma = \{a, b\}\) qui commencent par \(aba\), c'est-à-dire ayant \(aba\) pour préfixe. Pour cela, on peut proposer l'automate suivant :

Automate reconnaissant les mots qui commencent par aba

La dernière flèche, tout à droite, est étiquetée par \(a, b\), ce qui signifie qu'il y a en réalité 2 transitions. On utilise souvent cette notation pour alléger les figures. L'automate peut se lire en deux parties :

Une première phase où on lit le préfixe \(aba\), remarquer comme on utilise le blocage pour rejeter les mots qui ne commencent pas par \(aba\)
Une seconde phase où on boucle sur l'état final, ce qui signifie qu'on accepte maintenant toute suite de lettres

Exemple : mots contenant un nombre impair de \(a\)

On souhaite reconnaître par automate le langage des mots sur \(\Sigma = \{a, b\}\) contenant un nombre impair de \(a\). Pour cela, on peut proposer l'automate suivant :

Automate reconnaissant les mots ayant un nombre impair de a

Dans cet exemple, les états de l'automate servent à reprensenter les classes de congruence du nombre de \(a\) modulo 2. Plus simplement, dans l'état \(q_0\) le nombre de \(a\) lus est pair et dans l'état \(q_1\) le nombre de \(a\) lus est impair. Cela explique que la lecture d'un \(a\) fait passer d'un état à l'autre, tandis que la lecture d'un \(b\) ne change pas l'état.

Conseil

Autant que possible, faites en sorte que chaque état de l'automate ait une signification propore comme dans les exemples précédents. Cela facilite à la fois la conception et la justification de l'automate.

Exercice

En vous inspirant de l'exemple précédent, proposer un automate pour reconnaître les mots sur \(\Sigma = \{a, b\}\) dont le nombre de \(b\) est de la forme \(3k + 1\) avec \(k \in \mathbb{N}\).

Exemple difficile : mots finissant par \(ababa\)

On souhaite reconnaître le langage des mots sur \(\Sigma = \{a, b\}\) finissant par \(ababa\), c'est-à-dire ayant \(ababa\) pour suffixe. Voici un automate fini déterministe reconnaissant ce langage.

Automate reconnaissant les mots qui finissent par ababa

Cet automate implémente en fait l'algorithme de recherche de motif de Knuth-Morris-Pratt (KMP). L'état \(q_i\) représente le préfixe de longueur \(i\) de \(ababab\). Être dans l'état \(q_i\) signifie que le plus long préfixe de \(ababa\) qui est actuellement en fin de mot lu, c'est-à-dire qui est suffixe du mot lu, est celui de longueur \(i\).

Les transitions vers la droite sont faciles à comprendre : si on lit la bonne lettre, on gagne une lettre dans le préfixe de \(ababa\).
Les transitions retour, c'est-à-dire quand on lit la mauvaise lettre, sont plus ardues. Prenons un exemple :
- Lorsqu'on est dans \(q_3\), le plus long suffixe du mot lu qui est aussi préfixe de \(ababa\) est \(aba\), autrement dit le mot lu est de la forme \(waba\). Si on lit maintenant un \(a\), le mot est \(wabaa\), alors le plus long suffixe de \(wabaa\) qui est préfixe de \(ababa\) est \(a\). C'est pourquoi on retourne en \(q_1\) et pas en \(q_0\). On constate en fait que malgré l'erreur de lettre, une partie de la lecture de \(ababa\) a déjà commencé et qu'il ne faut pas reprendre la recherche depuis le début.
- De même lorsqu'on est dans \(q_5\), le mot lu a pour forme \(wababa\). Si on lit maintenant un \(b\), le mot lu sera \(wababab\), et on s'aperçoit que le plus long suffixe de ce mot qui est aussi préfixe de \(ababa\) est \(abab\), donc on revient en \(q_4\). Vous pouvez tester cela en regardant la lecture du mot \(ababababa\) par exemple.

D. Programmation

Nous avions promis que les automates étaient bien plus simples à mettre en oeuvre sur un ordinateur que les expressions régulières. Voici donc un exemple d'implémentation en OCaml.

    type etat = int;; (* Les etats sont representes par des numeros de 0 à |A|-1*)

    type auto = {
        taille: int; (* nombre d'états *)
        init: etat;
        final: etat list;
        trans: (char * etat) list array; (* table de transitions *)
    };;

Le seul point délicat de cette représentation est la table de transitions, c'est-à-dire la manière dont on représente la fonction de transition \(\delta\). La représentation choisie est un tableau trans dans lequel chaque case trans.(i) contient les transitions sortantes de l'état \(i\). Ces transitions sont représentées sous forme d'une liste de couples \((c, j)\) où \(c\) est la lettre lue et \(j\) l'état d'arrivée de la transition. Cette représentation est analogue à celle des listes d'adjacence pour les graphes orientés.

Remarque

Ces listes sont appelées listes associatives. Elles servent à associer un état d'arrivée (valeur) à une lettre lue (clef). Autrement dit il s'agit d'une implémentation concrète de la structure de données abstraite de dictionnaire. On a choisi les listes associatives par simplicité mais nous aurions aussi pu utiliser une table de hachage ou encore un arbre binaire de recherche.

Définition d'un automate

Définissons en OCaml l'automate vu en début de chapitre :

let a1 = {
    taille = 3;
    init = 0;
    final = [1; 2];
    trans = [|
        [('a', 0); ('b', 1)]; (* transitions sortantes de l'etat 0 *)
        [('a', 0); ('b', 2)];
        [('a', 0)]
    |]
};;

Un avantage de l'utilisation des listes associatives est que la fonction List.assoc est déjà programmée pour vous dans la bibliothèque OCaml (sa programmation ne devrait poser aucun problème, faites-le en exercice). Cette fonction a pour signature List.assoc : 'a -> ('a * 'b) list -> 'b', elle prend en argument une clef et une liste associative et renvoie la valeur associée à cette clef. Si la clef n'existe pas dans la liste, alors l'exception Not_found est levée.

Pour nous, les clefs sont les lettres lues, les valeurs les états d'arrivée et l'exception Not_found est déclenchée lorsqu'il y a blocage. Implémentons la fonction de calcul d'un automate :

(* lit le mot u dans auto depuis l'etat q *)
let calcul auto q u =
    let n = String.length u in (* le mot est une chaîne de caractères *)
    let etat_courant = ref q in (* on se sert d'une référence pour mémoriser l'état courant *)
    for i = 0 to n-1 do
        let nouvel_etat = List.assoc u.[i] auto.trans.(!etat_courant) in
        etat_courant := nouvel_etat
    done;
    !etat_courant
;;

Remarquons que cette fonction lève aussi l'exception Not_found en cas de blocage. Nous pouvons maintenant programmer la fonction qui teste si un mot est accepté ou non par un automate :

let est_reconnu auto u =
    try
        (* on calcule l'etat d'arrivée en fin de lecture du mot *)
        let etat_fin = calcul auto auto.init u in
        (* on teste s'il est final *)
        List.mem etat_fin auto.final
    with
        (* Si Not_found est levé, il y a blocage, le mot n'est pas accepté *)
        Not_found -> false 
;;

Les automates sont efficaces !

Les automates se programment assez rapidement mais surtout ils sont efficaces. La lecture d'un mot \(u\) est de complexité linéaire \(O(|u|)\). Encore mieux, l'automate lit en fait une et une seule fois chaque lettre de gauche à droite.

2. Opérations classiques sur les automates

A. Accessibilité et émondage

Définition (accessibilité)

Soit \(A = (Q, q_0, \delta, F)\) un automate fini déterministe et \(q \in Q\) un état.

On dit que \(q\) est accessible s'il existe un mot \(u\) tel que \(q_0 \rightarrow^u q\)
On dit que \(q\) est co-accessible s'il existe un mot \(u\) et un état final \(q_F \in F\) tels que \(q \rightarrow^u q_F\)

Remarque : un état utile est accessible et co-accessible

Un état qui n'est pas accessible n'est jamais atteint lors d'un calcul depuis l'état \(q_0\), il est donc inutile.
Un calcul qui atteint un état qui n'est pas co-accessible n'aboutira jamais à un état final.

Le calcul des états accessibles peut s'obtenir simplement en réalisant un parcours de graphe depuis l'état \(q_0\), en igonorant les étiquettes des transitions.

Le calcul des états co-accessibles peut s'obtenir de la même manière, en inversant le sens des transitions et en exécutant un parcours à partir de chaque état final.

Proposition

Soit \(L\) un langage reconnaissable par automate fini déterministe, alors il existe un automate fini déterministe \(A\) qui reconnaît \(L\) et dont tous les états sont accessibles et co-accessibles.

Démonstration

Il suffit de calculer tous les états accessibles et co-accessibles d'un automate reconnaissant \(L\), puis de lui supprimer les états qui ne le sont pas. Ce faisant, on supprime bien sûr les transitions qui partent ou qui pointent d'un état supprimé. Comme un calcul réussi passe nécessairement par des états accessibles et co-accessibles, cela ne change pas le langage reconnu par l'automate.

Vocabulaire

Lorsqu'on élimine les états non accessibles et non co-accessibles d'un automate, on dit qu'on émonde cet automate.

Exemple

Considérons l'automate :

Les états accessibles sont : \(q_0, q_1, q_2, q_3, q_4\)

Les états co-accessibles sont \(q_0, q_1, q_2, q_3, q_5\)

Les états \(q_4\) et \(q_5\) sont donc inutiles.

Si on émonde l'automate on obtient :

B. Complétion d'un automate

Définition (automate complet)

Soit \(A = (Q, q_0, \delta, F)\) un automate fini déterministe. On dit que cet automate est complet lorsque \(\delta(q, c)\) est défini pour tout état \(q \in Q\) et toute lettre \(c \in \Sigma\).

Dans un automate complet, il n'y a jamais de blocage.

Proposition

Soit \(L\) un langage reconnaissable par automate fini déterministe, alors il existe un automate fini déterministe complet \(A\) qui reconnaît \(L\).

Démonstration

Soit \(A = (Q, q_0, \delta, F)\) un automate qui reconnaît \(L\) et qui n'est pas déjà complet. On construit l'automate \(A' = (Q', q_0, \delta', F)\) avec \(Q' = Q \cup \{q_\infty\}\) où \(q_\infty\) est un nouvel état (\(q_\infty \not \in Q\).) appelé état puits. On définit \(\delta'\) ainsi :

\[ \forall q \in Q',\ \forall c \in \Sigma, \delta'(q, c) = \begin{cases} \delta(q, c) & \text{si c'est défini}\\ q_\infty & \text{sinon} \end{cases} \]

Alors \(A'\) est complet et de plus \(\mathcal{L}(A) = \mathcal{L}(A')\). En effet :

si \(u \in \mathcal{L}(A)\) alors il existe un calcul dans \(A\) étiqueté par \(u\) mentant de l'état \(q_0\) à un état final. Ce calcul existe donc aussi dans \(A'\), donc \(u \in \mathcal{L}(A')\).
réciproquement, si \(u \in \mathcal{L}(A')\) alors il existe un calcul dans \(A'\) étiqueté par \(u\) menant de l'état \(q_0\) à un état final. Comme \(q_\infty\) n'est pas co-accessible, ce calcul ne passe pas par \(q_\infty\) et c'est donc aussi un calcul dans \(A\), donc \(u \in \mathcal{L}(A)\).

Point méthode

Pour compléter un automate (qui n'est pas déjà complet) :

On ajoute un état puits \(q_\infty\)
Pour tout état, on ajoute toutes les transitions sortantes manquantes, en les faisant pointer vers \(q_\infty\)
On n'oublie pas de réaliser l'étape 2 aussi pour l'état puits \(q_\infty\)

Exemple

Soit l'automate suivant sur \(\Sigma = \{a, b\}\) qui n'est pas complet:

En appliquant l'algorithme de complétion, on obtient :

Attention

On peut émonder un automate, on peut compléter un automate, mais on ne peut pas toujours faire les deux opérations à la fois puisque l'état puits que l'on ajoute dans la complétion n'est pas co-accessible.

C. Automate complémentaire

Soit \(\Sigma\) un alphabet et \(L\) un langage, on note \(\bar{L} = \{u \in \Sigma^*, u \not \in L\}\) le langage complémentaire de L.

Proposition

Si \(L\) est un langage reconnaissable par automate fini déterministe alors \(\bar{L}\) l'est aussi.

Démonstration

Soit \(L\) un langage reconnu par l'automate fini déterministe \(A\). On donne un algorithme pour construire un automate fini déterministe \(A'\) qui reconnaît \(\bar{L}\).

On commence par compléter l'automate \(A\) et on obtient un automate complet \(A_c = (Q, q_0, \delta, F)\) qui reconnaît \(L\).
On construit alors \(A'\) en inversant les états finaux et non finaux dans \(A_c\) c'est-à-dire que \(A_c = (Q, q_0, \delta, Q \setminus F)\).

On a alors \(\mathcal{L}(A') = \bar{L}\), en effet pour tout \(u \in \Sigma^*\):

\[ \begin{align} u \in \mathcal{L}(A') & \Leftrightarrow \delta^*(q_0, u) \in Q \setminus F \\ & \Leftrightarrow \delta^*(q_0, u) \not \in F \\ & \Leftrightarrow u \not \in \mathcal{L}(A_c) \quad \text{ car } A_c \text{ est complet} \\ & \Leftrightarrow u \not \in \mathcal{L}(A) \\ & \Leftrightarrow u \not \in L\\ & \Leftrightarrow u \in \bar{L} \end{align} \]

Dans la démonstration, on remarque l'importance de compléter l'automate : cela permet de n'avoir qu'une seule cause de non non-accceptation à savoir le fait que la lecture du mot aboutit dans un état non final.

Point méthode

Pour construire un automate fini déterministe \(A'\) reconnaissant le complémentaire de \(\mathcal{L}(A)\), on applique les étapes :

On complète \(A\)
On inverse les états finaux et non finaux

Exemple : mots qui ne commencent pas par \(aba\)

Soit l'automate suivant sur \(\Sigma = \{a, b\}\) reconnaissant les mots qui commencent par \(aba\) :

On souhaite construire l'automate complémentaire c'est-à-dire un automate qui reconnaît les mots qui ne commencent pas par \(aba\). On commence par compléter l'automate :

Puis, on inverse les états finaux et non finaux :

Encore une fois, on peut constater sur l'exemple que l'oubli de l'étape de complétion donne un automate complémentaire faux.

D. Automate produit

L'automate produit de deux automates \(A_1\) et \(A_2\) est un automate qui fait calculer simultanément \(A_1\) et \(A_2\). On le définit ainsi :

Définition (automate produit)

Soit \(A_1 = (Q_1, q_0^1, \delta_1, F_1)\) et \(A_2 = (Q_2, q_0^2, \delta_2, F_2)\) deux automates finis déterministes. On définit l'automate produit de \(A_1\) et \(A_2\), noté \(A = A_1 \times A_2\), par \(A = (Q, q_0, \delta, F)\) avec :

\(Q = Q_1 \times Q_2\) : les états sont des couples \((q_1, q_2)\) qui décrivent l'état actuel des automates \(A_1\) et \(A_2\)
\(q_0 = (q_0^1, q_0^2)\)
\(F = F_1 \times F_2\) : un état est final si les deux automates \(A_1\) et \(A_2\) sont dans un état final
Pour tout \(q_1 \in Q_1\), \(q_2 \in Q_2\) et \(c \in \Sigma\), \(\delta((q_1, q_2), c)\) n'est défini que lorsque \(\delta_1(q_1, c)\) et \(\delta_2(q_2, c)\) sont définis, c'est-à-dire qu'aucun des deux automates \(A_1\) et \(A_2\) ne bloque. Dans ce cas, on pose :

\[ \delta((q_1, q_2), c) = \left( \delta_1(q_1, c), \delta_2(q_2, c) \right) \]

Il résulte de cette définition que l'automate produit accepte uniquement les mots qui sont acceptés par \(A_1\) et \(A_2\).

Exemple : mots qui commencent par \(aba\) ayant un nombre pair de \(b\)

On souhaite construire un automate qui reconnaît les mots sur \(\Sigma =\{a, b\}\) qui commencent par \(aba\) et qui contiennent un nombre pair de \(b\). Pour cela on part des deux automates suivants \(A_1\) et \(A_2\) :

Mots qui contiennent un nombre pair de b

Le langage reconnu par \(A_1\) est l'ensemble des mots qui commencent par \(aba\) et celui de \(A_2\) est l'ensemble des mots ayant un nombre pair de \(b\). Pour alléger les écritures dans la construction de l'automate produit on a noté avec des lettres capitales les états de \(A_1\) et des numéros pour les états de \(A_2\).

Pour construire l'automate produit, on ne représente en général que les états accessibles, les autres états étant inutiles. On procède donc en partant de l'état initial \((A, 0)\) et en construisant de proche en proche les états rencontrés. On obtient :

Cet automate reconnaît les mots qui commencent par \(aba\) et qui contiennent un nombre pair de \(b\). Remarquons encore une fois que l'on n'a pas représenté les états non accessibles (\((A, 1)\), \((B, 1)\) et \((C, 0)\)) bien qu'ils fassent partie de la définition de l'automate produit.

On constante sur l'exemple précédent que l'automate produit reconnaît les mots qui sont reconnus par les deux automates à la fois. Démontrons maintenant formellement ce résultat.

Proposition

Soit \(A_1\) et \(A_2\) deux automates finis déterministes et \(A_1 \times A_2\) leur automate produit, alors :

\[ \mathcal{L}(A_1 \times A_2) = \mathcal{L}(A_1) \cap \mathcal{L}(A_2) \]

Démonstration

Nous allons d'abord démontrer par récurrence la propriété suivante :

\[ P(n) : \quad \forall u \in \Sigma^n,\ \forall q_1 \in Q_1,\ \forall q_2 \in Q_2,\ \delta^*((q_1, q_2), u) = \left( \delta_1^*(q_1, u), \delta_2^*(q_2, u) \right) \text{ (sous réserve d'existence)} \]

Initialisation : pour tout couple d'états \((q_1, q_2)\), on a \(\delta^*((q_1, q_2), \varepsilon) = (q_1, q_2) = (\delta_1^*(q_1, \varepsilon), \delta_2^*(q_2, \varepsilon))\)
Hérédité : On suppose \(P(n)\) vrai et on montre \(P(n+1)\). Soit \(u\) un mot de longueur \(n+1\) que l'on décompose en \(u = v.c\) avec \(c \in \Sigma\) et \((q_1, q_2)\) un couple d'états. Alors on a (sous réserve d'existence) :

\[ \begin{align} \delta^*((q_1, q_2), u) &= \delta^*((q_1, q_2), vc) \\ &= \delta(\delta^*((q_1, q_2), v), c) \\ &= \delta\left((\delta_1^*(q_1, v), \delta_2^*(q_2, v)), c\right) \text{ par hypothèse de récurrence} \\ &= \left( \delta_1(\delta_1^*(q_1, v), c), \delta_2(\delta_2^*(q_2, v), c)\right) \text{ par définition de l'automate produit}\\ &= (\delta_1^*(q_1, vc), \delta_2^*(q_2, vc)) \\ &= (\delta_1^*(q_1, u), \delta_2^*(q_2, u))\\ \end{align} \]

Puis pour tout mot \(u \in \Sigma^*\) on a :

\[ \begin{align*} u \in \mathcal{L}(A_1 \times A_2) &\Leftrightarrow \delta^*(q_0, u) \in F\\ &\Leftrightarrow \delta^*((q_0^1, q_0^2), u) \in F \\ &\Leftrightarrow (\delta_1^*(q_0^1, u), \delta_2^*(q_0^2, u)) \in F \text{ d'après la propriété démontrée ci-dessus}\\ &\Leftrightarrow (\delta_1^*(q_0^1, u), \delta_2^*(q_0^2, u)) \in F_1 \times F_2\\ &\Leftrightarrow \delta_1^*(q_0^1, u) \in F_1 \text { et } \delta_2^*(q_0^2, u) \in F_2 \\ &\Leftrightarrow u \in \mathcal{L}(A_1) \text { et } u \in \mathcal{L}(A_2) \\ &\Leftrightarrow u \in \mathcal{L}(A_1) \cap \mathcal{L}(A_2) \end{align*} \]

Donc \(\mathcal{L}(A_1 \times A_2) = \mathcal{L}(A_1) \cap \mathcal{L}(A_2)\)

Corollaire

Si \(L_1\) et \(L_2\) sont des langages reconnaissables par automate alors \(L_1 \cap L_2\) est aussi reconnaissable par automate.

Remarque

Si \(A_1\) possède \(n\) états et \(A_2\) possède \(m\) états alors \(A_1 \times A_2\) possède \(nm\) états. Même si tous ces états ne sont pas nécessairement accessibles, dans le pire cas, on peut aboutir à de grands automates avec cette construction.

Attention

Calculer un automate produit à la main nécessite une grande concentration. L'algorithme est facile à appliquer mais la moindre petite erreur conduit à un automate complètement faux. Vérifiez bien votre résultat en faisant calculer votre automate produit sur des mots tests.

Exercice

Donner un automate \(A_1\) reconnaissant les mots sur \(\Sigma = \{a, b\}\) ayant un nombre impair de \(a\).
Donner un automate \(A_2\) reconnaissant les mots sur \(\Sigma = \{a, b\}\) dont le nombre de \(b\) est de la forme \(3k + 1\) avec \(k \in \mathbb{N}\)
En déduire un automate \(A\) qui reconnaît les mots sur \(\Sigma = \{a, b\}\) ayant un nombre impair de \(a\) et un nombre de \(b\) de la forme \(3k + 1\).

3. Automates finis non déterministes

Les automates finis déterministes sont simples et faciles à implémenter sur ordinateur. L'inconvénient principal est qu'ils peuvent être difficile à concevoir d'un point de vue humain.

Prenons l'exemple du langage \(L\) sur \(\Sigma = \{a, b\}\) des mots qui finissent par \(ababa\). Écrire une expression régulière qui dénote \(L\) est très facile : \(e = (a|b)*ababa\). Par contre, concevoir un automate fini déterministe qui reconnaît ce langage est nettement plus complexe, comme on l'a vu dans l'exemple plus haut.

On aimerait dessiner un automate simple ayant cette allure :

Dans cet automate on lit un certain nombre de lettres \(a\) ou \(b\) en bouclant sur l'état initial, puis on termine la lecture en lisant \(ababa\).

Malheureusement, cette figure ne correspond pas à celle d'un automate fini déterministe. En effet \(\delta(q_0, a)\) aurait 2 images, ce qui est impossible pour une fonction... Une autre façon de le dire est que lorsqu'on est dans l'état \(q_0\) et qu'on lit un \(a\), on ne sait pas s'il faut aller en \(q_1\) ou rester en \(q_0\) : cet automate est non déterministe.

Nous allons voir dans cette partie qu'il est tout à fait possible de travailler avec ce type de machine non déterministe.

A. Définition

Définition (automate fini non déterministe)

Un automate fini non déterministe est un quadruplet \(A = (Q, I, F, T)\) dans lequel :

\(Q\) est l'ensemble fini des états
\(I \subset Q\) est l'ensemble des états initiaux
\(F \subset Q\) est l'ensemble des états finaux
\(T \subset Q \times \Sigma \times Q\) est l'ensemble des transitions

On remarque deux différences par rapport aux automates finis déterministes : 1. La possibilité d'avoir plusieurs états initiaux (on démarre de manière non déterministe). 2. Les transitions qui sont notées sont forme de triplets : le triplet \((q, c, q')\) signifie que l'automate peut transiter de \(q\) à \(q'\) en listant la lettre \(c\). Ce que l'on notera \(q \rightarrow^c q'\) comme on l'a fait avec les automates déterministes.

Un automate déterministe est un automate non déterministe

On peut toujours voir un automate fini déterministe \(A = (Q, q_0, \delta, F)\) comme un automate fini non déterministe. Dans ce cas :

L'ensemble d'états initiaux est le singleton \(I = \{q_0\}\).
On peut construire \(T\) itérativement. Pour tout état \(q \in Q\) et toute lettre \(c \in \Sigma\), si \(\delta(q, c)\) est défini alors on a ajoute la transition \((q, c, \delta(q, c))\) dans \(T\).

La plupart du temps on fera l'abus et on dira qu'un automate déterministe n'est qu'un cas particulier d'automate non déterministe.

Exemple

L'automate non déterministe ci-dessus

est défini par \(A = (Q, I, F, T)\) avec :

\(Q = \{q_0, q_1, q_2, q_3, q_4, q_5\}\)
\(I = \{q_0\}\)
\(F = \{q_5\}\)
\(T = \{(q_0, a, q_0), (q_0, b, q_0), (q_0, a, q_1), (q_1, b, q_2), (q_2, a, q_3), (q_3, b, q_4), (q_4, a, q_5)\}\)

B. Calcul non déterministe

Il y a deux façons de voir le calcul dans un automate non déterministe :

vision clonage : à chaque fois qu'on est confronté à un choix non déterministe, on imagine que le processus se clone, chaque clone envisage une des possibilités offertes. Si l'un des clones réussit le calcul, alors le calcul est considéré réussi.
vision oracle : si à chaque fois qu'on est confronté à un choix non déterminsite, il existe un oracle capable de me dire le bon chemin qui me mènera vers un calcul réussi, alors le calcul est réussi.

Ces deux visions sont équivalentes, mais il est peut-être plus simple de comprendre la première. Formalisons cela, en définissant la fonction de transition \(\delta\) puis la fonction de transition étendue \(\delta^*\) d'un automate non déterministe.

Définition (fonction de transition d'un automate non déterministe)

Soit \(A = (Q, I, F, T)\) un automate fini non déterministe, alors sa fonction de transition est l'application \(\delta : Q \times \Sigma \to \mathfrak{P}(Q)\) définie par :

\[ \forall q \in Q, \ \forall c \in \Sigma, \ \delta(q, c) = \{ q' \in Q, (q, c, q') \in T\} \]

Ainsi \(\delta(q, c)\) donne l'ensemble des états qu'on peut atteindre en lisant \(c\) depuis \(q\). Notons que contrairement aux automates non déterministes \(\delta\) est cette fois une application, c'est-à-dire définie sur \(Q \times \Sigma\) en entier. La notion de blocage correspond donc au cas où \(\delta(q, c) = \varnothing\).

Définiton (fonction de transtion étendue)

Soit \(A = (Q, I, F, T)\) un automate fini non déterministe. La fonction de transtion étendue est l'application \(\delta^* : Q \times \Sigma^* \to \mathfrak{P}(Q)\) définie par :

\[ \forall q \in Q,\ \begin{cases} \delta^*(q, \varepsilon) = \{q\} \\ \forall v \in \Sigma^*, \ \forall c \in \Sigma, \delta^*(q, v.c) = \displaystyle \bigcup_{q' \in \delta^*(q, v)} \delta(q', c)\\ \end{cases} \]

Cette fonction doit se comprendre ainsi : \(\delta^*(q, u)\) est l'ensemble des états atteints par mes clones (ou moi) lorsque je pars de l'état \(q\) et que je lis \(u\). Dans la définition pour calculer \(\delta^*(q, v.c)\), on commence par regarder tous les états \(q'\) atteints par mes clones (ou moi) lors de la lecture de \(v\), puis pour chacun de ces états on ajoute au résultat les états qu'on peut atteindre en lisant la dernière lettre \(c\).

Exemple de calcul

Reprenons l'automate censé reconnaître les mots finissant par \(ababa\) :

et effectuons le calcul pas à pas de \(\delta^*(q_0, abab)\) (lecture de \(abab\) depuis \(q_0\)) :

\(\delta^*(q_0, \varepsilon) = \{q_0\}\)
\(\delta^*(q_0, a) = \{q_0, q_1\}\)
\(\delta^*(q_0, ab) = \{q_0, q_2\}\)
\(\delta^*(q_0, aba) = \{q_0, q_1, q_3\}\)
\(\delta^*(q_0, abab) = \{q_0, q_2, q_4\}\)

Ainsi lorsque je lis \(abab\) depuis \(q_0\) je peux me retrouver au choix en \(q_0\), en \(q_2\) ou en \(q_4\).

Proposition

Pour tout mot \(u \in \Sigma^*\), pour tout états \(q, q' \in Q\), \(q' \in \delta^*(q, u)\) si et seulement s'il existe au moins un chemin dans l'automate menant de \(q\) à \(q'\) et étiqueté par \(u\).

Démonstration

La démonstration par récurrence sur la longueur du mot \(u\) est laissée en exercice au lecteur ou à la lectrice.

Cette proposition nous invite naturellement à noter \(q \rightarrow^u q'\) lorsque \(q' \in \delta^*(q, u)\). Cela coïncide avec nos notations pour les automates déterministes.

C. Langage reconnu

Nous pouvons maintenant décrire les mots acceptés par un automate non déterministe.

Définition (mot reconnu)

Soit \(A = (Q, I, F, T)\) un automate fini non déterministe. Un mot \(u \in \Sigma^*\) est reconnu (on dit aussi accepté) par \(A\) lorsqu'il existe au moins un état initial \(q_0 \in I\) tel que \(\delta^*(q_0, u)\) contienne au moins un état final. Autrement dit :

\[ u \text{ accepté } \Leftrightarrow \exists q_0 \in I, \ \delta^*(q_0, u) \displaystyle \cap F \not = \varnothing \]

Deux autres façons de dire la même chose : 1. Un mot \(u\) est accepté s'il existe au moins un chemin dans \(A\) menant d'un état initial à un état final et etiqueté par \(u\). 2. Un mot \(u\) est accepté si l'un de mes clones (avec un clone par état initial ininitialement) aboutit sur un état final lors de la lecture de \(u\).

Définition (langage reconnu)

Soit \(A = (Q, I, F, T)\) un automate fini déterministe. Le langage reconnu (aussi appelé langage accepté) par l'automate \(A\), noté \(\mathcal{L}(A)\) est :

\[ \mathcal{L}(A) = \{ u \in \Sigma^*, A \text{ accepte } u \} \]

D. Déterminisation

Nous venons de définir les automates finis non déterministes et décrire leur fonctionnement. Deux questions se posent naturellement :

L'avantage des automates était la simplicité de mise en oeuvre sur machine et l'efficacité du calcul. Or, on vient de perdre les deux avantages : le calcul nécessite maintenant de mémoriser une liste d'états, de plus le calcul \(\delta^*(q, u)\) est maintenant de complexité exponentielle en \(|u|\) alors qu'elle était linéaire pour les automates finis déterministes.
Les langages reconnaissables par automate fini non déterministes sont-ils les mêmes que ceux reconnus par automate fini déterministe ? N'a-t-on pas créé une machine plus puissante en introduisant le non déterminisme ?

La réponse à la seconde question est remarquablement : non. Nous allons voir dans cette partie que les automates non déterministes ont la même puissance d'expression que les automates non déterministes.

Définition (Automate des parties)

Soit \(A = (Q, I, F, T)\) un automate fini non déterministe, on définit l'automate fini déterministe \(A_p = (Q_p, q_0, F_p, \delta_p)\) suivant :

\(Q_p = \mathfrak{P}(Q)\)
\(q_0 = I\)
\(F_p = \{ X \subset Q, X \cap F \not = \varnothing\}\)
\(\delta(X, c) = \displaystyle \bigcup_{x \in X} \delta(x, c)\) où \(\delta\) est la fonction de transtion de \(A\)

Cet automate est appelé automate des parties car ses états sont des parties de l'ensemble d'états \(Q\).

Point méthode : algorithme de déterminisation

Pour calculer \(A_p\) à partir de \(A\), on procède pas à pas en ne représentant que les états accessibles.

On commence par introduire l'état \(q_0 = I\).
Pour chaque état \(X\) non traité, pour chaque lettre \(c \in \Sigma\), on calcule \(\displaystyle\cup_{x \in X} \delta(x, c)\), c'est-à-dire les états qu'on peut atteindre depuis \(X\) en lisant une lettre \(c\).
On dessine les nouveaux états et les nouvelles transitions obtenus.
On recommence avec les états non traités.

Il peut être agréable représenter cette démarche sous forme d'une table.

Exemple : déterminisation d'un automate

On veut déterminiser l'automate qui reconnaît les mots qui finissent par \(ababa\), c'est-à-dire calculer son automate des parties. Pour alléger les écritures, on a noté \(\{0, 1, 2, 3, 4, 5\}\) l'ensemble d'états :

On construit pas à pas la table des transitions comme expliqué dans le point méthode :

états \(X\)	lettre \(c\)	arrivée \(\delta_p(X, c)\)
\(\{0\}\)	\(a\)	\(\{0, 1\}\)
\(\{0\}\)	\(b\)	\(\{0\}\)
\(\{0, 1\}\)	\(a\)	\(\{0, 1\}\)
\(\{0, 1\}\)	\(b\)	\(\{0, 2\}\)
\(\{0, 2\}\)	\(a\)	\(\{0, 1, 3\}\)
\(\{0, 2\}\)	\(b\)	\(\{0\}\)
\(\{0, 1, 3\}\)	\(a\)	\(\{0, 1\}\)
\(\{0, 1, 3\}\)	\(b\)	\(\{0, 2, 4\}\)
\(\{0, 2, 4\}\)	\(a\)	\(\{0, 1, 3, 5\}\)
\(\{0, 2, 4\}\)	\(b\)	\(\{0\}\)
\(\{0, 1, 3, 5\}\)	\(a\)	\(\{0, 1\}\)
\(\{0, 1, 3, 5\}\)	\(b\)	\(\{0, 2, 4\}\)

On obtient l'automate suivant qui est isomorphe à l'automate obtenu lorsqu'on a voulu directement concevoir un automate déterministe pour ce langage. Il reconnaît donc aussi les mots qui finissent par \(ababa\).

Encore une fois remarquons qu'on n'a représenté que les états accessibles de l'automate des parties qui en contient réellement \(2^6 = 64\) dans cet exemple.

Proposition

Soit \(A\) un automate fini non déterministe, soit \(A_p\) son automate des parties alors :

\[ \mathcal{L}(A) = \mathcal{L}(A_p) \]

Démonstration

On montre par récurrence sur la longueur du mot que pour tout mot \(u \in \Sigma^*\) et pour tout ensemble d'états \(X \subset Q\), \(\delta_p^*(X, u) = \displaystyle\bigcup_{x \in X} \delta^*(x, u)\). Ainsi avec l'ensemble de départ \(q_0\) choisi le calcul dans l'automate des parties nous donne l'ensemble des états qu'on peut atteindre par la lecture de \(u\) dans \(A\) depuis un des états initiaux. L'ensemble \(F_p\) est choisi de telle sorte à ce \(A_p\) n'accepte cet ensemble d'états que lorsqu'il contient au moins un état final.

Corollaire

La classe des langages sur \(\Sigma\) reconnaissables par automate fini déterministe et par automate fini non déterministe sont les mêmes. On notera \(\rec{\Sigma}\) l'ensemble des langages reconnaissables par automate (déterministe ou non).

La conclusion de cette partie est que les automates non déterministes reconnaissent exactement les mêmes langages que les automates déterministes. Si on veut un automate déterministe pour reconnaître efficacement un langage en machine, on peut le concevoir de manière non-déterministe puis lui appliquer l'algorithme de déterminisation. Évidemment cet algorithme est très coûteux dans le pire cas, car il peut produire \(2^{|Q|}\) états. Cependant on ne réalise cette étape qu'une seule fois, on peut ensuite utiliser l'automate déterministe obtenu autant de fois que voulu.

4. Langages non reconnaissables par automate

Il existe des langages qui ne peuvent pas être reconnus par un automate fini. Le théorème suivant permet de démontrer que certains langages ne sont pas reconnaissables.

Théorème (Lemme de l'étoile)

Soit \(L\) un langage reconnu par un automate à \(N\) états. Soit \(u \in L\) un mot de longueur \(|u| \geq N\), alors il existe 3 mots \(x, y, z \in \Sigma^*\) tels que \(u\) se décompose en \(u = xyz\) et vérifiant :

\(|xy| \leq N\)
\(y \neq \varepsilon\)
\(\forall k \in \mathbb{N},\ xy^kz \in L\)

Démonstration

Soit \(L\) un langage reconnu par un automate \(A = (Q, q_0, F, \delta)\) à \(N\) états et \(u \in L\) un mot de longueur \(|u| \geq N\). Notons \(p_k\) (\(0 \leq k \leq N\)) le préfixe de \(u\) de longeur \(k\). On considère l'application

\[ \begin{align} \varphi : [|0, N|] &\to Q \\ k &\mapsto \delta^*(q_0, p_k)\\ \end{align} \]

Remarquons que cette application est bien définie, car \(u\) est reconnu par \(A\) donc il n'y a pas de blocage à la lecture des préfixes de \(u\).

Comme \(\text{Card}([|0, N|]) = N+1\) et \(\text{Card}(Q) = N\), l'application \(\varphi\) n'est pas injective. Il existe donc deux entiers \(0 \leq k_1 < k_2 \leq N\) tels que \(\varphi(k_1) = \varphi(k_2)\). Informellement, cela signifie que la lecture de \(u\) depuis l'état \(q_0\) va conduire au passage par un même état à deux instants \(k_1\) et \(k_2\) distincts. Notons \(q' = \varphi(k_1)\) cet état qui est visité au moins deux fois.

On pose alors \(x = p_{k_1}\), \(y\) tel que \(xy = p_{k_2}\) et \(z\) tel que \(xyz = u\). On a alors \(\delta^*(q_0, x) = \delta^*(q_0, xy) = q'\). Vérifions que cette décomposition fonctionne :

\(|xy| = |p_{k_2}| = k_2 \in [|0, N|]\)
Si \(y = \varepsilon\) alors \(x = xy\) ce qui implique \(k_1 = k_2\), c'est exclus.
On montre par récurrence sur \(k\) que \(\delta^*(q_0, xy^kz) = \delta^*(q_0, u)\) ce qui montre que \(xy^kz\) est reconnu car \(u\) l'est.

a. Initialisation : \(\delta^*(q_0, xz) = \delta^*(\delta^*(q_0, x), z) = \delta^*(q', z) = \delta^*(\delta^*(q_0, xy), z) = \delta^*(q_0, xyz)\)

b. Hérédité : on suppose la propriété vraie au rang \(k \in \mathbb{N}\), montrons-là au rang \(k+1\) :

\[ \begin{align} \delta^*(q_0, xy^{k+1}z) &= \delta^*(\delta^*(\delta^*(q_0, xy), y^k), z) = \delta^*(\delta^*(q', y), z) \\ &= \delta^*(\delta^*(\delta^*(q_0, x), y^k), z) = \delta^*(q_0, xy^kz)\\ &= \delta^*(q_0, xyz) \text{ par hypothèse de récurrence} \end{align} \]

Savoir démontrer qu'un langage n'est pas reconnaissable ne s'improvise pas et il faut étudier attentivement les méthodes permettant d'obtenir ce résultat.

Point méthode : démontrer qu'un langage \(L\) n'est pas reconnaissable avec le lemme de l'étoile

On suppose par l'absurde que \(L\) est reconnu par un automate à \(N\) états.
On choisit judicieusement un mot \(u \in L\) particulier de longueur \(|u| \geq N\)
On invoque le Lemme de l'étoile ce qui nous permet d'obtenir la décompostion \(u = xyz\).
À l'aide des propriétés (1), (2) et (3) du lemme de l'étoile, on aboutit à une absurdité.

Exemple clé : \(\{a^n b^n, n \in \mathbb{N}\}\)

Démontrons que langage \(L = \{a^nb^n, n \in \mathbb{N}\}\) n'est pas reconnaissable.

Supposons par l'absurde que \(L\) soit reconnaissable et qu'il est reconnu par un automate à \(N\) états.
Considérons le mot \(u = a^N b^N\), alors \(u \in L\) et \(|u| = 2N \geq N\).
D'après le lemme de l'étoile, il existe donc 3 mots \(x, y, z \in \mathbb{N}\) tels que
1. \(|xy| \leq N\)
2. \(y \neq \varepsilon\)
3. \(\forall k \in \mathbb{N},\ xy^kz \in L\)
D'après (a), \(x\) et \(y\) ne contiennent que des lettres \(a\). De plus, d'après (b), \(y\) contient au moins un \(a\). D'après (c), on doit avoir \(|xy^kz|_a = |xy^kz|_b\) pour tout \(k \in \mathbb{N}\) car les mots de \(L\) contiennent autant de \(a\) que de \(b\). Ceci est absurde, car d'après nos remarques :

\[ |xy^kz|_a = |x|_a + k\underbrace{|y|_a}_{> 0} + |z|_a \]

\[ |xy^kz|_b = |x|_b + |y^k|_b + |z|_b = |z|_b \]

La première quantité croît strictement lorsque \(k\) croît tandis que la seconde reste constante. C'est absurde. Donc \(L\) n'est pas reconnaissable.

Point méthode : démontrer qu'un langage \(L\) n'est pas reconnaissable en utilisant les propriétés de clôture

Pour utiliser cette méthode, il faut exploiter un langage \(L_2\) dont on sait déjà qu'il n'est pas reconnaissable (hypothèse de l'énoncé ou on l'a démontré avant).

On suppose par l'absurde que \(L\) est reconnaissable.
On montre que \(L_2\) peut s'obtenir à partir de \(L\) et d'autres langages reconnaissables en utilisant des opérations qui préservent le caractère reconnaissable (complémentaire, intersection finie, union finie, ...)
On en déduit que \(L_2\) est reconnaissable : c'est absurde.

Exemple clé : \(\{ u \in \{a,b\}^*, |u|_a = |u|_b \}\)

Montrons que \(L = \{ u \in \{a,b\}^*, |u|_a = |u|_b \}\) n'est pas reconnaissable. On sait que le langage \(L_2 = \{a^n b^n, n \in \mathbb{N} \}\) n'est pas reconnaissable (exemple précédent).

Supposons par l'absurde que \(L\) est reconnaissable.
On pose \(K\) le langage dénoté par \(a^*b^*\), il est reconnaissable (il est facile de proposer un automate). On remarque de plus que \(L \cap K = L_2\).
Comme l'intersection de deux langages reconnaissable est reconnaissable, on en déduit que \(L_2\) est reconnaissable : c'est absurde.

Cette seconde méthode, quand on peut l'appliquer, permet de gagner du temps en évitant d'invoquer le lemme de l'étoile. La lectrice pourra vérifier qu'on peut aussi résoudre ce deuxième exemple en utilisant la première méthode.

Raisonnements faux usuels

On retrouve souvent les raisonnements faux suivants :

Une sous-partie d'un langage non reconnaissable est non reconnaissable : \(L \subset L'\) avec \(L'\) non reconnaissable donc \(L\) est non reconnaissable.
Si je contiens une partie non reconnaissable alors je suis non reconnaissable : \(L' \subset L\) avec \(L'\) non reconnaissable donc \(L\) est non reconnaissable.

Dans le premier cas, cela montrerait par exemple que \(\varnothing\) n'est pas reconnaissable. Dans le second cas, si on prend \(L = \Sigma^*\) on obtiendrait que \(\Sigma^*\) n'est pas reconnaissable.

A RETENIR : les raisonnements par inclusion sont faux dans ce contexte