htmlspecialchars

(PHP 3, PHP 4 , PHP 5)

htmlspecialchars --  Convertit les caractères spéciaux en entités HTML

Description

string htmlspecialchars ( string string [, int quote_style [, string charset]] )

Certains caractères ont des significations spéciales en HTML, et doivent être remplacés par des entités HTML pour être affichés. htmlspecialchars() remplace tous ces caractères par leur équivalent dans la chaîne string. Cette conversion est très pratique pour la programmation web. Si vous devez remplacer tous les caractères, utilisez plutôt htmlentities() à la place.

htmlspecialchars() est pratique pour éviter que des données fournies par les utilisateurs contiennent des balises HTML, comme pour un forum ou un chat. Cette fonction prend un deuxième argument optionnel, qui indique comment doivent être traités les guillemets doubles et simples. Vous pouvez utiliser l'une des constantes suivantes : ENT_COMPAT, la constante par défaut, va convertir les guillemets doubles, et ignorer les guillemets simples; ENT_QUOTES va convertir les guillemets doubles et les guillemets simples; ENT_NOQUOTES va ignorer les guillemets doubles et les guillemets simples.

Les remplacements effectués sont :

Exemple 1. Exemple avec htmlspecialchars()

<?php
$new
= htmlspecialchars("<a href='test'>Test</a>", ENT_QUOTES);
echo
$new;
// &lt;a href=&#039;test&#039;&gt;Test&lt;/a&gt;
?>

Notez que cette fonction ne fait aucun autre remplacement que ceux qui sont listés ci-dessus. Pour faire un remplacement total, voyez plutôt htmlentities(). Le support pour le second argument optionnel a été ajouté en PHP 3.0.17 et PHP 4.0.3.

cette fonction prend un troisième argument optionnel qui définit le jeux de caractères utilisé durant la conversion. Le jeu de caractères par défaut est ISO-8859-1. Le support de cet argument a été ajouté en PHP 4.1.0.

Les jeux de caractères suivantes sont disponibles et supportés par PHP 4.3.0 et plus récent.

Tableau 1. Jeux de caractères supportés

Jeux de caractèresAliasDescription
ISO-8859-1ISO8859-1 Europe occidentale, Latin-1
ISO-8859-15ISO8859-15 Europe occidentale, Latin-9. Dispose du signe Euro, des caractères spéciaux français et finlandais, qui manque au Latin-1(ISO-8859-1).
UTF-8  Unicode 8 bits multi octets, compatible avec l'ASCII
cp866ibm866, 866 Jeux de caractères Cyrillic spécifique à DOS. Ce jeux de caractères est supporté depuis PHP 4.3.2.
cp1251Windows-1251, win-1251, 1251 Jeux de caractères Cyrillic spécifique à Windows. Ce jeux de caractères est supporté depuis PHP 4.3.2.
cp1252Windows-1252, 1252 Jeux de caractères spécifique de Windows pour l'Europe occidentale.
KOI8-Rkoi8-ru, koi8r Russe. Ce jeux de caractères est supporté depuis PHP 4.3.2.
BIG5950 Chinois traditionnel, principalement utilisé à Taiwan.
GB2312936 Chinois simplifié, officiel.
BIG5-HKSCS  Big5 avec les extensions de Hong Kong, chinois traditionnel.
Shift_JISSJIS, 932 Japonais
EUC-JPEUCJP Japonais

Note : Les autres jeux de caractères ne sont pas reconnus, et le ISO-8859-1 sera utilisé à la place.

Voir aussi get_html_translation_table(), strip_tags(), htmlentities() et nl2br().