get_html_translation_table
(PHP 4, PHP 5)
get_html_translation_table — Gibt die Umwandlungs-Tabelle zurück, die von htmlspecialchars() und htmlentities() verwendet wird
Beschreibung
$table = HTML_SPECIALCHARS
[, int $flags = ENT_COMPAT | ENT_HTML401
[, string $encoding = "UTF-8"
]]] )get_html_translation_table() gibt die Umwandlungs-Tabelle zurück, die intern in den Funktionen htmlspecialchars() und htmlentities() verwendet wird.
Hinweis:
Sonderzeichen können auf unterschiedliche Weise kodiert werden. " kann kodiert werden als ", " oder ". get_html_translation_table() gibt nur die von htmlspecialchars() und htmlentities() genutze Form zurück.
Parameter-Liste
-
table -
Welche Tabelle zurückgegeben werden soll. Entweder
HTML_ENTITIESoderHTML_SPECIALCHARS. -
flags -
Eine Bitmaske von einem oder mehreren der folgenden Flags, welche festlegen welche Anführungszeichen die Tabelle enthalten wird, sowie für welchen Dokumenttyp sie ist. Der Standardwert ist ENT_COMPAT | ENT_HTML401.
Verfügbare flags-KonstantenKonstantenname Beschreibung ENT_COMPATTabelle soll Entities für doppelte Anführungszeichen enthalten, aber nicht für einfache. ENT_QUOTESTabelle soll Entities sowohl für einfache, als auch doppelte Anführungszeichen enthalten. ENT_NOQUOTESTabelle soll weder Entities für einfache, noch für doppelte Anführungszeichen enthalten. ENT_HTML401Tabelle für HTML 4.01. ENT_XML1Tabelle für XML 1. ENT_XHTMLTabelle für XHTML. ENT_HTML5Tabelle für HTML 5. -
encoding -
Definiert die zu verwendende Zeichenkodierung. Standardwert ist ISO-8859-1 in PHP Versionen vor 5.4.0 und UTF-8 in PHP 5.4.0 und neuer.
Die folgenden Zeichensätze werden unterstützt:
Unterstützte Zeichensätze Zeichensatz Alias Beschreibung ISO-8859-1 ISO8859-1 Westeuropäisch, Latin-1. ISO-8859-5 ISO8859-5 Wenig verwendeter kyrillischer Zeichensatz (Latin/Cyrillic). ISO-8859-15 ISO8859-15 Westeuropäisch, Latin-9. Enthält das Euro-Zeichen sowie französische und finnische Buchstaben, die in Latin-1(ISO-8859-1) fehlen. UTF-8 ASCII-kompatibles Multi-Byte 8-Bit Unicode. cp866 ibm866, 866 DOS-spezifischer Kyrillischer Zeichensatz. cp1251 Windows-1251, win-1251, 1251 Windows-spezifischer Kyrillischer Zeichensatz. cp1252 Windows-1252, 1252 Windows spezifischer Zeichensatz für westeuropäische Sprachen. KOI8-R koi8-ru, koi8r Russisch. BIG5 950 Traditionelles Chinesisch, hauptsächlich in Taiwan verwendet. GB2312 936 Vereinfachtes Chinesisch, nationaler Standard-Zeichensatz. BIG5-HKSCS Big5 mit Hongkong-spezifischen Erweiterungen; traditionelles Chinesisch. Shift_JIS SJIS, SJIS-win, cp932, 932 Japanisch EUC-JP EUCJP, eucJP-win Japanisch MacRoman Zeichensatz, der von von Mac OS verwendet wurde. '' Eine leere Zeichenkette aktiviert die Erkennung durch die Kodierung des Skripts (Zend multibyte), default_charset und die aktuelle Sprachumgebung (siehe nl_langinfo() und setlocale()), in dieser Reihenfolge. Nicht empfehlenswert. Hinweis: Weitere Zeichensätze sind nicht implementiert. Statt dessen wird die Standard-Kodierung verwendet und eine Warnung ausgegeben.
Rückgabewerte
Gibt die Umwandlungstabelle als Array zurück, wobei die ursprünglichen Zeichen die Schlüssel sind und die Entities die Werte.
Changelog
| Version | Beschreibung |
|---|---|
| 5.4.0 |
Der Standardwert für encoding wurde
zu UTF-8 geändert.
|
| 5.4.0 |
Die Konstanten ENT_HTML401,
ENT_XML1, ENT_XHTML
und ENT_HTML5 wurden hinzugefügt.
|
| 5.3.4 |
Der encoding parameter wurde
hinzugefügt.
|
Beispiele
Beispiel #1 Umwandlungs-Tabellen-Beispiel
<?php
var_dump(get_html_translation_table(HTML_ENTITIES, ENT_QUOTES | ENT_HTML5));
?>
Das oben gezeigte Beispiel erzeugt eine ähnliche Ausgabe wie:
array(1510) {
["
"]=>
string(9) "
"
["!"]=>
string(6) "!"
["""]=>
string(6) """
["#"]=>
string(5) "#"
["$"]=>
string(8) "$"
["%"]=>
string(8) "%"
["&"]=>
string(5) "&"
["'"]=>
string(6) "'"
// ...
}
Siehe auch
- htmlspecialchars() - Wandelt Sonderzeichen in HTML-Codes um
- htmlentities() - Wandelt alle geeigneten Zeichen in entsprechende HTML-Codes um
- html_entity_decode() - Konvertiert alle benannten HTML-Zeichen in ihre entsprechenden Ursprungszeichen