Seite 1 von 2

Zeichensatz, charset, entities

Verfasst: Do 21. Apr 2016, 09:19
von saxofon
Werte Gemeinde, ich habe gelesen, dass der Zeichensatz der Wahl neuerdings utf8mb4_unicode_ci ist, weil dieser Sonderzeichen beim Suchen richtig sortiert, was seit der letzten Rechtschreibreform eine mittlere Katastroph(f)e ist. Bei utf8 sollten html entities für deutsche ä,ö,ü... auch überflüssig werden.

Wie man den Zeichensatz in phpMyAdmin umstellt habe ich gefunden. Wie aber stelle ich im editor die entities ab? Wie sage ich BC, dass es die richtige Zeichencodierung in den Seitenheader schreibt?
Beste Grüss(ß)e

Re: Zeichensatz, charset, entities

Verfasst: Do 21. Apr 2016, 09:56
von shadowcat
Unter Einstellungen -> Sprache und Zeit, die gewünschte Option haben wir da aber noch nicht. Die Liste steht in der CAT_Helper_I18n Klasse.

Code: Alles auswählen

        public function getCharsets()
        {
            return array(
                'utf-8'       => 'Unicode (utf-8)',
                'iso-8859-1'  => 'Latin-1 Western European (iso-8859-1)',
                'iso-8859-2'  => 'Latin-2 Central European (iso-8859-2)',
                'iso-8859-3'  => 'Latin-3 Southern European (iso-8859-3)',
                'iso-8859-4'  => 'Latin-4 Baltic (iso-8859-4)',
                'iso-8859-5'  => 'Cyrillic (iso-8859-5)',
                'iso-8859-6'  => 'Arabic (iso-8859-6)',
                'iso-8859-7'  => 'Greek (iso-8859-7)',
                'iso-8859-8'  => 'Hebrew (iso-8859-8)',
                'iso-8859-9'  => 'Latin-5 Turkish (iso-8859-9)',
                'iso-8859-10' => 'Latin-6 Nordic (iso-8859-10)',
                'iso-8859-11' => 'Thai (iso-8859-11)',
                'gb2312'      => 'Chinese Simplified (gb2312)',
                'big5'        => 'Chinese Traditional (big5)',
                'iso-2022-jp' => 'Japanese (iso-2022-jp)',
                'iso-2022-kr' => 'Korean (iso-2022-kr)'
            );
        }   // end function getCharsets()
Du kannst da eine Zeile hinzufügen - vorne steht der Wert, der dann auch im Seitenheader steht, hinten das, was in der Auswahlliste angezeigt wird. Ich kann Dir aber nicht garantieren, daß das funktioniert.

Zum Editor muß ich die Suchmaschine meiner Wahl bemühen bzw. in die CKEditor Doku schauen.

Re: Zeichensatz, charset, entities

Verfasst: Do 21. Apr 2016, 10:06
von shadowcat
Ähm, utf8mb4_unicode_ci ist ein Zeichensatz für die Datenbank, nicht für den Seitenheader. Das weißt Du, oder? Ich glaub nämlich nicht, daß Du da einen anderen Charset einstellen mußt.

Re: Zeichensatz, charset, entities

Verfasst: Do 21. Apr 2016, 10:10
von shadowcat

Re: Zeichensatz, charset, entities

Verfasst: Do 21. Apr 2016, 10:15
von shadowcat
Zum CKE siehe http://docs.ckeditor.com/#!/api/CKEDITOR.config

config.basicEntities = false;
config.entities = false;

Im Verzeichnis \modules\ckeditor4\ckeditor\custom gibt es eine Datei config.js, da kannst Du das eintragen.

Re: Zeichensatz, charset, entities

Verfasst: Do 21. Apr 2016, 19:26
von saxofon
danke, wusste nicht, dass es für die Datenbank andere Zeichensätze gibt.

Re: Zeichensatz, charset, entities

Verfasst: Do 21. Apr 2016, 20:43
von saxofon
In der Datei root\framework\CAT\Helper\I18n.php muss der Zeichensatz eingetragen werden, sonst legt die Datenbank neue Datensätze mit utf8_general_ci an, also:
public function getCharsets()
{
return array(
'utf8mb4_unicode_ci' => 'Unicode (utf8mb4)',

Dem editor kann ich die entities nicht abgewöhnen, obwohl es einmal funktioniert hat, als ich die config.js geändert hatte. Auch die Zusätze config.entities_greek = false; und config.entities_latin = false; helfen nicht. Im übergeordneten Verzeichnis gibt es noch eine config.js, auch die zu ändern hilft nicht.

Re: Zeichensatz, charset, entities

Verfasst: Do 21. Apr 2016, 20:52
von saxofon
quatsch, geht natürlich, in phpmyadmin in der falschen Feld geschaut. Ich liebe programmieren...

Re: Zeichensatz, charset, entities

Verfasst: Fr 22. Apr 2016, 09:18
von shadowcat
Der Charset in der I18n hat KEINE Auswirkungen auf die Datenbank! I18n = Internationalization = Sprachausgabe.

Re: Zeichensatz, charset, entities

Verfasst: Fr 22. Apr 2016, 14:56
von saxofon
Gleich nach Einloggen in phpmyadmin wird der Zeichensatz der Datenbank angezeigt (utf8-general). Wenn ich jedoch in BC den Zeichensatz utf8mb4 eintrage, dann wird dieser auch in die Datenbank übernommen.