Zeichensatz, charset, entities

saxofon
Beiträge: 22
Registriert: Mi 13. Apr 2016, 08:33

Zeichensatz, charset, entities

Beitrag von saxofon »

Werte Gemeinde, ich habe gelesen, dass der Zeichensatz der Wahl neuerdings utf8mb4_unicode_ci ist, weil dieser Sonderzeichen beim Suchen richtig sortiert, was seit der letzten Rechtschreibreform eine mittlere Katastroph(f)e ist. Bei utf8 sollten html entities für deutsche ä,ö,ü... auch überflüssig werden.

Wie man den Zeichensatz in phpMyAdmin umstellt habe ich gefunden. Wie aber stelle ich im editor die entities ab? Wie sage ich BC, dass es die richtige Zeichencodierung in den Seitenheader schreibt?
Beste Grüss(ß)e
Benutzeravatar
shadowcat
Administrator
Beiträge: 5283
Registriert: Di 5. Feb 2013, 10:36
Kontaktdaten:

Re: Zeichensatz, charset, entities

Beitrag von shadowcat »

Unter Einstellungen -> Sprache und Zeit, die gewünschte Option haben wir da aber noch nicht. Die Liste steht in der CAT_Helper_I18n Klasse.

Code: Alles auswählen

        public function getCharsets()
        {
            return array(
                'utf-8'       => 'Unicode (utf-8)',
                'iso-8859-1'  => 'Latin-1 Western European (iso-8859-1)',
                'iso-8859-2'  => 'Latin-2 Central European (iso-8859-2)',
                'iso-8859-3'  => 'Latin-3 Southern European (iso-8859-3)',
                'iso-8859-4'  => 'Latin-4 Baltic (iso-8859-4)',
                'iso-8859-5'  => 'Cyrillic (iso-8859-5)',
                'iso-8859-6'  => 'Arabic (iso-8859-6)',
                'iso-8859-7'  => 'Greek (iso-8859-7)',
                'iso-8859-8'  => 'Hebrew (iso-8859-8)',
                'iso-8859-9'  => 'Latin-5 Turkish (iso-8859-9)',
                'iso-8859-10' => 'Latin-6 Nordic (iso-8859-10)',
                'iso-8859-11' => 'Thai (iso-8859-11)',
                'gb2312'      => 'Chinese Simplified (gb2312)',
                'big5'        => 'Chinese Traditional (big5)',
                'iso-2022-jp' => 'Japanese (iso-2022-jp)',
                'iso-2022-kr' => 'Korean (iso-2022-kr)'
            );
        }   // end function getCharsets()
Du kannst da eine Zeile hinzufügen - vorne steht der Wert, der dann auch im Seitenheader steht, hinten das, was in der Auswahlliste angezeigt wird. Ich kann Dir aber nicht garantieren, daß das funktioniert.

Zum Editor muß ich die Suchmaschine meiner Wahl bemühen bzw. in die CKEditor Doku schauen.
My software never has bugs, it just develops random features.
If it’s not broken, keep fixing it until it is
Benutzeravatar
shadowcat
Administrator
Beiträge: 5283
Registriert: Di 5. Feb 2013, 10:36
Kontaktdaten:

Re: Zeichensatz, charset, entities

Beitrag von shadowcat »

Ähm, utf8mb4_unicode_ci ist ein Zeichensatz für die Datenbank, nicht für den Seitenheader. Das weißt Du, oder? Ich glaub nämlich nicht, daß Du da einen anderen Charset einstellen mußt.
My software never has bugs, it just develops random features.
If it’s not broken, keep fixing it until it is
Benutzeravatar
shadowcat
Administrator
Beiträge: 5283
Registriert: Di 5. Feb 2013, 10:36
Kontaktdaten:

Re: Zeichensatz, charset, entities

Beitrag von shadowcat »

My software never has bugs, it just develops random features.
If it’s not broken, keep fixing it until it is
Benutzeravatar
shadowcat
Administrator
Beiträge: 5283
Registriert: Di 5. Feb 2013, 10:36
Kontaktdaten:

Re: Zeichensatz, charset, entities

Beitrag von shadowcat »

Zum CKE siehe http://docs.ckeditor.com/#!/api/CKEDITOR.config

config.basicEntities = false;
config.entities = false;

Im Verzeichnis \modules\ckeditor4\ckeditor\custom gibt es eine Datei config.js, da kannst Du das eintragen.
My software never has bugs, it just develops random features.
If it’s not broken, keep fixing it until it is
saxofon
Beiträge: 22
Registriert: Mi 13. Apr 2016, 08:33

Re: Zeichensatz, charset, entities

Beitrag von saxofon »

danke, wusste nicht, dass es für die Datenbank andere Zeichensätze gibt.
saxofon
Beiträge: 22
Registriert: Mi 13. Apr 2016, 08:33

Re: Zeichensatz, charset, entities

Beitrag von saxofon »

In der Datei root\framework\CAT\Helper\I18n.php muss der Zeichensatz eingetragen werden, sonst legt die Datenbank neue Datensätze mit utf8_general_ci an, also:
public function getCharsets()
{
return array(
'utf8mb4_unicode_ci' => 'Unicode (utf8mb4)',

Dem editor kann ich die entities nicht abgewöhnen, obwohl es einmal funktioniert hat, als ich die config.js geändert hatte. Auch die Zusätze config.entities_greek = false; und config.entities_latin = false; helfen nicht. Im übergeordneten Verzeichnis gibt es noch eine config.js, auch die zu ändern hilft nicht.
saxofon
Beiträge: 22
Registriert: Mi 13. Apr 2016, 08:33

Re: Zeichensatz, charset, entities

Beitrag von saxofon »

quatsch, geht natürlich, in phpmyadmin in der falschen Feld geschaut. Ich liebe programmieren...
Benutzeravatar
shadowcat
Administrator
Beiträge: 5283
Registriert: Di 5. Feb 2013, 10:36
Kontaktdaten:

Re: Zeichensatz, charset, entities

Beitrag von shadowcat »

Der Charset in der I18n hat KEINE Auswirkungen auf die Datenbank! I18n = Internationalization = Sprachausgabe.
My software never has bugs, it just develops random features.
If it’s not broken, keep fixing it until it is
saxofon
Beiträge: 22
Registriert: Mi 13. Apr 2016, 08:33

Re: Zeichensatz, charset, entities

Beitrag von saxofon »

Gleich nach Einloggen in phpmyadmin wird der Zeichensatz der Datenbank angezeigt (utf8-general). Wenn ich jedoch in BC den Zeichensatz utf8mb4 eintrage, dann wird dieser auch in die Datenbank übernommen.
Gesperrt