UTF-8 fürs ZFB

    Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

    • UTF-8 fürs ZFB

      Moment, ein kleines Experiment:

      Þó¬

      Mein Ergebnis: Negativ


      Wäre es vielleicht möglich, das Forum auf UTF-8 umzupolen? Die alte Boardversion konnte mit extravaganten Schriftzeichen noch etwas anfangen, aber jetzt funzt das (zumindest bei mir) offensichtlich nicht mehr.

      Wer es kann, möge mir vorlesen, was ich geschrieben habe. Ich kann es jedenfalls nicht mehr entziffern.
    • Hm, fraglich ist allerding, wer mit diesen Katakanas was anfangen könnte ;) Also ich könnte damit absolut gar nix anfangen! In den Beiträgen bringen dir diese Zeichen nix (außer, dass sie schön aussehen) und in der Sig, kann man notfalls noch ein Gif mit den Zeichen erstellen ...
      Allerdings liegt ja die Entscheidung bei solchen Sachen, wie immer bei denen, die so etwas verwirklichen können bzw. die Arbeit damit haben.
      Zumindest für mich wäre es ziemlich sinnlos, aber evtl. gibt es ja ne ganze Menge User, die gerne in Katakana schreiben ...
    • Þó¬

      Mal davon abgesehen, dass das hier kein japanisches Forum ist (BTW: da wären UCS-2 oder UTF-16 angebrachter) und damit relativ selten Katakana geschrieben werden (wie zu Beginn dieses Beitrags), stolpere ich trotzdem ständig über Beiträge, bei denen zum Beispiel die Umlaute nach Müll aussehen.
    • Arial:
      ò1&

      Wingdings:
      ò1&


      Das Board wandelt die Schriften in Arial um. Die Zeichen, die du einfügen willst, sind kein Arial, sondern andere Fonts. Dementsprechend musst du diese in der dazugehörigen Schriftart schreiben.

      Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von Salev ()

    • Original von Tanja
      Arial:
      ò1&

      Wingdings:
      ò1&


      Das Board wandelt die Schriften in Arial um. Die Zeichen, die du einfügen willst, sind kein Arial, sondern andere Fonts. Dementsprechend musst du diese in der dazugehörigen Schriftart schreiben.


      Ich glaube, das verstehst du gerade nicht. Natürlich kann eine Schriftart auch Symbole enthalten, aber diese stehen gerade anstelle der Zeichen ò1&, während im Unicode all diese Zeichen nebeneinander existieren können. Im Quelltext, so wie der, den du geschrieben hast, gibt es keine Unterschiede zwischen diesen Zeichen, im Unicode bzw. UTF-8 schon, und zwar unabhängig von der Schriftart!
    • Original von Ark
      Original von Tanja
      Arial:
      ò1&

      Wingdings:
      ò1&


      Das Board wandelt die Schriften in Arial um. Die Zeichen, die du einfügen willst, sind kein Arial, sondern andere Fonts. Dementsprechend musst du diese in der dazugehörigen Schriftart schreiben.


      Ich glaube, das verstehst du gerade nicht. Natürlich kann eine Schriftart auch Symbole enthalten, aber diese stehen gerade anstelle der Zeichen ò1&, während im Unicode all diese Zeichen nebeneinander existieren können. Im Quelltext, so wie der, den du geschrieben hast, gibt es keine Unterschiede zwischen diesen Zeichen, im Unicode bzw. UTF-8 schon, und zwar unabhängig von der Schriftart!


      Mir war einleuchtender, dass man stattdessen einfach die dazugehörige Schrift nehmen könnte, statt das Board gleich umzupolen, wenn sowieso kaum einer diese Zeichen nutzt.
      Ein Einbau von UTF-8 wäre sowieso nicht schlecht.
    • Ich habe zwar keine Ahnung davon, wie das Board intern funktioniert, aber ich gehe mal davon aus, dass alle bisher gemachten Beiträge in 8 Bit breitem ASCII (bzw. ISO-8859-1) gespeichert sind.

      Sollte das Board auf UTF-8 umgestellt werden, dürfte es mit alten Beiträgen reibungslos funktionieren, wenn das Board zwischen der UTF-8-Kodierung und der alten unterscheiden kann.

      Das kann man sehr wohl, und zwar anhand der ersten Zeichen im Datenstrom:

      0xEF 0xBB 0xBF

      Probleme gäbe es theoretisch und nur im wirklich sehr konstruierten Fall dann, wenn irgendein Benutzer vor der Umstellung auf UTF-8 diese genannten Zeichen, nämlich

      

      genau an den Anfang seines Beitrags setzt und im Rest seines Beitrags Zeichen verwendet, die oberhalb von 0x7F liegen. Wie gesagt, das ist ein sehr konstruierter Fall und man kann davon ausgehen, dass sowas bisher noch keiner gemacht hat. ;)

      Wenn diese Zeichen nicht genau am Anfang und nicht genau in dieser Reihenfolge vorliegen, handelt es sich um die ASCII-(bzw. ISO-8859-1-)Kodierung, sonst um UTF-8. Genau an dieser Stelle kann man bzw. das Board UTF-8 von ASCII bzw. ISO-8859-1 unterscheiden.

      UTF-8, ISO-8859-1 und ASCII sind in den Zeichen 0x00 bis 0x7F übrigens identisch.

      Näheres zu UTF-8 gibt's wie immer in der Wikipedia, hier.


      P.S: Dieser Beitrag ist natürlich auch eindeutig ISO-8859-1-kodiert, weil das UTF-8-Zeichen , das ich eingefügt habe, nicht genau am Anfang steht. Und solange das Board kein UTF-8 beherrscht, ist das sowieso egal.