Page 1 of 1

Text aus MS-Word in Kommetare kopieren

Posted: Sun Sep 01, 2019 2:07 pm
by MarioH
Hallo,

ein Kommentator bei bbugks.de hat einen längeren Kommentar in Word "vorgeschrieben" und dann in das Formular in der Webseite kopiert. In der Vorschau sieht er auch den ganzen Kommentar, wenn er aber dann speichert, wird der Text nach zwei Absätzen abgeschnitten.

Ich vermute mal, dass der kopierte Text aus Word irgendwelche problematischen (Steuer-)Zeichen enthält, die das Speichern in der Datenbank verhindern.

Können wir da im Code was machen, um solche Probleme zu umgehen?

Gruß
Mario

Re: Text aus MS-Word in Kommetare kopieren

Posted: Sun Sep 01, 2019 9:54 pm
by refilix
Hallo,

Warum kopiert ihr es nicht zunächst in den Editor und dann auf die Webseite?

mfg refi

Re: Text aus MS-Word in Kommetare kopieren

Posted: Thu Sep 05, 2019 11:26 am
by thh
MarioH wrote: Sun Sep 01, 2019 2:07 pmein Kommentator bei bbugks.de hat einen längeren Kommentar in Word "vorgeschrieben" und dann in das Formular in der Webseite kopiert. In der Vorschau sieht er auch den ganzen Kommentar, wenn er aber dann speichert, wird der Text nach zwei Absätzen abgeschnitten.

Ich vermute mal, dass der kopierte Text aus Word irgendwelche problematischen (Steuer-)Zeichen enthält, die das Speichern in der Datenbank verhindern.
Klingt nach dem UTF8MB4-Problem.

Es wäre ein schönes Release-Ziel (auch wegen der Implikationen für die Sicherheit), wenn wir das gelöst bekommen würden.

Grundsätzlich ist es - unter Windows - m.E. zu empfehlen, kopierten Text (sei es aus Word, dem Browser oder sonstwo) erst einmal in den Editor (Notepad) einzufügen, dort wieder auszuschneiden und dann am Zielort einzufügen. Das entfernt alle Steuerzeichen und sorgt auch dafür, dass kein Chaos mit Schriften, Schriftschnitten usw. entsteht.

Re: Text aus MS-Word in Kommetare kopieren

Posted: Thu Sep 05, 2019 3:12 pm
by yellowled
MarioH wrote: Sun Sep 01, 2019 2:07 pmKönnen wir da im Code was machen, um solche Probleme zu umgehen?
Ich tippe auch auf unsichtbare Steuerzeichen, ob es dann UTF8MB4 ist, weiß ich nicht. (Aber es riecht danach.)

Option 1: Dem Autor verbieten, in Word vorzuschreiben. Kann quasi alles andere nutzen, meinetwegen Notepad oder so, aber nicht Word. Ist die einfachste, schnellste und nachhaltigste Lösung. (Ich weiß, Autoren schulen ist doof, aber isso.)

Option 2: Ich benutze den CKE nie, daher weiß ich nicht mehr, ob es im CKE oder im TinyMCE war und ob unsere Konfiguration entsprechend ist, aber einige WYSIWYG-Editoren bieten einen Button „Einfügen aus Word“, der die berüchtigten unsichtbaren Steuerzeichen entfernt. Vielleicht schaust Du danach mal?

Insbesondere wäre natürlich interessant, was an de Stelle steht, an der das passiert, also auch, ob das Problem reproduzierbar ist. Dann käme man vermutlich auch der Frage auf die Spur, ob es UTF8MB4 ist. Ich nehme an (weiß es aber nicht genau), dass man dazu mal in der Datenbank einen fehlerhaften Eintrag begutachten und gucken könnte, was da genau im Editor „ankommt“?

YL

Re: Text aus MS-Word in Kommetare kopieren

Posted: Thu Sep 05, 2019 4:24 pm
by thh
yellowled wrote: Thu Sep 05, 2019 3:12 pmOption 2: Ich benutze den CKE nie, daher weiß ich nicht mehr, ob es im CKE oder im TinyMCE war und ob unsere Konfiguration entsprechend ist, aber einige WYSIWYG-Editoren bieten einen Button „Einfügen aus Word“, der die berüchtigten unsichtbaren Steuerzeichen entfernt.
Bieten wir einen WYSIWYG-Editor für Kommentare (!) an?

Re: Text aus MS-Word in Kommetare kopieren

Posted: Thu Sep 05, 2019 9:03 pm
by MarioH
Es geht nicht um einen Autor, sondern um jemanden, der einen längeren Kommentar im Blog schreiben wollte und diesen wohl in Word vorgeschrieben hat. Es geht also um das Kommentarfeld und nicht um den Editor im Backend.
Die Lösung mit Notepad habe ich ihm dann auch vorgeschlagen.

Gruß
Mario

Re: Text aus MS-Word in Kommetare kopieren

Posted: Sat Sep 07, 2019 9:06 pm
by yellowled
MarioH wrote: Thu Sep 05, 2019 9:03 pmEs geht nicht um einen Autor, sondern um jemanden, der einen längeren Kommentar im Blog schreiben wollte und diesen wohl in Word vorgeschrieben hat.
Oh. OH! Das hab ich komplett überlesen, sorry! :oops:

Nein, es gibt natürlich keinen WYSIWYG-Editor für Kommentare, das wäre ggf. vielleicht sogar ein Sicherheitsrisiko (XSS). Bedenke, dass wir standardmäßig nicht mal HTML in Kommentaren erlauben.

Ich schätze, man könnte das, was WYSIWYG-Editoren da über diesen Button ausführen, generell für jeden Kommentar … aber das wäre … Unsinn, also … nein. :mrgreen: (Das UTF8MB4-Ding sollten wir generell fixen.)

YL