OFDb

Polnische Buchstaben

Begonnen von nightmas, 8 September 2007, 15:49:18

⏪ vorheriges - nächstes ⏩

0 Mitglieder und 1 Gast betrachten dieses Thema.

nightmas

Hallo Zusammen!

Wie soll man mit polnischen Buchstaben umgehen? Leider konnte mir auch die Suchfunktion im Forum keine Lösung anzeigen. Sollte das Problem hier schon behandelt worden sein, so bitte ich um Entschuldigung.
Falls nicht bekannt: Genau wie die Umlaute in Deutschland, so gibt es polnische Buchstaben die bei uns nicht vorkommen.
wie z.B.: Ż, ó, Ł, ń
Leider sind mir gravierende Fehler aufgefallen!
Es gibt Namen die beinhalten alle Pl.-Buchstaben, nur teilweise, aber auch Keine. Das macht die Suche nach Schauspielern nun nicht gerade einfach.

Ein Beispiel (lange muss man nicht suchen):
http://www.ofdb.de/view.php?page=film&fid=67305
Film: Anton der Glückspilz (1961)

Darsteller in unserer Datenbank
Czeslaw Wollejko

Richtige Schreibweise:
Czesław Wołłejko (Buchstabe l mit Querstrich)

Die Schauspielerin Teresa Szmigielówna ist wiederum richtig geschrieben (der Buchstabe O mit "Apostroph")
Und wenn wir schon beim Thema sind, der polnische Titel ist auch eingedeutscht ;) Szczesciarz Antoni, Richtig: Szczęściarz Antoni


Gruss

morb_d

Hi,

i.d.R. wird (bis auf bei den Asiatischen Namen) die Schreibweise der imdb übernommen.

Bzgl. der Sonderzeichen zitiere ich mal aus diesem Thread:
http://www.gemeinschaftsforum.com/forum/index.php/topic,65239.0.html

Zitat• Diverse Zeichen müssen umschrieben werden, damit sie den Vorgaben der ISO 8859-1[5] entsprechen, z. B. "œ" in "oe", "ō" in "ô", "š" in "s" und viele andere. In der IMDb wurden diese bereits geändert. Arabische, japanische, koreanische, russische, thailänische und einige andere Filmtitel müssen entsprechend transkribiert werden. Für Japanisch wird das revidierte Hepburn-System[6] verwendet. Für Russisch ausschließlich das englische BGN/PCGN[7], wie auch in der IMDb.

Zitat[5] Infos bei Wikipedia: http://de.wikipedia.org/wiki/Latin-1#ISO.2FIEC_8859-1

Gruß

Morbit

nightmas

14 September 2007, 17:58:55 #2 Letzte Bearbeitung: 14 September 2007, 19:05:18 von SplatMat
Hey, danke für die Antwort!
Werde erst einmal die Zitate und ISO's durchlesen....

Edit: Ich habe Probleme mit der Fünf hinter der ISO-Bezeichnung ISO 8859-1[5], wofür steht die Fünf? Ich meine die Fünf in der eckigen Klammer.

Edit: Ich hab hier mal ein paar Postings zusammengeschoben. Doppelpostings werden hier nicht gerne gesehen, dafür gibt es den "ändern"-Button!

andreas82

Das sollen Fußnoten sein, im Thread selber sind die Zahlen hochgestellt. Anfangs waren die Links direkt beim Text eingebunden und mit Linktitel versehen, nur sind für Gäste (nicht angemeldete User) die Links jetzt nicht mehr aufrufbar: es wird nur die Bemerkung "Als Gast kannst Du keine Links einsehen! Register or Login" in mehreren Zeilen dargestellt. Sah bescheiden aus... ist so IMO auch übersichtlicher.

MMeXX

20 Juli 2011, 14:59:09 #4 Letzte Bearbeitung: 20 Juli 2011, 15:02:35 von MMeXX
Derzeit werden die polnischen Buchstaben (eventuell auch andere?) bei Fassungseinträgen nach einer Bearbeitung der Fassung bei mir nicht richtig dargestellt. Da steht dann jeweils nur ein "?". Liegt das an mir/Browser oder muss da ein Fehler behoben werden?

mali

Firefox?

Welchen Zeichensatz hast Du eingestellt. UTF-8?

MMeXX

20 Juli 2011, 15:19:56 #6 Letzte Bearbeitung: 20 Juli 2011, 15:22:28 von MMeXX
Zitat von: mali am 20 Juli 2011, 15:08:02
Firefox?
Ja, 5.0

Zitat von: mali am 20 Juli 2011, 15:08:02
Welchen Zeichensatz hast Du eingestellt. UTF-8?
Keine Ahnung, wo kann ich das nachsehen?

EDIT: Unter "Extras", "Einstellungen", "Schriftarten & Farben", "Erweitert" ist bei "Zeichenkodierung" als Standard-Zeichenkodierung eingestellt: Westlich (ISO-8859-1). Ist das da zu finden?

mali

Zitat von: MMeXX am 20 Juli 2011, 15:19:56
EDIT: Unter "Extras", "Einstellungen", "Schriftarten & Farben", "Erweitert" ist bei "Zeichenkodierung" als Standard-Zeichenkodierung eingestellt: Westlich (ISO-8859-1). Ist das da zu finden?

Genau, oder kürzer aus der Menüleiste:

Ansicht / Zeichenkodierung

Westlich (ISO-8859-1) müsste aber eigentlich funzen  :00000109: Wenn man Unicode einstellt, gibt es oft den Fragezeichen-Salat.

MMeXX

Alos ich habe es ja nicht sofort. Es passiert nur, wenn solche "Polnischen Buchstaben" im Fassungseintrag stehen, ich dann die Fassung bearbeite. Also: 1. Fassung mit polnischen Buchstaben normal. 2. Fassung wird bearbeitet, auch da noch normale Anzeige der Buchstaben. 3. "Aktualisieren" gedrückt und nun "?" statt der eigentlichen Buchstaben...

mali


MMeXX

http://www.ofdb.de/view.php?page=fassung&fid=35931&vid=122956 Waren vorhin bei mir noch die korrekten Sachen drin, nach dem Bearbeiten die Fragezeichen im B-Feld.

mali

Hmm, zumindest keine HTML-Codierung die zerschossen wird/werden kann.

Ich habe es mal hier probiert:
http://www.ofdb.de/view.php?page=fassung&fid=7566&vid=220324

Mit dem gleichen Ergebnis  :icon_mrgreen: Ich vermute also ein OFDb-Seitiges Problem.



MMeXX

Zitat von: mali am 20 Juli 2011, 16:29:17
Ich vermute also ein OFDb-Seitiges Problem.
Dann also: Commander Kosh, retten sie die Polnischen Buchstaben! ;)

Kayfabe

Zitat von: MMeXX am 20 Juli 2011, 14:59:09
Derzeit werden die polnischen Buchstaben (eventuell auch andere?) bei Fassungseinträgen nach einer Bearbeitung der Fassung bei mir nicht richtig dargestellt. Da steht dann jeweils nur ein "?". Liegt das an mir/Browser oder muss da ein Fehler behoben werden?
http://www.ofdb.de/view.php?page=fassung&fid=3056&vid=124000

Hier wurde der HTML-Code für den Buchstaben Pi auch ersetzt.
"Mit nichts als Phantasie erschufen wir unsere Welt aus dem Nichts."

Phantastik

20 Juli 2011, 22:03:05 #14 Letzte Bearbeitung: 20 Juli 2011, 22:14:49 von Phantastik
Ohh man, die Probleme ;-).

Mittels HTML kann man ja einiges zaubern:

Man schreibe:

Ą

ą

Ć

ć

Ę

ę

Ł

ł

Ń

ń

Ó

ó

Ś

ś

Ź

ź

Ż

ż

----

Man bewundere:

Ą

ą

Ć

ć

Ę

ę

Ł

ł

Ń

ń

Ó

ó

Ś

ś

Ź

ź

Ż

ż

----

In jenem Beispiel:

Ława przysięgłych schreiben und anschliessend
Ława przysięgłych bewundern

Phantastik

Syncroniza

21 Juli 2011, 16:22:07 #15 Letzte Bearbeitung: 21 Juli 2011, 16:49:09 von Syncroniza
Ging es denn mal, den Text inkl. Sonderzeichen 'normal' einzugeben?
Ich selbst verwend diese Zeichen nie. Aber es kann ja sein, dass es mal ging, denn so jemand wie TOLEK wird wohl nicht immer die Unicode-Nummern raussuchen..

Die OFDb verwendet ja Unicode (UTF-8) für die Darstellung der Seiten. Und im Moment werden beim Bearbeiten von Fassungen die 'normal' eingegebenen Zeichen auch richtig abgeschickt, also als UTF-8-Bytefolgen. Aber seltsamerweise scheint hier trotzdem nur der Zeichenvorrat übrig zu bleiben, der in Windows-1252 beinhaltet ist. Als gäbe es zwischendrin irgendwo eine Wandlung UTF-8->Windows-1252->UTF-8. Alles was da dann rausfliegt, ist nur noch ein Fragezeichen (Zeichen mit 4 Bytes bei UTF-8 bleiben als 4 Fragezeichen).

Hab die drei Fassungen hier mal zurückkorrigiert.

Edit: Ne, auch TOLEK hat in seinen Fassungen die Unicode-Nummern teilweise drin. Also wohl doch nicht 'normal' eingegeben. Da muss man beim Fassungen bearbeiten aufpassen bzw. die Nummern halt manuell wieder einsetzen (da zwar teilweise die direkten Unicode-Nummern gespeichert sind, in der Fassungsmaske dann aber als 'normale' Zeichen angezeigt werden, und beim Abschicken als UTF-8-Bytes enden, wovon im Moment nur ein Teil angenommen wird).

TinyPortal 2.0.0 © 2005-2020