OFDb

Artverwandte Filme anzeigen (lassen)

Begonnen von Indy, 30 Oktober 2006, 21:14:48

⏪ vorheriges - nächstes ⏩

0 Mitglieder und 1 Gast betrachten dieses Thema.

Indy

Servus Leute,

ich weiß nicht ob's schonmal vorgeschlagen wurde, aber wäre es machbar, dass man artverwandte Filme anzeigt?

Ein Beispiel:
Ich bin auf der OFDb-Seite für "Gettyburg" und bekomme unter einer extra Rubrik "Verwandte Filme" z.B. noch "Glory" und "Ride with the Devil" angezeigt.
Oder ich bin auf der "Indiana Jones"-Seite und mir wird "Die Mumie" und "Das Vermächtnis der Tempelritter" angezeigt.

Es könnte außerdem noch helfen, die Suchanfragen im Identifikations-Forum zu reduzieren. Wenn man einen Film sucht und nicht weiß wie er heißt, aber dafür den Titel eines ähnlichen Filmes kennt, so könnte man über dieses "artverwandt"-Extra dahinterkommen.

Ich habe keine Ahnung wie aufwändig das wäre, aber ich würde so ein "Feature" für sinnvoll erachten.


"Have no fear, Vlad is here!"

"Not A Problem!"

"Here was a generation...grown up to find all gods dead, all wars fought, all faith in man shaken."

kruchtenkaiser

du meinst so etwas wie "Wenn Ihnen dieser Film gefallen hat, könnte Ihnen auch .... gefallen"???

nett wäre ein solches Feature auf jeden Fall.
aber nach welchen Kriterien soll das denn erfolgen? entsprechend identischer Genres zu verknüpfen wäre ja sinnlos, weil Genre-Gleichheit ja nicht direkt auch ne "Artverwandtschaft" bedeuten muss... und ein anderes bereits in der ofdb vorhandenes Vergleichs-Kriterium würde mir jetzt im Moment nicht einfallen. Würde also m.E. darauf hinauslaufen, dass man dann schon die Verknüpfungen allesamt manuell einpflegen müsste... ob dieser Arbeitsaufwand dem Nutzen gerecht wird???

andreas82

30 Oktober 2006, 22:11:15 #2 Letzte Bearbeitung: 30 Oktober 2006, 22:14:12 von andreas82
Empfehlungen kannst Du in der IMDb nachschauen. Ist dort sehr komplex aufgebaut: mit ein fließen Filmbewertungen, Gernes, Titel, einige tausend Keywörter und von Usern selbst angegebene Empfehlungen. Ich denke das ist für die OFDb kaum umsetzbar ...

rs007

Zitat von: kruchtenkaiser am 30 Oktober 2006, 21:54:09
nett wäre ein solches Feature auf jeden Fall.
aber nach welchen Kriterien soll das denn erfolgen? entsprechend identischer Genres zu verknüpfen wäre ja sinnlos, weil Genre-Gleichheit ja nicht direkt auch ne "Artverwandtschaft" bedeuten muss...

Zunächst könnte man ähnlich wie bei der imdb für Filme eine keyword-Liste einführen.

Um nun eine Liste ähnlicher Filme zu finden, könnte man einen "Ähnlichkeitsfaktor" einführen.
Dieser "Ähnlichkeitsfaktor" wächst, wenn

1. beide Filme zu demselben Genre bzw. denselben Genres gehören
oder
2. x identische Keywords existieren , x = eine noch festzulegende ganze Zahl
oder
3. |Differenz der Bewertungen der Filme| <= y, y eine noch festzulegende ganze Zahl

Um ein weiteres Kriterium einzuführen, könnte man wie folgt vorgehen:
man gibt den Leuten, die einen Film bewertet haben, die Möglichkeit, einen "ähnlichen" Film vorzuschlagen (den sie auch bewertet haben müssen).
4. Wird ein Film von z% der Benutzer vorgeschlagen (z eine noch festzulegende Zahl, 0 < z <= 100 ), so soll der "Ähnlichkeitsfaktor" auch wachsen.

Filme mit dem größten "Ähnlichkeitsfaktor" kommen dann halt auf die Vorschlagsliste.







Indy

Zitat von: kruchtenkaiser am 30 Oktober 2006, 21:54:09
du meinst so etwas wie "Wenn Ihnen dieser Film gefallen hat, könnte Ihnen auch .... gefallen"???

So in etwa hatte ich mir das gedacht, ja. Wie gesagt, ich habe wenig Ahnung vom Programmieren und von Datenbanken nur halb so viel. Deswegen kann ich auch keine qualifizierten Aussagen über Aufwand und Auswahlkriterien machen, wobei sich der Vorschlag von rs007 für mich nicht schlecht anhört. Ich wollt's halt mal vorgeschlagen haben, weil ich's für sinnig halte.


"Have no fear, Vlad is here!"

"Not A Problem!"

"Here was a generation...grown up to find all gods dead, all wars fought, all faith in man shaken."

Fräulein millas Gespür für den Flush

Sicher wäre so ein Feature interessant.

Der Vorschlag von rs007 ist auch sinnig, der tut's technisch.
Es hakt aus meiner Sicht aber an zwei Dingen.

1.) Die Keyword-Liste. Die müsste immer noch händisch eingetragen werden und hilft dann auch erst, wenn eine entsprechende Anzahl Filme mit Keywords versehen ist. Ich denke, es gibt noch genügend andere Informationslücken in der OFDB zu schliessen, bevor man sich dran macht für abertausende Filme Keywords einzutragen.

2.) Die Serverbelastung. Die Suche ist ja schon recht rudimentär, um den Server nicht zu sehr zu belasten. Bei dem Vorschlag von rs007 sind aber 4 verschiedene Suchen/Berechnungen nötig. Spätestens da wird dieses Feature in Sachen Kosten/Nutzen-Faktor elendig verrecken, denke ich.

Ausserdem ist doch das Identifikationsforum der viel größere Spass  :icon_razz:

Aber ansonsten trotzdem eine schöne Idee  ;)
"Ist denn die ganze Welt verrückt geworden? Bin ich denn hier der einzige Idiot, dem Regeln noch was bedeuten?"

Zitat von: Dr. Sigi Fraud
Ich habe den Rassismus endgültig besiegt.

mali

Zitat von: rs007 am 30 Oktober 2006, 22:17:14
Zunächst könnte man ähnlich wie bei der imdb für Filme eine keyword-Liste einführen.

Das kann man auf 3 Arten machen, alle sind leider problematisch:

Methode 1:
Eine Person bzw. ein beschränkter, festgelegter Personenkreis kann die Keywords vergeben.
-> Person/Personenkreis wäre völlig überlastet und müßte zudem jeden Film auch tatsächlich gut kennen um passende Keywords zu vergeben.

Methode 2:
Alle können Keywords vergeben.
-> Innerhalb von 7 Tagen gäbe es dann wohl 8 Schreibweisen für Psycho-Thriller :-)

Methode 3:
Eine Keyword-Auswahl-Liste wird zentral gepflegt und mit Vorschlägen/Erweiterungen von Usern eingedeckt.
-> Würde wohl am besten funktionieren, scheitert aber IMHO am immensen Aufwand.


IMHO ist das Feature auch nicht wirklich nötig, da man ja immer noch die IMDB dafür nutzen kann.

rs007

Zitat von: milla2201 am 31 Oktober 2006, 10:13:26

1.) Die Keyword-Liste. Die müsste immer noch händisch eingetragen werden und hilft dann auch erst, wenn eine entsprechende Anzahl Filme mit Keywords versehen ist. Ich denke, es gibt noch genügend andere Informationslücken in der OFDB zu schliessen, bevor man sich dran macht für abertausende Filme Keywords einzutragen.

2.) Die Serverbelastung. Die Suche ist ja schon recht rudimentär, um den Server nicht zu sehr zu belasten. Bei dem Vorschlag von rs007 sind aber 4 verschiedene Suchen/Berechnungen nötig. Spätestens da wird dieses Feature in Sachen Kosten/Nutzen-Faktor elendig verrecken, denke ich.

Ausserdem ist doch das Identifikationsforum der viel größere Spass  :icon_razz:

Aber ansonsten trotzdem eine schöne Idee  ;)


Zu 1.) Man muß nicht unbedingt, ausgehend von den 1000en Filmen, für jeden Film keywords anlegen; man kann auch eine (zunächst kleine) Liste von keywords anlegen und ausgehend von dieser Liste die Filme den keywords zuordnen. Natürlich sind dann viele Filme zunächst mal ohne keywords, aber die Liste kann ja mit der Zeit vergrößert werden.

Zu 2.) Ja, man müßte - um den "Ähnlichkeitsfaktor" eines Films zu bestimmen - (theoretisch) jeden Film (bzw. dessen Genre, keywords oÄ) mit jedem anderen Film vergleichen. Und nicht nur das: jedesmal, wenn sich eine Bewertung geändert hat oder ein neues keyword hinzugefügt wurde, müßte man (theoretisch) die Berechnung von vorne beginnen, und zwar für alle Filme. Dies verbraucht zu viel Rechenleistung. Man könnte allerdings, um den Rechenaufwand gering zu halten, von vornherein Filme von dem ganzen Verfahren ausschließen, zB Filme mit weniger als (zB) 100 Bewertungen.
Oder Filme mit schlechteren Bewertungen als (wieder nur als Beispiel) 3.0. An denen wird sowieso nur eine extreme Minderheit interessiert sein.




Zitat von: mali am 31 Oktober 2006, 10:23:24
Das kann man auf 3 Arten machen, alle sind leider problematisch:

Methode 1:
Eine Person bzw. ein beschränkter, festgelegter Personenkreis kann die Keywords vergeben.
-> Person/Personenkreis wäre völlig überlastet und müßte zudem jeden Film auch tatsächlich gut kennen um passende Keywords zu vergeben.

Methode 2:
Alle können Keywords vergeben.
-> Innerhalb von 7 Tagen gäbe es dann wohl 8 Schreibweisen für Psycho-Thriller :-)

Methode 3:
Eine Keyword-Auswahl-Liste wird zentral gepflegt und mit Vorschlägen/Erweiterungen von Usern eingedeckt.
-> Würde wohl am besten funktionieren, scheitert aber IMHO am immensen Aufwand.




Siehe oben. Man kann von einer (zunächst) kleinen Liste von keywords ausgehen, die zB irgendwelche ofdb-Mitarbeiter (auf demokratische Weise :icon_mrgreen:) bestimmen. Und dann werden die Filme den keywords zugeordnet. Wie? Denkbar wäre: man bietet Benutzern, die den Film bewertet haben, eine Combobox (oder Liste oder was auch immer) mit keywords an, aus der mehrere keywords gewählt werden können. Damit die Auswahl irgendwelcher Dumpfbacken nicht das Ergebnis verfälscht, kann man einen Schwellenwert einführen, ab dem ein keyword tatsächlich ein keyword ist: ZB "mind. 50 % der abstimmenden user haben das keyword gewählt".

Zitat von: mali am 31 Oktober 2006, 10:23:24

IMHO ist das Feature auch nicht wirklich nötig, da man ja immer noch die IMDB dafür nutzen kann.


Man kann es allerdings diskutieren bzw. dessen Machbarkeit :icon_mrgreen:

Fräulein millas Gespür für den Flush

Ob Du jetzt Filme Keywords oder Keywords zu Filmen zuordnest, der Aufwand bleibt der Gleiche. Es muss eine bestimmte Menge von Filmen mit Daten versorgt werden, sonst ist das Feature so viel wert, wie unsere Diskussion ohne Admin-Meinung  ;)

Zitat von: rs007 am 31 Oktober 2006, 12:41:47
Man könnte allerdings, um den Rechenaufwand gering zu halten, von vornherein Filme von dem ganzen Verfahren ausschließen, zB Filme mit weniger als (zB) 100 Bewertungen.
Oder Filme mit schlechteren Bewertungen als (wieder nur als Beispiel) 3.0. An denen wird sowieso nur eine extreme Minderheit interessiert sein.

Das würde entweder eine weitere Abfrage (=Serverleistung) bedeuten oder eine zusätzliche speziell für dieses Feature genutzte View, die regelmäßig aktualisiert werden muss.

Es lebe weiterhin das Identifikationsforum ...  :icon_lol:
"Ist denn die ganze Welt verrückt geworden? Bin ich denn hier der einzige Idiot, dem Regeln noch was bedeuten?"

Zitat von: Dr. Sigi Fraud
Ich habe den Rassismus endgültig besiegt.

rs007

Zitat von: milla2201 am 31 Oktober 2006, 16:23:01
Ob Du jetzt Filme Keywords oder Keywords zu Filmen zuordnest, der Aufwand bleibt der Gleiche.

Nein; der Aufwand ist geringer, wenn ich eine feste Liste von keywords habe (die mit der Zeit ausgebaut werden kann), den usern diese Liste vorsetze & ihnen die Möglichkeit gebe, einen bestimmten Film einem bzw. mehreren keywords zuzuordnen (Verfahren 1)
Wenn ich dagegen von den Filmen ausgehe & versuche, zu jedem Film eine Liste von keywords zu ermitteln (Verfahren 2), ist der Aufwand höher, wie man durch kurze Überlegung selbst feststellen kann. Beim Verfahren 1 diskutiert die ofdb - Redaktion  über eine Liste von keywords und braucht diese Liste den usern nur noch vor den Latz zu knallen, damit sie per Abstimmung DIE Liste der spezifischen keywords eines Films bestimmen.
Beim Verfahren 2 (die Liste der Film-keywords ist zunächst mal offen) dagegen tritt zunächst mal ein grundlegendes Problem auf: wer bestimmt, was ein keyword ist? Die user sicherlich nicht, da man sonst wie bereits erwähnt wegen irgendwelcher Dumpfbacken nach kurzer Zeit 10 verschiedene Schreibweisen von zB "Mystery" oder völlig blödsinnige keywords in der DB hätte. Wenn man also davon ausgeht, daß nur vertrauenswürdige user bzw. die ofdb-Redaktion keywords definieren dürfen, und zwar ausgehend von einem bestimmten Film, so hat man tatsächlich einen immens hohen Aufwand, um das Ding überhaupt ins Rollen zu bringen. Denn 1. wird es unvermeidlich sein, daß auch dann Diskussionen über bestimmte keywords auftreten, aber nicht wie in Verfahren 1 gleich zu Beginn, sondern bei JEDEM Film (Moonshade findet das von Dr. Schreck gefundene keyword "Raupen" zum Schocker "Suspiria" doof und präferiert lieber "Maden"; ein allseits anerkannter Poweruser dagegen würde sowohl "Raupen" als auch "Maden" zu speziell finden und am liebsten auf beide Vorschläge verzichten).
Und 2. müßte man sich bei JEDEM einzelnen Film Gedanken über keywords machen; dieses Verfahren führt also dazu, daß es eine ungleich höhere Anlaufzeit benötigt als Verfahren 1.

Zitat von: milla2201 am 31 Oktober 2006, 16:23:01
Es muss eine bestimmte Menge von Filmen mit Daten versorgt werden, sonst ist das Feature so viel wert, wie unsere Diskussion ohne Admin-Meinung  ;)

Natürlich soll und muß eine bestimmte Menge Filme mit Daten versorgt werden; daß es möglich ist, ist wohl nicht das Thema. Die Frage ist nur, welchen Zeitrahmen man sich vorgibt und ob man sich (wie es übrigens bei Bewertungen jeder akzeptiert) gedulden kann, bis eine bestimmte Menge von Filmen mit keywords versehen ist ("bewertet ist"). Bei Filmen, die nicht bewertet sind, regt sich niemand auf; wieso soll dann unbedingt jeder Film innerhalb kürzester Zeit mit keywords versehen sein?
Das Verfahren 1 ist darauf angelegt, jeden Film langsam, aber stetig mit keywords auszustatten. Und man kann Kriterien aufstellen - wie ich es bereits angedeutet habe - damit sich der Rechenaufwand in Grenzen hält.

Zitat von: milla2201 am 31 Oktober 2006, 16:23:01
Das würde entweder eine weitere Abfrage (=Serverleistung) bedeuten oder eine zusätzliche speziell für dieses Feature genutzte View, die regelmäßig aktualisiert werden muss.

Ja, und? Ich weiß ja nicht, welche DB hinter der ofdb steckt; aber eine view, die alle Filme (bzw. deren IDs) mit < 100 Bewertungen oder mit Bewertungen < 3.0 selektiert, ist selbst bei 1 mio Datensätzen wohl ratzfatz durch, wenn nicht im sek-Bereich, so mindestens im min-Bereich, wenn das DB-Schema nicht gerade verkrüppelt ist oder eine Pseudo-DB a la Access verwendet wird.
Außerdem muß man die view ja nicht alle paar min ausführen, die Liste der Filme, bei denen eine keyword-Liste verfügbar sein soll, kann getrost alle 7 Tage (zB Montags um 4.00) upgedatet werden, ohne daß Splädder-Willi gleich zu weinen anfangen muß.

Ich kann es verstehen, daß sich die Verantwortlichen scheuen, über ein solches Feature nachzudenken, ich hätte ehrlich gesagt auch keine Lust, unentgeldlich (nehme ich mal an) rumzuhacken. Aber: abwegig oder nur unter immensem Aufwand machbar ist ein derartiges Feature sicherlich nicht, wenn man darüber nachdenkt und ein vernünftiges Konzept entwickelt.

Habe die Ehre :icon_mrgreen:

Dr. Kosh

Zitat von: rs007 am  1 November 2006, 03:15:45
Aber: abwegig oder nur unter immensem Aufwand machbar ist ein derartiges Feature sicherlich nicht, wenn man darüber nachdenkt und ein vernünftiges Konzept entwickelt.

Da hast Du absolut Recht, ein solches Feature ist keinesfalls unmöglich. Außerdem finde ich es persönlich auch sehr interessant, denn es könnte eine recht populäre Erweiterung werden und die OFDb somit noch beliebter machen. Die Datenbank-Last ist auch nicht wirklich ein Thema, denn ein solches Feature würde ich niemals als Echtzeit-Lösung realisieren. Es würde sich vermutlich wie von Dir geschildert zu nächtlicher Stunde im Hintergrund updaten und dann mit Cache-Daten arbeiten.

Ich finde Deine Anregungen und Dein Engagement bei diesem Thema übrigens sehr gut! Du hast Dir bereits mehr Gedanken dazu gemacht als ich -- obwohl ich selber auch schon länger von einer ähnlichen Lösung träume.

Ein Problem dürfte aber wirklich die Keyword-Auswahl sein. Kann dies jeder User machen, erhält man über kurz oder lang ein Chaos wie in der IMDb. Viele der dortigen Keyword-Listen lesen sich besser als jede Witze-Sammlung!

Aber andererseits: Wie soll eine (kleine bzw. kleinere) Gruppe Keywords auswählen, mit denen sich dann mehr oder weniger jeder Film abdecken läßt? Genres sind schon manchmal ein strittiges Thema -- wie soll es dann erst bei Keywords werden?!

Also: Ich bin gerne bereit, über ein solches Thema nachzudenken (und es ggf. auch umzusetzen). Wir sollten uns aber ein vernünftiges System überlegen, das den Ansprüchen gerecht wird und dennoch halbwegs einfach zu verwalten ist.

Gruß
Dr. Kosh
"Your English is pretty good for a German guy" - Kolumbianischer Drogenbauer zu Arnold Schwarzenegger, der sich als Deutscher ausgibt (Collateral Damage)

rs007

Hallo

Zunächst mal möchte ich einen kleinen lapsus berichtigen:
ich muß natürlich nicht diejenigen Filme selektieren, deren Bewertungen < 3.0/deren Anzahl an Bewertungen < 100(zum Beispiel) sind, sondern ich muß diejenigen Filme updaten (ihren "Ähnlichkeitsfaktor" + IDs von "ähnlichen Filmen" berechen und sie für eine keyword-Liste freischalten), deren Bewertungen >= 3.0 und deren Anzahl an Bewertungen >= 100 (zum Beispiel) sind.
Dies ist natürlich zeitintensiver als ein select (sollte trotzdem nicht zuviel Zeit kosten, wenn das Ganze alle 7 Tage in der Nacht abläuft, aber wie gesagt, ich kenne die Strukturen der ofdb nicht)

Zitat von: Dr. Kosh am  1 November 2006, 17:00:39
Ein Problem dürfte aber wirklich die Keyword-Auswahl sein. Kann dies jeder User machen, erhält man über kurz oder lang ein Chaos wie in der IMDb. Viele der dortigen Keyword-Listen lesen sich besser als jede Witze-Sammlung!

Aber andererseits: Wie soll eine (kleine bzw. kleinere) Gruppe Keywords auswählen, mit denen sich dann mehr oder weniger jeder Film abdecken läßt? Genres sind schon manchmal ein strittiges Thema -- wie soll es dann erst bei Keywords werden?!

[Da es mE unsinnig ist, daß sich user keywords ausdenken (geschweige denn in der DB submitten) dürfen, war meine Idee, daß privilegierte user eine allgemeine keyword-Liste erstellen (diese muß anfangs ja nicht alle möglichen Sparten abdecken, da sie nach und nach erweitert werden kann). Bei ausgewählten Filmen (die besagten Filme mit Bewertungen > 3.0 usw.) können user, die die Filme bewertet haben, diese Liste ansehen und keywords auswählen (link auf eine Seite -> "möchtest du dem Film noch keywords zuweisen?" -> beim Klicken erscheint eine Seite ähnlich wie in der imdb mit Auflistungen der keywords + checkboxes).

Aber die keywords, die ein einzelner user auswählt, müssen natürlich noch nicht unbedingt auf der "endgültigen" keyword-Liste des Films erscheinen (wegen der Spaßvögel, Dumpfbacken uÄ); damit aus der Liste der gewählten keywords eine Liste der "endgültigen" keywords erstellt werden kann, muß man sich noch ein Auswahlkriterium überlegen, einen Schwellenwert. Z.B. "Wenn 50% aller user, die den Film gesehen haben, ein bestimmtes keyword ausgewählt haben, so soll dieses zur Liste DER keywords des Films zählen". Das setzt natürlich voraus, daß man den Abstimmungen einen Sinn unterstellt. Wenn man der Masse keine vernünftige Auswahl an keywords zutraut, kann man dieses Verfahren ad acta legen. Und sich fragen: wer darf dann aus der Liste der keywords überhaupt auswählen? (dieses Verfahren war nur eine Idee von mir, ohne Anspruch, die beste zu sein)]

Und nochmal zur Eingangsfrage: wie kann eine kleine Gruppe keywords auswählen, wenn schon Genres strittig sind...?
Da bin ich ehrlich gesagt überfragt, normalerweise sollte ja eine demokratische Abstimmung möglich sein...? Man reicht ein excel-sheet mit keywords herum und jeder privilegierte user macht eben sein Kreuzchen; die Wörter mit den meisten Kreuzchen gehören dann zur "Start-keyword-Liste" (die dann den Benutzern zur Auswahl angeboten wird).

Zitat von: Dr. Kosh am  1 November 2006, 17:00:39
Also: Ich bin gerne bereit, über ein solches Thema nachzudenken (und es ggf. auch umzusetzen). Wir sollten uns aber ein vernünftiges System überlegen, das den Ansprüchen gerecht wird und dennoch halbwegs einfach zu verwalten ist.

Es ist klar, daß diese Idee nicht von einer Woche auf die andere umgesetzt werden kann/muß, zumal es kein must-have ist; und Vorrang hat sicherlich der reibungslose Ablauf der Standardfunktionalitäten. Ich möchte auch nicht den Eindruck erwecken, daß ich um jeden Preis um ein derartiges Feature kämpfe (der Vorschlag kam auch nicht von mir); es waren nur Vorschläge, wie man es machen könnte.

Gruß

Fräulein millas Gespür für den Flush

@rs007: Respekt, man könnte mittlerweile meinen, Du hättest nur auf den Thread gewartet  :respekt:

Bei der Keyword-liste seh ich aber noch Probleme.
Wie groß will man so eine Liste haben ?
200 Keywords .... dürften ein bisschen zu wenig sein  (wenn schon Raupen od. Maden im Raum stehen  ;) ) Ausserdem müssen die Keywords in dem Fall ja schon ziemlich generell gehalten sein, ergo werden die "ähnliche Filme"-Listen dann wohl auch so lang und unübersichtlich, das sie kaum noch hilfreich sind.

Braucht man 1000 od. mehr Keywords ? Dann seh ich schon wieder das Problem, das das Hinzufügen von 5 Keywords aus einer 1000+-Liste ineffektiver ist, als wenn man die Keywords eintippt.
Eine freie Keyword-wahl birgt natürlich das nicht zu verachtende Risiko, das extremer Müll eingetragen wird. Andererseits erhöht es die Chance "exotische" Verknüpfungen zwischen Filmen zu finden.

Als weitere Absicherung könnte man vor dem Generieren der Daten in dem Fall eine Autokorrektur der gängigsten Verschreiber einführen (sozusagen "eben noch auf der Korrekturforum-Bühne, jetzt schon in der Autokorrektur"  :icon_smile: ). Das kostet natürlich Rechenzeit, aber jetzt kann ich ja die Controller-Sicht über Bord werfen :icon_cool:

Oder bin ich jetzt bei der Größenordnung voll daneben ?
Welche Größenordnung haltet ihr für realistisch/sinnvoll ?
"Ist denn die ganze Welt verrückt geworden? Bin ich denn hier der einzige Idiot, dem Regeln noch was bedeuten?"

Zitat von: Dr. Sigi Fraud
Ich habe den Rassismus endgültig besiegt.

rs007

3 November 2006, 00:06:23 #13 Letzte Bearbeitung: 3 November 2006, 00:14:37 von rs007
Hallo

Zitat von: milla2201 am  2 November 2006, 18:09:00
@rs007: Respekt, man könnte mittlerweile meinen, Du hättest nur auf den Thread gewartet  :respekt:

:icon_mrgreen: Liegt wohl eher daran, daß ich beim screenshot Quiz keine Treffer lande und mich deshalb mit dem keyword-Problem beschäftige

Zitat von: milla2201 am  2 November 2006, 18:09:00
Bei der Keyword-liste seh ich aber noch Probleme.
Wie groß will man so eine Liste haben ?
200 Keywords .... dürften ein bisschen zu wenig sein  (wenn schon Raupen od. Maden im Raum stehen  ;) ) Ausserdem müssen die Keywords in dem Fall ja schon ziemlich generell gehalten sein, ergo werden die "ähnliche Filme"-Listen dann wohl auch so lang und unübersichtlich, das sie kaum noch hilfreich sind.

Also wie gesagt, ich würde in der Praxis mit einer kleinen Liste anfangen (ich will jetzt keine Zahl in den Raum werfen), schon allein deswegen, um zu testen, ob das Feature praktikabel ist; bei Fehlern konzeptioneller Art oder Performance-Problemen kann man bei kleinen Listen wohl noch besser gegensteuern als wenn die DB schon mit 1000en keywords vollgestopft ist.
Eine Obergrenze fällt mir jetzt nicht ein, das hängt wohl auch von der spezifischen Struktur der ofdb ab.
Die Start-Liste müßte allgemein gehalten werden, ja. Wie wärs damit: man sucht zu jedem Genre eine bestimmte Zahl keywords, die das Genre "auffächern", also quasi Subgenres beschreiben (zB Horror: "Zombie", "Spuk", "Psychopath", "Vampir" oÄ).

Zunächst eine Bemerkung zu den "Ähnliche-Film-Listen":
das Feature der "Ähnliche-Film-Listen" ist völlig unabhängig von dem Feature der keywords. Dh keyword-Listen sind per se "sinnvoll", stellen ein eigenständiges Feature dar und haben ihre Existenzberechtigung nicht alleine wegen der "Ähnliche-Film-Listen".

Zur Länge der "Ähnliche-Film-Listen":
Die "Ähnliche-Film-Listen" werden ja (wenn ich von meiner Idee ausgehe) nicht nur abhängig sein von den keywords, sondern auch von Bewertungen; außerdem müssen "ähnliche Filme" nicht statisch sein, sie können auch laufen unter der Rubrik "...was dir noch gefallen könnte", dh man kann bei vielen ähnlichen Filmen 3 Filme per Zufallsgenerator auswählen (zB jede Woche einen anderen). Oder man kann sich weitere Hürden überlegen, wann ein Film ähnlich ist; oder einfach den/die meistbewerteten auswählen.

Zitat von: milla2201 am  2 November 2006, 18:09:00
Braucht man 1000 od. mehr Keywords ? Dann seh ich schon wieder das Problem, das das Hinzufügen von 5 Keywords aus einer 1000+-Liste ineffektiver ist, als wenn man die Keywords eintippt.
Eine freie Keyword-wahl birgt natürlich das nicht zu verachtende Risiko, das extremer Müll eingetragen wird. Andererseits erhöht es die Chance "exotische" Verknüpfungen zwischen Filmen zu finden.

Ich persönlich halte nichts davon, von usern keywords submitten zu lassen; es wird bei Fassungen (soweit ich das mitgekriegt habe) schon so viel Müll eingetragen, wie wird das dann erst bei keyword-Listen?
Aber das ist nur meine pers. Meinung.

Zitat von: milla2201 am  2 November 2006, 18:09:00
Als weitere Absicherung könnte man vor dem Generieren der Daten in dem Fall eine Autokorrektur der gängigsten Verschreiber einführen (sozusagen "eben noch auf der Korrekturforum-Bühne, jetzt schon in der Autokorrektur"  :icon_smile: ). Das kostet natürlich Rechenzeit, aber jetzt kann ich ja die Controller-Sicht über Bord werfen :icon_cool:

Eine Autokorrektur a la Word-Rechtschreibung? Ja, man könnte bei Wörtern, die nicht im Duden stehen, die Annahme verweigern, auch eine Möglichkeit.
Und eben noch eine Hürde dahinterschalten: wenn weniger als zB 50% der abstimmenden user nicht dasselbe Wort vorgeschlagen haben, kommt es halt nicht auf "die" veröffentlichte keyword-Liste des Films.

Zitat von: milla2201 am  2 November 2006, 18:09:00
Oder bin ich jetzt bei der Größenordnung voll daneben ?
Welche Größenordnung haltet ihr für realistisch/sinnvoll ?


Ich persönlich fände eine Start-Liste von 5-10 keywords pro Genre sinnvoll, so daß die Subgenres abgedeckt werden. So könnten Dracula-Begeisterte schon mal nach allen Vampirfilmen suchen :icon_mrgreen:

--
Edit: eine weitere Idee, um die Liste klein/übersichtlicher zu halten: man könnte sich auf Substantive beschränken.
--

Die Grenze nach oben hin... wenn man alle Filme mit Bewertungen < 3.0 bzw. weniger als 100 Bewertungen unter den Tisch fallen läßt (ca. 70% davon?), einige 1000, würde ich schätzen.

Gruß



Indy

Wow, also wenn ich geahnt hätte, was mein Vorschlag hier so auslöst, dann hätte ich's glaub sein lassen :icon_mrgreen: Aber im Ernst, es freut mich, dass hier so angeregt über die Umsetzungsmöglichkeiten diskutiert wird, das zeigt mir, dass mein Glykolgehirn doch noch zu etwas zu gebrauchen ist :icon_mrgreen:

Zitat von: rs007 am  3 November 2006, 00:06:23
Zur Länge der "Ähnliche-Film-Listen":
Die "Ähnliche-Film-Listen" werden ja (wenn ich von meiner Idee ausgehe) nicht nur abhängig sein von den keywords, sondern auch von Bewertungen; außerdem müssen "ähnliche Filme" nicht statisch sein, sie können auch laufen unter der Rubrik "...was dir noch gefallen könnte", dh man kann bei vielen ähnlichen Filmen 3 Filme per Zufallsgenerator auswählen (zB jede Woche einen anderen). Oder man kann sich weitere Hürden überlegen, wann ein Film ähnlich ist; oder einfach den/die meistbewerteten auswählen.

Das könnte man z.B. ja auch über Übereinstimmungen in der Inhaltsangabe schalten, falls das nicht zuviel Rechenleistung benötigt wird. Wenn ich bei meinen "Glory" - "Gettysburg"-Beispiel bleibe, dann wäre diese Übereinstimmung "Bügerkrieg".

Zitat von: rs007 am  3 November 2006, 00:06:23
Ich persönlich halte nichts davon, von usern keywords submitten zu lassen; es wird bei Fassungen (soweit ich das mitgekriegt habe) schon so viel Müll eingetragen, wie wird das dann erst bei keyword-Listen?

Word!

Zitat von: rs007 am  3 November 2006, 00:06:23
Eine Autokorrektur a la Word-Rechtschreibung? Ja, man könnte bei Wörtern, die nicht im Duden stehen, die Annahme verweigern, auch eine Möglichkeit.
Und eben noch eine Hürde dahinterschalten: wenn weniger als zB 50% der abstimmenden user nicht dasselbe Wort vorgeschlagen haben, kommt es halt nicht auf "die" veröffentlichte keyword-Liste des Films.

Wie schaut's da mit der benötigten Rechenleistung aus? Steht z.B. "Mafiakomödie" im Duden?

Zitat von: rs007 am  3 November 2006, 00:06:23
Ich persönlich fände eine Start-Liste von 5-10 keywords pro Genre sinnvoll, so daß die Subgenres abgedeckt werden. So könnten Dracula-Begeisterte schon mal nach allen Vampirfilmen suchen :icon_mrgreen:

Dürfte für den Anfang ausreichen. Aber wie schaut's aus wenn ein Film mehrere Genres zugeordnet ist? Da könnten ja die wildesten Vorschläge für "das könnte ihnen gefallen" bei rauskommen.

Zitat von: rs007 am  3 November 2006, 00:06:23
Edit: eine weitere Idee, um die Liste klein/übersichtlicher zu halten: man könnte sich auf Substantive beschränken.

IMHO eine sehr gute Idee.



"Have no fear, Vlad is here!"

"Not A Problem!"

"Here was a generation...grown up to find all gods dead, all wars fought, all faith in man shaken."

rs007

3 November 2006, 18:26:30 #15 Letzte Bearbeitung: 3 November 2006, 18:31:02 von rs007
Hallo

Zitat von: Indy am  3 November 2006, 12:51:06
Das könnte man z.B. ja auch über Übereinstimmungen in der Inhaltsangabe schalten, falls das nicht zuviel Rechenleistung benötigt wird. Wenn ich bei meinen "Glory" - "Gettysburg"-Beispiel bleibe, dann wäre diese Übereinstimmung "Bügerkrieg".

ME nicht praktikabel, weil viele Inhaltsangaben sehr rudimentär sind; um nicht zu sagen: schlecht (sorry). 1, 2 Sätze reichen mE bei den wenigsten Filmen aus, um sich als Außenstehender ein Bild zu machen und leider erreichen halt zu viele Inhaltsangaben nur diese Länge. Somit ist es mehr oder weniger Zufall, welche Wörter grade in einer Inhaltsangabe stehen. Da könnte man IMHO gleich den Zufallsgenerator anwerfen, um einen ähnlichen Film vorzuschlagen... :icon_mrgreen:
Ich selber lese die Inhaltsangaben eigentlich nie durch, sondern klicke gleich ein externes Review an.
Aber das ist auch wieder nur meine pers. Meinung.

Zitat von: Indy am  3 November 2006, 12:51:06
Wie schaut's da mit der benötigten Rechenleistung aus? Steht z.B. "Mafiakomödie" im Duden?

Keine Ahnung, ich habe selber noch nie eine Online-Rechtschreibprüfung implementiert. "Mafiakomödie" steht nicht im Duden... was schon wieder gegen user-Eingaben von keywords spricht...
Mir fällt noch etwas ein, was dagegen spricht: user können zwar syntaktisch und semantisch richtige keywords eingeben, aber damit habe ich redundante Angaben noch nicht ausgeschlossen: was macht man, wenn der eine "Zombie" eingibt, der andere aber "Zombies"? Und wenn die user beim einen Film per Zufall mehrheitlich "Zombies" als keyword wählen, beim anderen aber "Zombie"? Dann haben wir 2 keywords, die ein und denselben Inhalt beschreiben, aber ein keyword ist für den Müll.

Zitat von: Indy am  3 November 2006, 12:51:06
Dürfte für den Anfang ausreichen. Aber wie schaut's aus wenn ein Film mehrere Genres zugeordnet ist? Da könnten ja die wildesten Vorschläge für "das könnte ihnen gefallen" bei rauskommen.

Man müßte eben in der Praxis testen, ob das System sinnvolle Vorschläge generiert (sorry, eine bessere Antwort fällt mir nicht ein, es sind eben nur theoretische Überlegungen bisher).
Bei einer "Ähnliche-Filme-Suche" hat man es im Prinzip mit einem Expertensystem zu tun, und die Wikipedia schreibt hierzu:

"Expertensysteme können für die Lösung eines Problems kontraproduktiv werden, wenn sich ohne intelligente Betreuung komplett auf sie verlassen oder keine konstante intelligente Suche nach Alternativlösungen betrieben wird. Weil jedes Expertensystem nur über einen begrenzten Datenumfang verfügt, werden ihm meistens nur Daten aus der direkten Umgebung des Problems eingespeist. Dadurch entsteht die Gefahr, wichtige grundlegende Veränderungen zu verpassen, nur konservative Lösungen oder Erklärungen zu bieten."


Gruß

TinyPortal 2.0.0 © 2005-2020