Howdy,
also ich hab folgendes Problem:
Ich habe einen Sachverhalt (2 DIN A4) als .pdf-Datei, die schreibgeschützt ist vorliegen und würde gerne wissen, ob ich das irgendwie trotzdem vllt. via Texterkennungsprogramm als Text hinterher haben kann.
Also rauskopieren geht natürlich nicht, einen Scanner habe ich hier auch nicht, mit dem ich das Ausdrucken und wieder einscannen könnte.
Gibt es irgend eine Möglichkeit, den Text "greifbar" zu machen, sodass ich ihn in eine Word-Datei kopieren kann?
Gibts Freeware-Programme, die gut sind und sowas können?
Wär nett wenn mir jemand helfen könnte.
Zitat von: Maddox am 27 Februar 2007, 11:49:01
also ich hab folgendes Problem:
Ich habe einen Sachverhalt (2 DIN A4) als .pdf-Datei, die schreibgeschützt ist vorliegen und würde gerne wissen, ob ich das irgendwie trotzdem vllt. via Texterkennungsprogramm als Text hinterher haben kann.
Also rauskopieren geht natürlich nicht, einen Scanner habe ich hier auch nicht, mit dem ich das Ausdrucken und wieder einscannen könnte.
Texterkennung AKA OCR basiert ja auf der optischen Erkennenung des Textes (OCR = optical character recognition). Alles was Du also brauchst, ist ein oder mehrere Screenshots der PDF-Datei. Diese Screenshots des "Textes" fütterst Du dann in ein OCR-Programm.
ZitatGibt es irgend eine Möglichkeit, den Text "greifbar" zu machen, sodass ich ihn in eine Word-Datei kopieren kann?
Gibts Freeware-Programme, die gut sind und sowas können?
Freeware: SimpleOCR
http://www.simpleocr.com/
Ansonsten würde ich mir an Deiner Stelle einfach den Platzhirsch downloaden: ABBYY Finereader Professional Edition
Mit der Testversion kannst Du 15 Tage voll arbeiten. Sollte für Deinen einmaligen Anwendungsfall ja wohl reichen :-)
http://www.zdnet.de/downloads/prg/0/0/de10113300-wc.html
Zitat von: Maddox am 27 Februar 2007, 11:49:01
Ich habe einen Sachverhalt (2 DIN A4) als .pdf-Datei, die schreibgeschützt ist vorliegen und würde gerne wissen, ob ich das irgendwie trotzdem vllt. via Texterkennungsprogramm als Text hinterher haben kann.
Also rauskopieren geht natürlich nicht, einen Scanner habe ich hier auch nicht, mit dem ich das Ausdrucken und wieder einscannen könnte.
Gibt es irgend eine Möglichkeit, den Text "greifbar" zu machen, sodass ich ihn in eine Word-Datei kopieren kann?
Gibts Freeware-Programme, die gut sind und sowas können?
Wenn Du mit "schreibgeschützt" meinst, dass die PDF-Datei Texte beinhaltet, die man nicht markieren und kopieren kann, gibt es Freeware-Programme, die den Schutz umgehen können. Einfach mal googlen.
Wenn die PDF-Datei keine Texte beinhaltet (d.h. Texte als Bildpunkte, z.B. wenn die PDF-Datei nur ein Scan des Originaldokumentes ist), brauchst Du ein Texterkennungsprogramm.
Zitat von: mali am 27 Februar 2007, 12:12:06
Texterkennung AKA OCR basiert ja auf der optischen Erkennenung des Textes (OCR = optical character recognition). Alles was Du also brauchst, ist ein oder mehrere Screenshots der PDF-Datei. Diese Screenshots des "Textes" fütterst Du dann in ein OCR-Programm.
Danke, mali! Dass ich da nicht von selbst draufgekommen bin....
Und jetzt nachdem ichs gemacht hab, weiß ich auch wieso du "mehrere" geschrieben hast. zuerst hatte ich 2 pro Seite gemacht und da hat er viele Fehler gemacht (hat irgendwas von wegen Auflösung erhöhen gefaselt), letztlich hab ich 5 gebraucht um die weniger als 2 Seiten Text erkennen zu lassen. Is ganz passabel geworden, paar kleine Fehler drin, aber das is okay. Kann mich noch erinnern, hatte mal vor parr Jährchen sowas gesehen, da warn die OCR-Progs noch total unuasgereift, da war man besser beraten das abzutippen und hat weniger Zeit gebraucht als die 100 Fehler zu beseitigen.
Zitat von: mali am 27 Februar 2007, 12:12:06
Ansonsten würde ich mir an Deiner Stelle einfach den Platzhirsch downloaden: ABBYY Finereader Professional Edition
Mit der Testversion kannst Du 15 Tage voll arbeiten. Sollte für Deinen einmaligen Anwendungsfall ja wohl reichen :-)
http://www.zdnet.de/downloads/prg/0/0/de10113300-wc.html
Yep, hab ich gemacht, is ja ganz easy zu handeln. Aber was sollen das Smiley... Da glaubt mir wohl jemand nicht so recht. :icon_mrgreen:
Nee, weiß ja auch nicht wieso die Profs meinen, einen Text reibgeschützt zu machen, d en wir dann abgetippt mit beilegen müssen :doof:
Zitat von: CinemaniaX am 27 Februar 2007, 12:26:22
Wenn Du mit "schreibgeschützt" meinst, dass die PDF-Datei Texte beinhaltet, die man nicht markieren und kopieren kann, gibt es Freeware-Programme, die den Schutz umgehen können. Einfach mal googlen.
Yupp, das war der Fall, einfacher Text, 2 Din A4 Seiten. HAtte mich schon gefreut dass ohne Screenshots hinzubekommen, weil man im FR pdfs reinladen kann, aber da kam dann sofort eine Passwortabfrage *lol*. Hmm die Progs von denen du sprachst sind, weiß nicht ob ide ganz kosher sind oder ist das kein Problem? Habs ja jetzt hinbekommen, aber falls nochmals sowas sein sollte.... Ginge natürlich um einiges schneller.
Alles klar, Thx nochmal, hat mir viel Zeit erspart mit meinem 1 Finger-System.
Muss das leider zwecks Aktualität wieder ausbuddeln... es ist wieder mal soweit und ich muss wieder eine DIN A4 Seite mitliefern, die wir mal wieder aus purer Schikane nicht markieren und kopieren können.
Da ich nur ungern eine ganze Seite abtippen will, und das mit den Screenshots und so doch relativ zeitraubend letztesmal war und ich die Progs auch nicht mehr habe, ist meine Frage:
Hat jemand von euch ein Programm oder Tool, mit dem man den Text aus einer schreibgeschützten Datei (ich meine, dass man den text nicht rauskopieren kann) in eine Word oder TXT-Datei kopieren kann und könnte das für mich machen? Ist nur eine DinA4 Seite und wenn man das Prog hat, dauert das doch nur eine Sekunde. Das wär mir eine große Hilfe! den text dann über pm.
wäre super.
Gruß, Maddox
Ach kommt schon Leute, will mir niemand helfen? Das dauert doch nur ein paar Sekunden für den, der ein Programm mit so einer Funktion hat. ISt nur eine Seite. Oder gebt mir wenigstens nen Hinweis auf nen Prog mit dem ich das dann selbst machen kann (sofern es nur nicht wieder mit screenshots + OCR ist).
PLS.
Maddox
Wahrscheinlich ist das Problem ja schon so gelöst, aber für zukünftige Fälle würde ich den PDF Ripper (http://www.pcfreunde.de/download/d7022/pdf-ripper/) empfehlen.