Autor
|
Thema: PDF-Dateien in HTML umwandeln
|
Marcel Mitglied Beiträge: 101 Von: Registriert: Jul 2001
|
erstellt am 10.08.2002 um 20:12 Uhr
Hallo Johann,wir kommen der Sache näher (hoffe ich ![](http://www.siebenbuerger.de/ubb/wink.gif) Was ich noch wissen möchte ist: - gibt es (hast Du) die Daten, die Du in HTML umwandeln willst nur als PDF? Hast Du Daten (Tabellen) in PDF kreiert und möchtest sie jetzt nach HTML umwandeln? Oder liegen Deine (Ur)Daten (Tabellen) auch in einem anderen Format vor? Z.B. Text, Word, etc? Wenn Du die Daten nur als PDF hast, und sie jetzt umwandeln willst, wird es tatsächlich umständlich. Wenn aber die Daten (Tabellen) im Text- oder Wordformat vorliegen, dann wäre es für mich ein Kinderspiel, die Tabellen in HTML umzuwandeln. Und zwar mit "Hausmitteln" d.h. Microsoft Acces, das in jedem MSOffice-Paket dabei ist (ab Prof. Version) Das habe ich oft gemacht. Ein Beispiel findest Du h i e r Ich habe die Daten aus Mediasch im Word-Format bekommen und habe sie in HTML umgewandelt. Natürlich kenne ich die Struktur Deiner Tabellen nicht. Deshalb: kannst Du mir die bewußte PDF-Datei zumailen? Mir schwirren nämlich auch andere Ideen durch den Kopf. (z.B. habe ich die Möglichkeit sie per OCR auszulesen etc.) Bzw. wenn Du die Daten als Text (oder anderswie) hast, schick sie mir per mail bitte. Du siehst, ich lass nicht locker ![](http://www.siebenbuerger.de/ubb/smile.gif) schönen Gruß, Marcel
IP: gespeichert |
Johann Mitglied Beiträge: 490 Von: Registriert: Nov 2001
|
erstellt am 11.08.2002 um 10:11 Uhr
Hallo Marcel,die Ur-Daten sind in PDF, ich habe diese nicht erstellt. Die automatische Konvertierung mit Hilfe von Word und Excel überzeugt nicht, weil das Ergebnis einfach nur mit enormen Aufwand weiterverarbeitet werden kann. Deine Tabellen überzeugen mich, ich habe mir den Quellcode angeschaut, mit denen kann man gut arbeiten. Hast du aus Word-Dateien zuerst Acces-Dateien und letztere dann mit Acces nach HTML konvertiert? Mustest du noch weitere Arbeiten machen oder sieht das Endergebnis, nach der automatischen Konvertierung, so aus, wie auf deiner Seite? Frage mich nur, warum nicht auch aus Word und Excel so gute HTML-Dateien werden? Da wird xml, css etc. bei der Konvertierung verwendet, teilweise mit absoluten Angaben gearbeitet, so dass das Ergebnis unbrauchbar wird. Ich schicke dir eine PDF-Datei, habe die Fragen hier gestellt, damit eventuell auch andere von unseren Problemen bzw. Lösungen profitieren können. Grüße Johann P.S. Oh, die Datei ist 2,5 MB, hoffentlich habe ich jetzt nicht dein Postfach zugemüllt;-((
[Dieser Beitrag wurde von Johann am 11.08.2002 editiert.] IP: gespeichert |
Marcel Mitglied Beiträge: 101 Von: Registriert: Jul 2001
|
erstellt am 12.08.2002 um 08:45 Uhr
Hallo Johann,habe gestern Abend ein bisschen "rumexperimentiert" Also: Methode 1.) Umwandeln aus PDF->HTML geht zwar, ist aber unbefriedigend. Man braucht dazu den Adobe Acrobat (nicht Reader!), ca 299,- Eur und ein Plugin dazu (PDFMagic, ca 99,- Eur) Die Demoversion vom PDFMagic wandelt leider nur einzelne Seiten um. Doch das Resultat ist zwar nicht schlecht, doch die Schriftart wird zu klein dargestellt. Beispiel h i e r Methode 2.) Mit Acrobat und Word Im Acrobat gibt es das "Table select tool" Damit markieren, kopieren und in Word einfügen. In Word nachbearbeiten und dann als HTML speichern. Ich habe ca. 15 Min. pro Tabelle gebraucht mit dieser Methode, das Resultat kann sich sehen lassen: h i e r schönen Gruß Marcel [Dieser Beitrag wurde von Marcel am 18.08.2002 editiert.] IP: gespeichert |
Johann Mitglied Beiträge: 490 Von: Registriert: Nov 2001
|
erstellt am 12.08.2002 um 09:29 Uhr
Hallo Marcel,soweit bin ich mit dem Acrobat Reader und mit http://www.gohtm.com auch gekommen. Das erste Resultat ist so schlicht unbrauchbar. Wenn du Lust hast, dann wandle mal die absoluten Angaben um und schau bitte auf die Uhr. Ziel: die Tabellen sollten so sein wie deine in Relee. Das zweite Resultat (die Datei hat 743 KB und das bei nur einer Tabelle!!) ist immerhin lesbar, aber wie schon oben erwähnt, für das lesen auf dem Bildschirm und einfügen innnerhalb einer HTML-Datei kaum handhabbar, scrollen vertikal und vor allem horizontal ist notwendig. Also ist die einfachste Art weiterhin z.B. in FrontPage Tabellen erzeugen und per Hand die Daten eingeben. Mehr wie 15 Minuten braucht man dafür auch nicht, aber das Resultat ist auf jeden Fall besser, ich würde sagen, nur so bekommt man eine ordentliche HTML-Datei, die den Kriterien, die man an Web-Publishing mitlerweile legt, gerecht wird. PDF-Dateien erfüllen dies bei weitem nicht, PDF erzeugt nur sehr gute Resultate, wenn man dies ausdruckt und danach liest (jedenfalls besser wie HTML-Dateien jemals könnten, wenn man den Aufwand in Rechnung stellt!!). Ich ziehe aus diesen Versuchen für mich folgenden Schluss: Die Formatierungen niemals nach HTML automatisch übertragen, sondern nur die Daten (Text, Zahlen) kopieren und diese dann nochmals formatieren, auch wenn es wie bei Tabellen doch etwas mehr Aufwand erfordert. Dies ist für mich eine nochmalige Bestätigung meiner Vorgehensweise, gebe zu, aufgrund des größeren Aufwands bei Tabellen hätte ich gerne eine automatische Konvertierung eingesetzt. Wünsche dir weiterhin viel Spass beim Konvertieren, deinen Enthusiasmus auf diesem Gebiet könnte ich manchmal ganz gut gebrauchen ![](http://www.siebenbuerger.de/ubb/wink.gif) Herzliche Grüße und vielen Dank Johann
IP: gespeichert |
Marcel Mitglied Beiträge: 101 Von: Registriert: Jul 2001
|
erstellt am 12.08.2002 um 20:36 Uhr
Hallo Johann,alles klar, wenn Du von Deiner Methode überzeugt bist. Ich bin zwar ganz anderer Meinung, was PDF's im Internet betrifft, man kann Deiner Zielgruppe zumuten, ein Plugin, das auch noch kostenlos ist, zu installieren. Man muss es ja nur ein Mal downloaden. Und die Vorteile von PDF liegen auf der Hand: man kann darin suchen, scrollen, die Seite verschieben, drehen, vergrößern etc. Ubrigens verstehe ich immer noch nicht, wieso Du die verdammten (sorry) Daten nicht als z.B. Word-Doc beziehen kanst ![](http://www.siebenbuerger.de/ubb/smile.gif) Du sagtest, meine umgewandelte Tabelle (Beispiel 2 übrigens 372 KB groß, nicht 743) wäre "immerhin lesbar". Entschuldige, es ist aber eine gut gestaltete, übersichtliche, gut lesbare HTML-Seite! Natürlich war sie auf die Schnelle erzeugt, alles ist verbesserbar. Und um's Scrollen kommt keiner vorbei, vor allem bei soviel Daten. Ausserdem kann man nie alle User befriedigen (siehe Bildschirmgröße Auflösung etc) das müßtest Du doch wissen, oder? ![](http://www.siebenbuerger.de/ubb/smile.gif) Und automatische 1:1 Umwandlung PDF->HTML: meines Wissens gibt es kein solches Tool auf dem Markt. Man müßte sowas speziell programmieren. Apropos programmieren, mein Jagdinstinkt läßt nicht locker, ich könnte ein "Zwischending" programmieren, das Deine Arbeit erleichtert, vor allem, wenn es wiederkehrende Arbeiten sind, anders lohnt der Aufwand nicht ![](http://www.siebenbuerger.de/ubb/smile.gif) Ich bräuchte nur ausführlichere Angaben. Wenn's wirklich nötig ist, ich bin da! Und mache es für 0,- Geld ![](http://www.siebenbuerger.de/ubb/wink.gif) ciao bis dann Marcel [Dieser Beitrag wurde von Marcel am 18.08.2002 editiert.] IP: gespeichert |
Johann Mitglied Beiträge: 490 Von: Registriert: Nov 2001
|
erstellt am 12.08.2002 um 22:15 Uhr
Hallo Marcel,selbstverstädnlich wird es auch Verweise auf die PDF-Dateien geben, allerdings werde ich auch einige Dateien selber erstellen, zumal aus einzelnen Tabellen nur bestimmte Zahlen interessant sind bzw. kommentiert und bewertet werden sollen. Erstmals fahre ich am Mittwoch für zwei Wochen nach Gran Canaria. Danach sehen wir weiter, ob ich mit meiner Methode weiterkomme oder eventuell weitere Tabellen konvertieren muss. Nachdem ich in der letzten Zeit genügend Nässe hatte, muss ich mich erstmals trocknen ![](http://www.siebenbuerger.de/ubb/wink.gif) Freue mich, dass ich noch jemanden kennengelernt habe, der auch ehrenamtlich arbeitet. Suche auch für ein siebenbürgisches Projekt Hilfe, da sollen auch viele Dokumente (Quellen) konvertiert werden, siehe hier: http://www.siebenbuergersachsen.de/institutionen/ Hoffentlich behältst du deinen Enthusiamus noch lange ![](http://www.siebenbuerger.de/ubb/wink.gif) Grüße Johann IP: gespeichert |
Marcel Mitglied Beiträge: 101 Von: Registriert: Jul 2001
|
erstellt am 12.08.2002 um 23:55 Uhr
Hallo Johann,schönen, vor allem trocknen Urlaub und "ping" mich an wenn Du wieder da bist. Vielleicht kann ich ja meine Kenntnisse für einen guten Zweck einsetzen. bis dann Marcel IP: gespeichert |
maxy Mitglied Beiträge: 213 Von: Registriert: Mai 2002
|
erstellt am 25.10.2002 um 12:59 Uhr
Hallo Profis!Ich bin dabei, mir bei 1&1 eine HP zu erstellen, nur die Buttons wollen nicht wie ich will. Die stehn zwar bereits da, funktionieren aber leider noch nicht. Wie aktiviere ich die denn? Zudem ich auch noch Bilder in die Buttons einbauen will *ggg* Habe zwar einen dicken 400 Seiten Wälzer aner da steht es nciht so detailliert drin. Danke und Grüße! IP: gespeichert |
Robert Administrator Beiträge: 751 Von:BRD Registriert: Sep 2000
|
erstellt am 14.12.2002 um 00:24 Uhr
Pdfgrabber: PDF-Dateien in andere Formate konvertieren http://www.pcwelt.de/news/software/27964/ IP: gespeichert |
Gast8947 unregistriert
|
erstellt am 20.04.2003 um 13:11 Uhr
Ich hatte das Problem auch schon und so gelöst. Ich habe das PDF Dokument ins Internet gestellt. Nachdem ich es eine Woche später mit Google finden konnte, konnte ich es von dort im HTML Format darstellen lassen. Die temporäre Datei mittels Windows Suche (einige markante Worte aus dem Text eingeben) und unter anderem Namen abspeichern. Fertig!Grüße IP: gespeichert |
Johann Mitglied Beiträge: 490 Von: Registriert: Nov 2001
|
erstellt am 09.05.2003 um 20:58 Uhr
Ist zwar sehr umständlich, aber immerhin eine Lösung. Allerdings muss trotzdem alles neu formatiert werden. IP: gespeichert |
Marcel Mitglied Beiträge: 101 Von: Registriert: Jul 2001
|
erstellt am 26.07.2003 um 20:50 Uhr
Gast8947:hmmm... Deine Methode scheint mir unwahrscheinlich .. Bei Gelegenheit werde ich sie nachvollziehen, aber wie gesagt, mir klingt sie etwas, na wie soll ich sagen, unbrauchbar. Mal sehen .. Bis dannn IP: gespeichert | |