Re: Automatisierte TextVerarbeitung
- From: "nobody" <nobody@xxxxxxxxxxx>
- Date: Mon, 5 Jun 2006 09:59:11 +0200
"Jo" <dummy_1943@xxxxxxx> schrieb im Newsbeitrag....
news:1149480137.912406.60070@xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxMoin moin,
ich möchte gerne aus Dateien Text extrahieren - rund um ein Suchwort!
..ein Beispiel, um´s etwas konkreter zu machen:
In einer "index.html" möchte ich das Wort "tos" suchen und von dort
bis zum vorherigen "http" alles makieren und ausschneiden / kopieren
(...src="http://irgendNEseite/disk_image001.tos"...).
..oder nach "disk_image007" suchen und dann rückwärts bis "http" und
vorwärts bis "tos" makieren.
He Jo
Das Html-Dokument mit einem Webbrowser oeffnen und dann gibt es sicher eine
Moeglichkeit den Quell-Text (Source)
mit einen Editor anzusehen.
z.B.: Internet-Explorer : rechte Maustaste/Quelltext ansehen.
Automatisieren kann man dies auch :
Ich habe eine Exe welches man aus der Dos-Box, unter Angabe der Url aufrufen
kann, welches das Html-File dann abspeichert.
Danach koennte man das gespeicherte File mittels AWK bearbeiten und die
Ergebnisse deponieren. Kann alles innerhalb
eines *.bat erfolgen.
AWK gibt es auch als Freeware fuer Windows. AWK st eine einfache
Scriptsprache fuer Ascii-Files.
Eine andere Variante, fuer einfachere Dinge, waere ein sogenanntes
BookMarklet. Dies ist eigentlich nur ein kurzes Javascript,
welches man als Bookmark abspeichert. Hat man das zu analysierende Html-File
im Browser, so ruft man das Bookmarklet
auf und dieses listet z.b. alle Hyperlinks in einem eigenen Fenster auf.
Wenn Du einen dieser Wege gehen moechtest, dann "mehle" mir und ich sende
Dir weitere Informationen.
liebe Gruesse
Reinhard
reinhard dot skarbal at aon dot at
Als subjekt verwende JO-AWK, sonst kommt die Mail in den Junk-Mail-Ordner
:-)
.
- Follow-Ups:
- Re: Automatisierte TextVerarbeitung
- From: Jo
- Re: Automatisierte TextVerarbeitung
- From: Jo
- Re: Automatisierte TextVerarbeitung
- References:
- Automatisierte TextVerarbeitung
- From: Jo
- Automatisierte TextVerarbeitung
- Prev by Date: Re: Herunterfahren vs. Ruhezustand
- Next by Date: In Ruhezustand wechseln
- Previous by thread: Automatisierte TextVerarbeitung
- Next by thread: Re: Automatisierte TextVerarbeitung
- Index(es):