| |

Visual-Basic EinsteigerProbleme mit SuchPattern bei RegEx | |  | Autor: Mister Burgey | Datum: 29.08.09 22:59 |
| Hallo,
nach erfolgreicher Suche bin ich bei der Arbeiterei mit Visual-Basic2008 (Express Edit) hier im Forum bei einem Problem fündig geworden.
Leider ist es jetzt wie es kommen musste, der Ansatz steht...nur der Schliff fehlt noch.
Es hapert an der korrekten Definition des RegEx-Suchpatterns:
Darum hoffe ich, das mir jemand helfen kann.
Es dreht sich um folgends:
Es soll ein Quelltext ausgelesen werden.
In diesem Quelltext gibt es mehrere Quellblöcke, auf die ich scharf bin.
Jeder dieser Quellblöcke beinhaltet Inhalte, die herauszufiltern sind.
Diese Quellblöcke fangen mit '<input name' an und enden mit 'parts available'.
Innerhalb jedes gefundenen Quellblocks soll dann wiederrum mit folgenden Optionen gesucht werden.
Diese 'Ergebnisse' der Selektion brauche ich.
Beispiele für die Quellblöcke:
Quellblock-Demo01:
<input name="39721403" type="checkbox"></td><td>
<span class="s">'#*Ein Beispiel*#' [Gz56] (1/1)</span>
<span class="d"> <a href="/?b=ein+link#%5Bm
&g=Demo.Test.Try&p=Yenc%40power-horst.de+%28HIGer%29&max=250">collection</a>
size: 1.50 kB, parts available: 81 / 81
Quellblock-Demo02:
<input name="39844265" type="checkbox"></td><td>
<span class="s">(.;JHGüFDemo"§$%&/) [000/112] - "Demü.acb" yEnc (1/1)</span>
<span class="d"> <a href="/?b=smzt-qmr
&g=Try.Demo.Test&p=Bla%40Bla.de+%28Saugiwutz1594%29&max=250">collection</a>
size: 46.47 MB, parts available: 81 / 81
Quellblock-Demo03:
<input name="39844259" type="checkbox"></td><td>
<span class="s">(ABC-GFRE;)/%fg-ä) [041/111] - "blam3_1.y39" yEnc (1/24)</span>
<span class="d"> <a href="/?b=daw-sm3
&g=Test.Try.Demo&p=Bla%40Bla.de+%28Saugiwutz1592%29&max=250">collection</a>
size: 1.42 GB, parts available: <font color="red">2366 / 2368
Quellblock-Demo04:
<input name="39848917" type="checkbox"></td><td>
<span class="s">(?AuchNurEinTest?) [00/58] - "td-charly5.yza" yEnc (1/1)</span>
<span class="d"> <a href="/?b=td-chrly
&g=Demo.Try.Test&p=Bla%40Bla.de+%28Haugiwurlz1602%29&max=250">collection</a>
size: 745.53 MB, parts available: 1218 / 1218
Die gesamten Quellblöcke sollen nun nach dieser Art von Codeblöcken untersucht werden:
(Zumindest ist das mein Ansatzpunkt, hierzu fehlt mir die RegEx Definition)
<input name="XXXXXXXX" type="checkbox"></td><td> (die bestehenden Leerzeichen/Spaces existieren auch im Quelltext)
<input name=" steht immer am Anfang
type="checkbox"></td><td> steht immer am Ende
XXXX = 8stellige Zufallszahl (0 - 9)
kann komplett gelöscht werden, wird nicht benötigt
<span class="s">XXXXXXXXXXXXXXXXXX</span>
<span class="s"> steht immer am Anfang
</span> steht immer am Ende
XXXX wird benötigt
X = beinhaltet Zahlen/Buchstaben/Sonderzeichen in beliebiger Länge mit Freizeichen/Space
Im obigen X ist wiederrum eine Kombination aus (Y/Y) oder (YYY/YYY) oder [Y/Y] oder [YYY/YYY]
Y ist ebenfalls eine Zahlenkombi (je 1-3 stellig) , also (1/1) oder (123/999) oder [4/9] oder [456/001]
Diese Zahlenkombi '(123/456)' soll ab dem ersten Zeilen (also '(' oder '[') bis zum Ende (also: '</span>') einschliesslich gelöscht werden
<span class="d"> <a href="XXXXXXXXXXXXX&g=YYYYYYYYYYYYYYYYYY&p=XXXXXXXXXXXXXXXXX>collection</a>
<span class="d"> <a href=" steht immer am Anfang
>collection</a> steht immer am Ende
&g=YYYYYYYYYYYYYYYYYY&p= steht in der Mitte und YYYY wird benötigt
X = beinhaltet Zahlen/Buchstaben/Sonderzeichen in beliebiger Länge mit Freizeichen/Space
Y wird benötigt, dieses wird von '&g=' am Anfang und von '&p=' eingerahmt
size: XXXXX YY, parts available: xxxx / xxxx (die bestehenden Leerzeichen/Spaces existieren auch im Quelltext)
X = Zahlenkombi 1 bis 9, Dezimalzeichen ist ein Punkt (.), wie z.b: 10.15 oder 1.50
Y = wahlweise KB, MB oder GB (Kilo-Mega-GigaBytes)
parts available: + inkl. der Verfügbarkeit 1552 / 1551 wäre toll, ist eber nicht unbedingt notwendig
gelegendlich 'schummelt' sich auch ein HTML Tag mit ein (font color: siehe Quellcodebeispiel 3)
parts available: kann auch als Suchmusterende verwendet werden.
Der Vollständigkeit halben, hier noch der VB2008 Quelltext:
Code wurde abgschnitten, folgt unten |  |
 | Sie sind nicht angemeldet! Um auf diesen Beitrag zu antworten oder neue Beiträge schreiben zu können, müssen Sie sich zunächst anmelden.
Einloggen | Neu registrieren |
  |
|
Neu! sevCommand 4.0 
Professionelle Schaltflächen im modernen Design!
Mit nur wenigen Mausklicks statten auch Sie Ihre Anwendungen ab sofort mit grafischen Schaltflächen im modernen Look & Feel aus (WinXP, Office, Vista oder auch Windows 8), inkl. große Symbolbibliothek. Weitere InfosTipp des Monats Oktober 2025 Matthias KozlowskiUmlaute konvertierenErsetzt die Umlaute in einer Zeichenkette durch die entsprechenden Doppelbuchstaben (aus ä wird ae, usw.) TOP Entwickler-Paket 
TOP-Preis!!
Mit der Developer CD erhalten Sie insgesamt 24 Entwickler- komponenten und Windows-DLLs. Die Einzelkomponenten haben einen Gesamtwert von 1866.50 EUR...
Jetzt nur 979,00 EURWeitere Infos
|
|
|
Copyright ©2000-2025 vb@rchiv Dieter Otter Alle Rechte vorbehalten.
Microsoft, Windows und Visual Basic sind entweder eingetragene Marken oder Marken der Microsoft Corporation in den USA und/oder anderen Ländern. Weitere auf dieser Homepage aufgeführten Produkt- und Firmennamen können geschützte Marken ihrer jeweiligen Inhaber sein.
Diese Seiten wurden optimiert für eine Bildschirmauflösung von mind. 1280x1024 Pixel
|
|