vb@rchiv
VB Classic
VB.NET
ADO.NET
VBA
C#
Mails senden, abrufen und decodieren - ganz easy ;-)  
 vb@rchiv Quick-Search: Suche startenErweiterte Suche starten   Impressum  | Datenschutz  | vb@rchiv CD Vol.6  | Shop Copyright ©2000-2025
 
zurück

 Sie sind aktuell nicht angemeldet.Funktionen: Einloggen  |  Neu registrieren  |  Suchen

Visual-Basic Einsteiger
Probleme mit SuchPattern bei RegEx 
Autor: Mister Burgey
Datum: 29.08.09 22:59

Hallo,

nach erfolgreicher Suche bin ich bei der Arbeiterei mit Visual-Basic2008 (Express Edit) hier im Forum bei einem Problem fündig geworden.
Leider ist es jetzt wie es kommen musste, der Ansatz steht...nur der Schliff fehlt noch.

Es hapert an der korrekten Definition des RegEx-Suchpatterns:

Darum hoffe ich, das mir jemand helfen kann.

Es dreht sich um folgends:
Es soll ein Quelltext ausgelesen werden.
In diesem Quelltext gibt es mehrere Quellblöcke, auf die ich scharf bin.
Jeder dieser Quellblöcke beinhaltet Inhalte, die herauszufiltern sind.

Diese Quellblöcke fangen mit '<input name' an und enden mit 'parts available'.
Innerhalb jedes gefundenen Quellblocks soll dann wiederrum mit folgenden Optionen gesucht werden.
Diese 'Ergebnisse' der Selektion brauche ich.

Beispiele für die Quellblöcke:
Quellblock-Demo01:
<input name="39721403" type="checkbox"></td><td>
<span class="s">'#*Ein Beispiel*#' [Gz56] (1/1)</span>
<span class="d">
<a href="/?b=ein+link#%5Bm
&g=Demo.Test.Try&p=Yenc%40power-horst.de+%28HIGer%29&max=250">collection</a>
size: 1.50 kB, parts available: 81 / 81

Quellblock-Demo02:
<input name="39844265" type="checkbox"></td><td>
<span class="s">(.;JHGüFDemo"§$%&/) [000/112] - "Demü.acb" yEnc (1/1)</span>
<span class="d">
<a href="/?b=smzt-qmr
&g=Try.Demo.Test&p=Bla%40Bla.de+%28Saugiwutz1594%29&max=250">collection</a>
size: 46.47 MB, parts available: 81 / 81

Quellblock-Demo03:
<input name="39844259" type="checkbox"></td><td>
<span class="s">(ABC-GFRE;)/%fg-ä) [041/111] - "blam3_1.y39" yEnc (1/24)</span>
<span class="d">
<a href="/?b=daw-sm3
&g=Test.Try.Demo&p=Bla%40Bla.de+%28Saugiwutz1592%29&max=250">collection</a>
size: 1.42 GB, parts available: <font color="red">2366 / 2368

Quellblock-Demo04:
<input name="39848917" type="checkbox"></td><td>
<span class="s">(?AuchNurEinTest?) [00/58] - "td-charly5.yza" yEnc (1/1)</span>
<span class="d">
<a href="/?b=td-chrly
&g=Demo.Try.Test&p=Bla%40Bla.de+%28Haugiwurlz1602%29&max=250">collection</a>
size: 745.53 MB, parts available: 1218 / 1218



Die gesamten Quellblöcke sollen nun nach dieser Art von Codeblöcken untersucht werden:
(Zumindest ist das mein Ansatzpunkt, hierzu fehlt mir die RegEx Definition)

<input name="XXXXXXXX" type="checkbox"></td><td> (die bestehenden Leerzeichen/Spaces existieren auch im Quelltext)
<input name=" steht immer am Anfang
type="checkbox"></td><td> steht immer am Ende
XXXX = 8stellige Zufallszahl (0 - 9)
kann komplett gelöscht werden, wird nicht benötigt


<span class="s">XXXXXXXXXXXXXXXXXX</span>
<span class="s"> steht immer am Anfang
</span> steht immer am Ende
XXXX wird benötigt
X = beinhaltet Zahlen/Buchstaben/Sonderzeichen in beliebiger Länge mit Freizeichen/Space
Im obigen X ist wiederrum eine Kombination aus (Y/Y) oder (YYY/YYY) oder [Y/Y] oder [YYY/YYY]
Y ist ebenfalls eine Zahlenkombi (je 1-3 stellig) , also (1/1) oder (123/999) oder [4/9] oder [456/001]
Diese Zahlenkombi '(123/456)' soll ab dem ersten Zeilen (also '(' oder '[') bis zum Ende (also: '</span>') einschliesslich gelöscht werden


<span class="d">
<a href="XXXXXXXXXXXXX&g=YYYYYYYYYYYYYYYYYY&p=XXXXXXXXXXXXXXXXX>collection</a>
<span class="d">
<a href=" steht immer am Anfang
>collection</a> steht immer am Ende
&g=YYYYYYYYYYYYYYYYYY&p= steht in der Mitte und YYYY wird benötigt
X = beinhaltet Zahlen/Buchstaben/Sonderzeichen in beliebiger Länge mit Freizeichen/Space
Y wird benötigt, dieses wird von '&g=' am Anfang und von '&p=' eingerahmt


size: XXXXX YY, parts available: xxxx / xxxx (die bestehenden Leerzeichen/Spaces existieren auch im Quelltext)
X = Zahlenkombi 1 bis 9, Dezimalzeichen ist ein Punkt (.), wie z.b: 10.15 oder 1.50
Y = wahlweise KB, MB oder GB (Kilo-Mega-GigaBytes)
parts available: + inkl. der Verfügbarkeit 1552 / 1551 wäre toll, ist eber nicht unbedingt notwendig
gelegendlich 'schummelt' sich auch ein HTML Tag mit ein (font color: siehe Quellcodebeispiel 3)
parts available: kann auch als Suchmusterende verwendet werden.


Der Vollständigkeit halben, hier noch der VB2008 Quelltext:

Code wurde abgschnitten, folgt unten
alle Nachrichten anzeigenGesamtübersicht  |  Zum Thema  |  Suchen

 ThemaViews  AutorDatum
Probleme mit SuchPattern bei RegEx1.087Mister Burgey29.08.09 22:59
Re: Probleme mit SuchPattern bei RegEx696Mister Burgey29.08.09 23:00
Re: Probleme mit SuchPattern bei RegEx671Mister Burgey30.08.09 13:00

Sie sind nicht angemeldet!
Um auf diesen Beitrag zu antworten oder neue Beiträge schreiben zu können, müssen Sie sich zunächst anmelden.

Einloggen  |  Neu registrieren

Funktionen:  Zum Thema  |  GesamtübersichtSuchen 

nach obenzurück
 
   

Copyright ©2000-2025 vb@rchiv Dieter Otter
Alle Rechte vorbehalten.
Microsoft, Windows und Visual Basic sind entweder eingetragene Marken oder Marken der Microsoft Corporation in den USA und/oder anderen Ländern. Weitere auf dieser Homepage aufgeführten Produkt- und Firmennamen können geschützte Marken ihrer jeweiligen Inhaber sein.

Diese Seiten wurden optimiert für eine Bildschirmauflösung von mind. 1280x1024 Pixel