Снова про RegEx

Syrex
Дата: 28.12.2009 17:21:26
Не знаю, как сделать получение блока для парсинга сайта
<form name="FormName" action="" method="post">
   <tr bgcolor='000000'>
      <td>Text_11</td>
      <td>Text_12</td>
      <td>Text_13</td>
      <td><input name="sel[]" type="checkbox" id='chall' value="1"></td>
   </tr>
   <tr bgcolor='000000'>
      <td>Text_21</td>
      <td>Text_22</td>
      <td>Text_23</td>
      <td><input name="sel[]" type="checkbox" id='chall' value="2"></td>
   </tr>
   <tr><td colspan=4><input type="submit" name='mids_del' value="Удалить выбранные"></td></tr>
</form>
На выходе необходимо получить
Text_11,Text_12, Text_13
Text_21,Text_22, Text_23

Можно ли так сделать с помощью регулярных выражений?!
Не погу считать блок <tr></tr> - не понимаю. как считать многострочно
stimpi
Дата: 28.12.2009 18:36:53
А как xml парсить вера не позволяет ?


сделать через регулярку можно.
Если вам неважно к какому tr относится то это делается так:
Regex reg = new Regex(@"<td>(.*)</td>", RegexOptions.IgnoreCase);

            foreach (Match match in reg.Matches(@"form name=""FormName"" action= method=""post"">
   <tr bgcolor='000000'>
      <td>Text_11</td>
      <td>Text_12</td>
      <td>Text_13</td>
      <td><input name="""
        ))
            {
                Console.WriteLine(match.Result("$1"));
            }
        }
Syrex
Дата: 28.12.2009 18:41:12
Да просто в исходном текстовом файле тексто может быть разбит как построчно (как в посте) так и написан в линию.
А вот ваш парсинг я немного не понял.
Я думал, что надо сначала вытащить блокт <tr></tr>, а потом внутри запустить ещё один RegEx для парсинга <td></td>
Syrex
Дата: 29.12.2009 09:52:15
Так никто и не знает?! Может конечно и я что-то неправильно написал или непонятно?!
МСУ
Дата: 29.12.2009 09:59:34
Какой-то у Вас невалидный html. А где тег <table></table> ?
Яростный Меч
Дата: 29.12.2009 11:31:05
stimpi
А как xml парсить вера не позволяет ?
Вероятность, что хтмл с некоторого сайта есть правильный XML почти нулевая.
Syrex
Дата: 29.12.2009 11:40:58
МСУ,

Это я просто кусок взял.
Реально там большой блок ...
Syrex
Дата: 29.12.2009 12:06:23
С помощью Купуч удалось вытащить блок
<form..>..</form>
Может теперь кто подскажет, как пройтись по каждому
<tr...></tr>
Syrex
Дата: 29.12.2009 12:11:38
И совсем маленьки вопрос остался. В поле Text_11 оказывается могут быть значения, как текст. так и ссылка.
Вот как вытащить блок
<tr...>...</tr>
в котором есть поле
<a href