Xpoint
   [напомнить пароль]

Регулярное выражение для подсчета ссылок на странице

Метки: [без меток]
2007-11-07 22:34:22 [обр] Mikhail[досье]

Добрый день!
Подскажите, пожалуйста, каким образом составить регулярное выражение, чтобы на выходе после обработки статьи с кучей ссылок получить массив ссылок, являющихся внутренними для сайта(<a href="/example/url">ссылка</a>). Конечно, внутренняя ссылка может быть и записана через абсолютный путь, но тогда ее легко определить уже после проверки на наличие "родного" доменного имени.
Внешние я определяю так в массив:

preg_match_all('(http://[^\s]+)' , $txt, $arr);

 
Со внутренними что-то не выходит...

спустя 11 часов [обр] Михаил Кюршин aka ya-ya(69/414)[досье]
используйте lookahead assertion
href=['"](?!http://)
спустя 1 час 38 минут [обр] Алексей Севрюков(162/1280)[досье]
Mikhail[досье]
  1. Ваш скрипт считает не ссылки как таковые, а только количество вхождений строк http://xxx.yyy (не знаю, может быть Вам так и нужно?).
  2. Если все таки Вам нужно посчитать ссылки (тэги A), то тогда регулярным выражением надо сперва собрать теги, а потом проверить у каждой href.
Powered by POEM™ Engine Copyright © 2002-2005