Версия для печати. Взято с сайта phpsql.ru

На главную   Назад   Вперед

Парсер всех внешних и внутренних ссылок со страницы

Получить все внешние и внутренние ссылки со страницы.
В результате получаем два массива:
1. в массиве $vnut будут содержаться только внутренние ссылки со страницы
2. в массиве $vnech получаем список внешних ссылок

$html=file_get_contents (`http://www.site.net`);
$url=`site.net`;
$vnut=array();
$vnech=array();
preg_match_all(`~<a [^<>]*href=[`"]([^`"]+)[`"][^<>]*>(((?!~si`,$html, $matches);
foreach ($matches[1] as $val) {
if (!preg_match("~^[^=]+://~", $val) || preg_match("~^[^://]+://(www.)?".$url."~i", $val)) { $vnut[]=$val; }
else $vnech[]=$val;
}
$vnut=array_unique ($vnut);
$vnech=array_unique ($vnech);
print_r ($vnut);
print_r ($vnech);

 
Предыдущая   На главную   Следующая