Тестирую phpQuery парсер nokogiri

22 июля, 2015

Попробовал phpQuery и nokogiri для парсинга html документа в DOM объект

Думал сделать парсер для того чтобы спарсить несколько тысяч изображений под личные нужды, ну вот хотелось чтобы он работал с объектами. Чтобы можно было делать конструкции вроде $details = $doc->find(‘a’)

Потратил 1-2 часа чтобы вникнуть в то как работает nokogiri. В итоге при парсинге возвращает не все элементы DOM дерева :-(

Подозреваю, что это сознательный фикс польских разработчиков площадки, а не особенности библиотеки парсера.

В общем решил задачу написанием парсера на регэкспах:

$rule = "!".$start_str."(.*?)".$stop_str."!si";
preg_match($rule,$content,$price);

Вроде работает

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *