Парсинг из кода страницы
-
как спарсить "текст" из кода страницы? Нужно спарсить все совпадения и потом их поместить в файл.
<li gid="текст" class="">
-
@Canine Код страницы http://prntscr.com/cdforc а потом http://prntscr.com/cdfoyj "извлечь данные" и регуляркой. Это первое что в голову приходит
-
@Стас А чем нибудь можно регулярку составить? И как ее проверять, просто регулярные выражения почти не понимаю.
-
@Canine там в программе ссылка на конструктор. Продублирую https://bablosoft.github.io/RegexpConstructor/ и видео https://youtu.be/UkNvH-QNyxc
-
@Стас Спасибо! Офигенный сайт!
-
Я не могу теперь понять как добавить ко всем спаршеным значениям определенный текст. (мне нужно получить ссылки)
-
@Canine - может - парсим строку - сохраняем значение в переменную - затем, как вариант - запись в файл - и указываете [[переменная с данными]][[переменная с текстом]]
То есть например - напарсили idшников vk или ok а теперь нужно в ссылки все это оформить будет так http://vk.com/[[variable_parse]]
-
@Turutur У меня получается прикрепление только к 1 результату, так что я просто в загрузке сайта дописал.
-
@Canine said in Парсинг из кода страницы:
У меня получается прикрепление только к 1 результату, так что я просто в загрузке сайта дописал.
Кидайте исходник - посмотрим, что почем - если получается только к одному- нужно либо цикл использовать - либо список и или, но опять же в цикле) = может выложите саму тему - что хотите - сайт - что пытаетесь добиться и каким образом - мы все учимся) - прога в стадии усовершенствования - не "сцыте палить темы" = скорее всего они интересны только ВАМ!
-
@Turutur 0_1472989831226_no namw.xml ну вот пример для вк
-
@Canine Можно так как вариант
0_1472997338294_no-namw_red1.xmlЧтобы "усилить" эффект - можно использовать бесконечную прокрутку перед сбором кода страницы - тогда результатов будет больше...
-
Еще для перебора элементов списка можно использовать действие foreach