Парсинг из кода страницы

Canine

как спарсить "текст" из кода страницы? Нужно спарсить все совпадения и потом их поместить в файл.
<li gid="текст" class="">

Стас

@Canine Код страницы http://prntscr.com/cdforc а потом http://prntscr.com/cdfoyj "извлечь данные" и регуляркой. Это первое что в голову приходит

Canine

@Стас А чем нибудь можно регулярку составить? И как ее проверять, просто регулярные выражения почти не понимаю.

Стас

@Canine там в программе ссылка на конструктор. Продублирую https://bablosoft.github.io/RegexpConstructor/ и видео https://youtu.be/UkNvH-QNyxc

Canine

@Стас Спасибо! Офигенный сайт!

Canine

Я не могу теперь понять как добавить ко всем спаршеным значениям определенный текст. (мне нужно получить ссылки)

Turutur

@Canine - может - парсим строку - сохраняем значение в переменную - затем, как вариант - запись в файл - и указываете [[переменная с данными]][[переменная с текстом]]

То есть например - напарсили idшников vk или ok а теперь нужно в ссылки все это оформить будет так http://vk.com/[[variable_parse]]

Canine

@Turutur У меня получается прикрепление только к 1 результату, так что я просто в загрузке сайта дописал.

Turutur

@Canine said in Парсинг из кода страницы:

У меня получается прикрепление только к 1 результату, так что я просто в загрузке сайта дописал.

Кидайте исходник - посмотрим, что почем - если получается только к одному- нужно либо цикл использовать - либо список и или, но опять же в цикле) = может выложите саму тему - что хотите - сайт - что пытаетесь добиться и каким образом - мы все учимся) - прога в стадии усовершенствования - не "сцыте палить темы" = скорее всего они интересны только ВАМ!

Canine

@Turutur 0_1472989831226_no namw.xml ну вот пример для вк

Turutur

@Canine Можно так как вариант
0_1472997338294_no-namw_red1.xml

Чтобы "усилить" эффект - можно использовать бесконечную прокрутку перед сбором кода страницы - тогда результатов будет больше...

support

Еще для перебора элементов списка можно использовать действие foreach