Парсинг на JAVASCRIPT за 10 мин!

WEB РАЗРАБОТКА

Подписаться 3,4 тыс.

Просмотров 17 тыс.

50% 1

Видео Поделиться Скачать Добавить в

Опубликовано:

21 сен 2024

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист

Посмотреть позже

Комментарии : 96

@Illya.Landar Год назад

Сделал для себя в новом стиле ролик. Как вам?

@админскийБубен Год назад

красава

@Illya.Landar Год назад

@@админскийБубен благодарю

@АртёмТриколич Год назад

отлично

@palgebo 9 месяцев назад

Дружище, на чистом JS такое возможно ? Без библиотек сторонних

@Illya.Landar 9 месяцев назад

@@palgeboможно, но зачем? Библиотеки же написаны на чистом js. Ты в итоге придешь к тому что бы создать свою библиотеку

@SIPIKEXE Год назад

жаль раньше не встречал тебя на просторах ютуба, лайк и подписка!

@Illya.Landar Год назад

Обращайся)

@ЭТОЯ-я1ц Месяц назад

Спасибо что помог, лайк + подписка)

@raff_m_d6971 6 месяцев назад

годно. продолжай

@АртёмТриколич Год назад

нужно больше видео про парсинг

@Illya.Landar Год назад

У меня есть несколько на канале

@vvks9901 10 месяцев назад

охрененно!

@Illya.Landar 9 месяцев назад

Благодарю

@madarasan0 Год назад

Довольно таки сложно, кто полностью не изучил JS, не поймет норм что происходит, нужны более детальные объяснения

@Illya.Landar Год назад

За 10 мин детально все не расскажешь. Детальную информацию по созданию парсеров можно получить заполнив форму в описании.

@artmus9687 Год назад

Так изучи JS

@uaplatformacomua 11 месяцев назад

❤❤❤❤

@nero9227 Год назад

Извините. Вроде заполнил форму, нажал на кнопку, но ничего не происходит. Это так и должно быть, или проблема в форме?

@kishiva4965 5 месяцев назад

Поверхностное видео рассматривающее частный случай - у искомого элемента не всегда есть ID чаще всего искомые значения необходимо искать в class, и такой самый используемый метод в ролике не показан.

@Illya.Landar 5 месяцев назад

Потому что всего 10 минут. Все тонкости парсинга и за 10 часов не расскажешь

@Limitation-cake 23 дня назад

Поставь вместо решетки точку

@realeast_325 9 месяцев назад

Здравствуй, отличное видео! А можешь пожалуйста еще объяснить, как вывести полученные данные в какой-нибудь файл, будь то excel документ, или в обычный текстовый документ?

@Illya.Landar 9 месяцев назад

Есть в ноде команда fs.writeFileSync() по гугли и выведи данные в файл json через эту команду

@ДЕД-л4е Год назад

Можно вопрос почему при установке Puppeteer в консоли зависает установка

@Illya.Landar Год назад

Кинь скрин мне в телеграм. Мой контакт в описании телеграм группы есть

@ДЕД-л4е Год назад

@@Illya.Landar Я уже нашёл решение спасибо

@Illya.Landar Год назад

@@ДЕД-л4е Огонь

@Ivan-ee4pz Год назад

Дополню, тоже была проблема. Решается она или прописыванием puppeteer в package.json вручную или через yarn

@botsynth 7 месяцев назад

Скажи пожалуйста, а если выпадающие списки листы содержат названия, то их так же можно спарсить?

@Illya.Landar 7 месяцев назад

Спарсить можно все

@kissis6291 Год назад

Подскажите пожалуйста, а если нужно забрать с сайта не текст, а значение атрибута(если я правильно выражаюсь). К примеру: id = “1456788_2” tittle = “75ml” price = “240”. Нужно забрать 240(значение может меняться, это цена). Какую строчку в коде нужно изменить на что? Заранее большое спасибо, не могу найти ответ нигде, не сильна в js

@Illya.Landar Год назад

получаешь не innerText а InnerHtml. Ты получаешь html в котором есть твои атрибуты. Остается их только достать

@user-ug6zg3xm4i 8 месяцев назад

Спсб. На вашем ,этом видео у меня получился мой первый парсер! Только вот форму не нахожу, где форма каторую заполнить ?

@Illya.Landar 7 месяцев назад

Супер, форма уже не работает. Ссылки на ролики в описании

@siu1941 Год назад

А если я использую антидетект браузер dolphin anty и у меня несколько прокси, как можно сделать так чтобы он открывал браузер с нужным прокси?

@Illya.Landar Год назад

Ну он открывает свой браузер, который похожь на chrome. В параметрах запуска скрипта можно установить под каким прокси ты заходишь

@seoonlyRU Год назад

палец вверх от СЕООНЛИ

@zelear_music Год назад

А как сделать без открытия браузера? Допустим если у меня linux server

@Illya.Landar Год назад

headless: true

@back_to_life0 10 месяцев назад

Без открытия браузера ты не отрендеришь страницу сайта Headless тоже запускает браузер Но не как окно, а как процесс

@romanmegagunko4650 Год назад

К сожалению форма на получение урока по парсингу не работает. Очень его хотелось бы получить

@scriptik7204 2 месяца назад

проверьте, мб забыли () в самом конце

@kryakryautochka Год назад

подскажи пожалуйста. если без vpn сайт не доступен то как мне инфу брать с него

@Illya.Landar Год назад

Прикручиваешь VPN к парсеру. А точнее прокси той страны где можно зайти свободно на сайт

@user-ug6zg3xm4i 8 месяцев назад

Скажите пжлст - здесь , в этом видео вы показываете парсер работает в канале ютуб, а как создать что бы работал в телеграмм ? в веб версии ?

@Illya.Landar 7 месяцев назад

Это отдельный ролик нужно)

@enriquevalencia7415 Год назад

Привет. В самом начале: const puppeteer = require("puppeteer"); пишет ошибку [ERR_PACKAGE_PATH_NOT_EXPORTED] и бла бла бла.. Это что то при установке puppeteer накосячилось? Ошибок не показывало при установке, что может быть?

@Illya.Landar Год назад

Да проблема с установкой или с нодой

@enriquevalencia7415 Год назад

@@Illya.Landar Вопрос закрыт. Проблема была с версиями. Теперь работает. Спасибо.

@Illya.Landar Год назад

@@enriquevalencia7415 версиями ноды? Супер что получилось. Я тоже много времени убил что бы хотя бы одну строчку кода написать, куча багов и ошибок выдавало.

@enriquevalencia7415 Год назад

@@Illya.Landar Да. Я сначала делал на старом компе, там вин7, по умолчанию ноде не ставится, надо искать более старую версию, я несколько вариантов устанавливал, всё было ок, но puppeteer не вызывался, ошибку давало [ERR_PACKAGE_PATH_NOT_EXPORTED] всё время. Затем попробовал на другом компе с вин10, всё ок, и для чистоты эксперимента на старом компе поменял систему на десятку, попробовал на нём и тоже всё ок.

@Illya.Landar Год назад

@@enriquevalencia7415 огонь

@DmitryBelkin-u1b Год назад

Привет. А подскажи..что делать если перед тем как собирать данные нужно авторизоваться на сайте?

@Illya.Landar Год назад

С помощью puppeteer можно авторизоваться а потом собрать данные. Или авторизоваться с помощью cookie

@back_to_life0 10 месяцев назад

@@Illya.Landarили зайти под профилем браузера Который под капотом пупера Стоит хромиум как ток авторизоваться Данные идут в профиль браузера и не нужно никакие cookie сохранять и передавать

@mitcheldeZ Год назад

Failed to launch the browser process! undefined. Бла-бла. Failed to load Chrome Dll from бла бла

@igrovojimpotent Год назад

Здравствуйте, а можно к этому парсеру прикрутить какой нибудь web интерейфейс?

@Illya.Landar Год назад

Можно

@igrovojimpotent Год назад

@@Illya.Landar а можете подсказать как? Видео какое-нибудь или что загуглить, просто не могу найти

@Illya.Landar Год назад

@@igrovojimpotent Делаешь из скрипта АПИ. А к Апи прикручиваешь веб сайт

@igrovojimpotent Год назад

@@Illya.Landar Спасибо большое!

@Illya.Landar Год назад

@@igrovojimpotent пожалуйста

@olegonkos 6 месяцев назад

если удалось спарсить два поля артикул и цена, то можно ли запихать новые данные в поле цена ? Конечно, доступ к учетке есть. Или это уже БД?

@Illya.Landar 6 месяцев назад

То как ты упорядовачиваешь данные зависит от тебя

@SerjioSlap 3 месяца назад

Что-то звучит сомнительно... А кто даст доступ к исполнению подобных команд на компе, когда мой сайт с сервера захочет парсить данные, когда пользователь на него зайдёт? Наверняка же есть команда, позволяющая парсить данные по ссылке прямого назначения...

@dimonskiy022 Месяц назад

По сути любой арендованный сервак в этом сможет помочь. Просто там будет исполняться код А твой сайт через апи обращается к серверу, и все

@andrewdemidyuk975 Год назад

Как парсить если сайт доступен только по VPN?

@Illya.Landar Год назад

С помощью proxy. В puppeteer есть возможность использовать прокси.

@fishingscript Год назад

Прикольно, а как сделать обход по страницам к примеру есть 10 страниц и надо все заголовки у них взять?

@Illya.Landar Год назад

Есть разные способы. Кликать на пагинацию. Переходить в цикле по ссылке если ссылка в стиле url.com&page=1 url.com&page=2 url.com&page=3 Парсить следующую ссылку в пагинации и переходить по ней. Ето основные 3 способа

@fishingscript Год назад

@@Illya.Landar а если нету пагинации? И только под ресурсы (site.ru/page/pag2)?

@Illya.Landar Год назад

@@fishingscript Ну переходи по ссылке просто вот так (site.ru/page/pag2) (site.ru/page/pag3) (site.ru/page/pag4)

@YOZHIK_YT Год назад

@@Illya.Landar А если просто в массив запихнуть все эти ссылки? Этот код спарсит их?

@Illya.Landar Год назад

@@YOZHIK_YT если сделаешь цикл то да

@evgeniykolmak5459 Год назад

Смысл открывать браузер и делать скриншот, если тайтлы берутся из разметки.

@Illya.Landar Год назад

Что бы показать человеку как работает технология puppeteer. Скриншот понятней чем сразу идти в разметку, html тэги и javascript. Ну в дальнейшем естественно показал как с разметки доставать данные.

@evgeniykolmak5459 Год назад

@@Illya.Landar мне кажется это больше запутать

@DmitriiBobrikov Год назад

А переход по страницам ? )

@Illya.Landar Год назад

Ну смотря как пагинация устроена. Если по ссылками то по ссылкам можно переходить типа так url/1 url/2 и тд в цикле. Если кнопками то page.click('путь к кнопке') Если скролить надо то window.scrollBy(0,100)

@Lotpite 11 месяцев назад

а можно запускать этот парсер на удаленном сервере ? Допстим через тг бот

@Illya.Landar 11 месяцев назад

Да на удаленном сервере, можно и нужно. И потом отправлять данные которые спарсили отправлять в тг бот

@Lotpite 11 месяцев назад

Огонь) попробовал твои штуки и заметил, что например гугл вообще в этом плане не френдли. Классы либо tailwind либо с названием рандомных букв. Как с таким обращаться?

@Illya.Landar 11 месяцев назад

@@Lotpite да гугл не френдли. При помощи мета тэгов. там кнопка с классм странным может быть но с тэгом type='button' или у родителя такое может быть особенный читаемые статический мета тэг и от него пляшешь

@Lotpite 11 месяцев назад

@@Illya.Landar спасибо, ты крут. Подписка колокольчик

@Illya.Landar 11 месяцев назад

@@Lotpiteпожалуйста обращайся