Другие заметки


  1. Тронутые плесенью страницы

    Как бы ни менялись с годами веб-интерфейсы, основная схема навигации в информационном океане остается неизменной: от списка к элементам. Соответственно, скрапер, чья цель — собрать всю имеющуюся информацию с сайта или его раздела, почти всегда работает по одному и тому же алгоритму... Каталоги почти никогда не ограничены одной страницей. Чтобы обойти все страницы, краулер почти всегда двигается "сверху вниз".

    читать дальше

social

Яндекс.Метрика