Если вы собрались мониторить сайты конкурентов и собирать с них информацию у вас могут возникнуть вопросы о законности данного процесса и его юридических тонкостях. К тому же парсинг имеет не самую лучшую репутацию, ведь он нагружает сайт и может нарушить авторские права, поэтому будет полезно знать, какой парсинг может принести проблемы, а какой будет полезным инструментом.
Юридический смысл парсинга
Парсинг – это сбор информации в интернете, он так же, как и обычный человек, постепенно переходит со страницы на страницу и считывает нужные данные, просто во много раз быстрее.
Большинство информации в интернете находится в открытом доступе, так что теоретически парсеры не должны вызывать никаких проблем с законом, но в реальности всё немного сложнее, ведь конкуренты будут не очень рады парсерам на своих сайтах.
Российские законы явно не регулируют процессы парсинга, однако есть статьи о защите персональных данных. Недавнее судебное разбирательство между компанией «Дабл» и «Вконтакте» привело к запрету парсинга персональных данных в сети без письменного соглашения их владельцев. Что бы избежать проблем нужно знать законы и нормы, ограничивающие сбор данных в интернете.
Ограничения парсинга законодательством
Причинение вреда имуществу
Несмотря на то, что весь процесс парсинга происходит в интернете, сервера конкурентов, отвечающие на запросы вполне реальны, и при большой нагрузке на них парсеры могут принести им вред. Сложно поверить, что один дополнительный пользователь может принести существенный вред серверу, но нужно учитывать, что он отправляет запросы гораздо чаще реальных пользователей, да и самих парсеров может быть тысячи.
Сайты с проблемной архитектурой и без защиты от парсеров наиболее уязвимы, это нужно учитывать, чтобы случайно не уронить сайт конкурента, что повлечёт его убытки. Это будет расцениваться как упущенная прибыль, и если владельцу сайта удастся доказать, что убытки были получены из-за ваших парсеров, то он будет в праве потребовать возмещение убытков с вашей стороны. Однако для этого нужно доказать, что проблема заключалась не в архитектуре сайта, а также найти виновника, что будет довольно затруднительно сделать без вмешательства полиции, да и то для этого нужно возбуждение уголовного дела.
Защита интеллектуальной собственности
Интеллектуальной собственностью на сайтах в большинстве случаев будут считаться оригинальные описания товаров и фотографии, это описано в ГК РФ Статья 1259. А так как от их качества напрямую зависит уровень продаж, многие магазины нанимают копирайтеров и фотографов для наполнения сайта качественным контентом. Такую информацию будут стараться защитить, в том числе и юридически.
Но помимо фотографий и текста авторским правом может быть защищён дизайн и структура сайта, поэтому при их явном копировании правообладатель может обратиться в суд.
Ряд сайтов, типа поставщиков обычно не имеют ничего против парсинга, ведь их не беспокоит, кто будет реализовывать их товар, потому что они являются единственным производителем.
Договорное право
У большинства сайтов присутствуют пользовательские соглашения, обычно они находятся в подвале сайта. Его редко читают, но он всё ещё имеет юридическую силу. Если в нём чётко указан запрет на парсинг сайта и санкции за нарушения правил, владелец сайта в праве будет потребовать с вас выплату штрафа. Тем не менее, для вступления договора в силу, его нужно подтвердить. Существует два типа подтверждений, с помощью клика по кнопке «Я согласен с условиями», и нахождением на странице. В ряде случаев вы не сможете находиться на сайте без согласия с пользовательским соглашением при регистрации.
Допустимый парсинг
Подводя итоги можно сказать, что следующие виды парсинга не принесут вам проблем:
• Собираемая информация находится в открытом доступе и не защищается авторскими правами.
• Автоматизация осуществлена законным образом.
• Парсер не вызывает сбоев на сайте конкурента.
• Собранная информация не считается персональной.
• В противных случаях вы можете получить письменное соглашение на сбор информации у правообладателей.
Моральная сторона парсинга
Даже если ваш парсинг никаким образом не нарушает российское законодательство он всё ещё может приносить неудобство владельцам сайтов. Нагрузка на сайт будет присутствовать в любом случае, а в любую информацию был вложен труд. Вы можете спрашивать разрешения у каждого владельца сайта, но конкуренция есть конкуренция. Это не значит, что нужно воровать контент или атаковать сервера бесчисленными запросами, но использование такого эффективного инструмента, например, для мониторинга цен поможет процветанию здоровой конкуренции. К тому же вы сами не защищены от парсинга.