Хабы: PHP
Всем привет! Сегодня поговорим о парсинг данных с сайтов медицинских клиник. Мы выбрали это направление по двум причинам: 1. это высокодоходный бизнес; 2. все катаклизмы, которые происходят в мире не сильно "качают" эту сферу к знаку минус. Т.к. отказать себе в походе в ресторан, покупке новго айфона, даже осознать невозможность взять ипотеку. Но, если появились проблемы со здоровьем - то тут не до экономии. Особенно это качается жителей больших городов. Именно поэтому мы начали парсить данные клиник г. Москвы. Также надо отметить, что разделение труда в медицинской сфере продолжаеит расти. Появляются новые узкоспециализированные специалисты. И на них есть спрос. Я сам обладаю двумя полисами (ОМС и ДМС), но за последние два года пару раз столкнулся с ситуацией, когда нужного мне специалиста ни один полис не покрывал. И пришлось рассматривать варианты получения услуги либо в государственной больнице через направление (долго и бесплатно), либо за дополнительную плату в специализированной коммерческой клинике.
И так мы взяли две топовые клиники г. Москвы, далее для простоты будем называть их Клиника_1 и Клиника_2. У Клиники_2 сеть состоит из 13 точек в Москве и 3 точки в Санкт-Петербурге.
У Клиники2 очень широкая и разнообразная сеть, хоть и ограниченная одним регионом присутствия (Москвой):
Ø 3 шт. клинико-диагностических центра;
Ø 27 шт. детских клиник;
Пару слов о нас. Мы команда из 2-х человек. Владелец продукта и разработчик. Опыт в ИТ в корпоративном сегменте за плечами довольно большой. Первые приложения писали еще в начале 2000-х (тогда они назывались программами).
За последние несколько лет перепробовали много разных идей и гипотез, участвовали и побеждали в хакатонах, Цифровой прорыв и т.п. Оба работаем в двух крупных компаниях: топ1 в цифровом дизайне/маркетинге и топ2 в банковском секторе. Цель данного исследования - попробовать себя на рынке парсинга данных. И это далеко не первае наше упражнение на тему парсинга. Ранее мы уже парсили крупные порталы рунета, также в моей предущей статье можно найти опыт реального парсинга twitter.
В этот раз Дидом переводит html в объект
Читать далее