Web Scraping Empreses de LinkedIn amb seleni i bella sopa

Bloc

Web Scraping Empreses de LinkedIn amb seleni i bella sopa

Quan vulgueu iniciar el vostre projecte, podeu utilitzar els conjunts de dades que ofereixen llocs com Kaggle , però podeu obtenir dades mitjançant el rascat web.

Voleu extreure un nombre determinat de publicacions de cada empresa i aplicar tècniques d’aprenentatge automàtic.

selector react-native

Es pot trobar directament una implementació d’aquest codi a la meva pàgina de GitHub

Quina informació voleu extreure del lloc web

  1. Nom
  2. Data
  3. Publicació
  4. M'agrada

Nota: També podeu afegir el nombre de publicacions, en aquest cas ho farem.

plantilla nativa de reacció lliure

Inspeccioneu la pàgina

Premeu F12 o feu clic amb el botó dret a la pàgina i aneu a inspeccionar

Necessiteu un coneixement bàsic sobre HTML. Tanmateix, podeu fer clic a qualsevol informació que us interessi del lloc web i coneixereu la ubicació exacta del codi de les línies HTML.

Codi Python

Aquestes dues biblioteques Python (BeautifulSoup i Selenium) faran la màgia. Podeu instal·lar Selenium i el controlador web seguint la documentació .

npm instal eines de compilació de Windows

# web-scraping #python #beautifulsoup

medium.com

Web Scraping Empreses de LinkedIn amb seleni i bella sopa

Quan vulgueu iniciar el vostre projecte, podeu utilitzar els conjunts de dades que ofereixen llocs com Kaggle, però podeu obtenir dades mitjançant el rascat web.