Übe deine Python Pandas Datenwissenschaft Fähigkeiten mit Problemen auf StrataScratch!
In diesem Video gehen wir das Web Scraping in Python mit der Beautiful Soup Bibliothek durch. Wir beginnen mit einer kurzen Einführung in HTML & CSS und besprechen, was Web Scraping ist. Als nächstes gehen wir auf die Grundlagen der Beautiful Soup Bibliothek ein. Dazu gehört, wie man eine Webseite lädt, die grundlegenden Befehle, die du wissen musst, wie find & find_all, das Abrufen von Strings aus HTML-Elementen usw. Der letzte Abschnitt dieses Tutorials ist eine Reihe von Übungen, in denen du deine Fähigkeiten üben kannst. In diesem Abschnitt scrapen wir eine Webseite nach Links, lernen, wie man eine Tabelle scrapt und sie in ein Pandas Dataframe lädt, und sehen, wie man ein Webbild scrapen & herunterladen kann. Ich hoffe, es gefällt dir!
Ich plane, zukünftige Videos über komplexere Dinge zu machen, die du mit Web Scraping tun kannst, sowie über andere hilfreiche Bibliotheken wie Selenium & ScraPy. Abonniere, um nichts zu verpassen.
Tritt der Python-Armee bei, um Zugang zu Vorteilen zu erhalten!
---------------------
Ressourcen, die in diesem Video verwendet wurden
---------------------
Erfahre mehr über HTML/CSS
---------------------
Video-Zeitleiste!
0:00 - Einführung & Videoübersicht
1:09 - Was ist Web Scraping?
3:51 - Einführung in HTML
Verwendung der Beautiful Soup Bibliothek (5:29)
6:31 - Laden einer Webseite (Requests-Bibliothek)
8:21 - Mit dem Scrapen beginnen
9:18 - find & find_all Methoden
16:00 - Bestimmten Text/Strings in unserem HTML finden (Regex)
18:38 - Select Methode (CSS-Pfad-Auswahlen)
25:55 - Den String/Text aus einem HTML-Element abrufen
28:17 - Eine Eigenschaft eines HTML-Elements erhalten (href, src, id, class usw.)
29:41 - Code-Navigation (Eltern, Kinder, Geschwister)
Lass uns unsere Fähigkeiten üben! (33:57)
35:53 - Übung #1: Alle sozialen Links auf der Webseite auf 3 verschiedene Arten abrufen
42:09 - Übung #2: Eine HTML-Tabelle in ein Pandas Dataframe scrapen
53:09 - Übung #3: Alle interessanten Fakten abrufen, die das Wort „ist“ enthalten
57:59 - Übung #4: Verwende Beautiful Soup, um ein Bild von einer Webseite herunterzuladen
1:04:20 - Übung #5: Löse die Mystery-Herausforderung!!!
---------------------
Folge mir in den sozialen Medien!
---------------------
Lerne Datenfähigkeiten mit praktischen Übungen & Tutorials bei Datacamp!
*Ich verwende Affiliate-Links für die Produkte, die ich empfehle. Ich kann eine Kaufprovision oder einen Empfehlungsbonus durch die Nutzung dieser Links verdienen.