In diesem Artikel erfahren Sie, was Notizbücher sind und warum Sie sie verwenden sollten. Wir beschäftigen uns auch mit gehosteten Notizbüchern, die das Teilen und die Zusammenarbeit erleichtern. Dieser Artikel enthält auch Tipps, Tricks und Tastaturkürzel.
Jupyter Notebooks sind Dokumente für technische und datenwissenschaftliche Inhalte. Dieses Tutorial bietet einen Überblick über Jupyter Notebooks, ihre Komponenten und ihre Verwendung.
Wir werden Notebooks mit DataLab erkunden, einem gehosteten Notebook-Dienst, der alle Funktionen von Jupyter Notebooks bietet, zusammen mit Funktionen für die Verbindung mit Datenbanken, die Echtzeit-Zusammenarbeit und die Veröffentlichung Ihrer Arbeit.
Dieses Tutorial setzt voraus, dass Sie bereits eine Data-Science-Programmiersprache wie Python, SQL, R oder Julia verwendet haben.
Übersicht Notebooks
Notebooks kombinieren Computercode (wie Python, SQL oder R), die Ausgabe aus der Ausführung des Codes und Rich-Text-Elemente (Formatierung, Tabellen, Abbildungen, Gleichungen, Links usw.) in einem einzigen Dokument.
Der Hauptvorteil von Notebooks ist die Möglichkeit, Kommentare in Ihren Code einzufügen. Das bedeutet, dass Sie den fehleranfälligen Prozess des Kopierens und Einfügens von Analyseergebnissen in einen separaten Bericht vermeiden können. Stattdessen mischen Sie Ihre Analyse einfach mit dem Berichtstext im Notebook.
Wer sollte Jupyter Notebooks verwenden?
Jupyter Notebooks werden hauptsächlich von Datenexperten verwendet, insbesondere von Datenanalysten und Datenwissenschaftlern. Laut den Ergebnissen der Kaggle-Umfrage 2022 sind Jupyter Notebooks die beliebteste IDE für die Datenwissenschaft und werden von über 80 % der Befragten verwendet.
Arten von Jupyter Notebooks
Es gibt zwei Haupttypen von Jupyter Notebooks: gehostete und lokale Notebooks. DataCamp bietet DataLab , ein gehostetes Jupyter Notebook, das wir für den Großteil dieses Tutorials verwenden werden. DataLab ist eine hervorragende Option für Lernende und Profis, die keine lokale Umgebung einrichten möchten.
Sofern nicht anders angegeben, funktioniert die in diesem Tutorial beschriebene Funktionalität auch mit anderen Jupyter-Notebook-Versionen. Wenn Sie lieber eine lokale Umgebung verwenden möchten, können Sie Jupyter Notebook mithilfe unseres Tutorials zur Installation von Jupyter Notebook auf Ihrem Computer installieren . Marcus Schanta führt eine Liste anderer gehosteter Notebook-Plattformen .
Komponenten eines Notebooks
Ein Jupyter-Notebook besteht aus drei Hauptkomponenten: Zellen, einer Laufzeitumgebung und einem Dateisystem.
Zellen sind die einzelnen Einheiten des Notizbuchs und können entweder Text oder Code enthalten:
- Textzellen werden zum Schreiben von narrativem Text verwendet und enthalten Bilder, Links und Gleichungen.
- Textzellen werden in Markdown geschrieben, einer einfachen Auszeichnungssprache.
- Codezellen werden zum Schreiben und Ausführen von Code verwendet.
- Die Ausgabe von Codezellen wird direkt unter der Codezelle angezeigt.
- SQL-Zellen (nur DataLab) werden zum Ausführen von SQL-Abfragen verwendet, sodass Sie problemlos Daten aus einer Datenbank abrufen können.
- Mit Diagrammzellen (nur DataLab) können Visualisierungen erstellt und Pandas-Datenrahmen schnell visualisiert werden.
Die Laufzeitumgebung ist für die Ausführung des Codes im Notebook verantwortlich. Die Laufzeitumgebung kann so konfiguriert werden, dass sie verschiedene Sprachen unterstützt, darunter Python, R oder SQL.
Das Dateisystem ermöglicht Ihnen das Hochladen, Speichern und Herunterladen von Datendateien, Codedateien und Ausgaben Ihrer Analyse.
Befehlsmodus und Bearbeitungsmodus
Jupyter Notebooks verfügen über zwei verschiedene Interaktionsmodi: Befehlsmodus und Bearbeitungsmodus. Im Befehlsmodus können Sie zwischen Zellen navigieren, Zellen hinzufügen und löschen und den Zellentyp ändern. Im Bearbeitungsmodus können Sie den Inhalt einer Zelle bearbeiten.
Um in den Befehlsmodus zu wechseln, können Sie entweder die ESC-Taste drücken oder außerhalb einer Zelle klicken. Um in den Bearbeitungsmodus zu wechseln, können Sie die Eingabetaste drücken oder in eine Zelle klicken.
In DataLab können Sie auf die Schaltflächen „Text hinzufügen“ oder „Code hinzufügen“ klicken, um eine neue Zelle hinzuzufügen.
Hilfe bekommen
Für Jupyter Notebooks erhalten Sie Hilfe über die Dokumentation oder über die Option im Menü. In DataLab können Sie schnell auf Hilfe und Tastaturkürzel zugreifen, indem Sie im Menü auf die Hilfeschaltfläche klicken.
Schreiben von Texten
Textzellen werden in der Markdown-Auszeichnungssprache geschrieben, sodass Sie Text einfach schreiben und formatieren können. Im Bearbeitungsmodus können Sie Syntax wie ** ** für Fettdruck verwenden oder die Schaltflächen verwenden, um Ihren Text zu formatieren.
Hier sind einige verschiedene Optionen:
Durch Drücken von Umschalt + Eingabe oder der Schaltfläche „Anzeigen“ wird die Zelle ausgeführt und das folgende Ergebnis ausgegeben.
- Zeilen, die mit # beginnen, sind Header der obersten Ebene. Beginnen Sie mit ## für einen Header der zweiten Ebene, mit ### für einen Header der dritten Ebene und so weiter.
- Umgeben Sie Text mit **, um ihn fett zu machen, mit __, um ihn kursiv zu machen, und mit `, um ihn als Code zu formatieren.
- Beginnen Sie aufeinanderfolgende Zeilen mit -, um sie in eine Aufzählungsliste umzuwandeln.
- Um eine nummerierte Liste zu erstellen, beginnen Sie die Zeilen mit Zahlen, gefolgt von einem Punkt.
- Hyperlinks bestehen aus zwei Teilen. Der anzuzeigende Text wird in eckige Klammern gesetzt, die URL wird in Klammern gesetzt.
Schreiben und Ausführen von Code
Durch Drücken von „Code hinzufügen“ oder Eingeben eines Befehls mit (Escape) und Drücken von „B“ wird ein neuer Codeblock hinzugefügt.
Schreiben Sie Code in die Zelle, genau wie Sie es in einem Skript tun würden.
Durch Drücken von „Ausführen“ oder „STRG/CMD+Eingabe“ wird der Code ausgeführt und seine Ausgabe angezeigt.
Lesen und Schreiben von Dateien
Wenn Sie im linken Menü auf „Dateien durchsuchen und hochladen“ klicken, wird das Dateisystem aufgerufen. Wenn Sie auf das Pluszeichen klicken, können Sie eine Datei von Ihrem lokalen Computer hochladen. Unten haben wir eine einfache Textdatei mit dem Namen „hello_world.txt“ hochgeladen.
Wir können den folgenden Code verwenden, um die Datei zu öffnen, Text hinzuzufügen und dann eine neue Datei zu speichern.
Sie sehen jetzt die neue Datei im Dateisystem und sie enthält unsere Updates.
Arbeiten mit dem Dateisystem
Wir haben gezeigt, wie man eine neue Datei hochlädt, aktualisiert und erstellt. Um die neue Datei herunterzuladen, drücken Sie die drei Punkte im Dateisystem und klicken Sie auf Herunterladen.
Mit der Plus-Schaltfläche zum Erstellen neuer Dateien können auch neue Notizbücher erstellt werden, die weder Zellen noch Ausgaben enthalten.
Zellen befehligen
Sie können Zellen mit den Schaltflächen „Nach oben“ und „Nach unten“ schnell neu anordnen, wie in der Abbildung unten gezeigt.
Dadurch wird Ihr Code neu angeordnet. (Beachten Sie, dass Ihr Code möglicherweise beschädigt wird, wenn Sie versuchen, ihn in der falschen Reihenfolge auszuführen!)
Mit der Schaltfläche „Code ausblenden“ wird der Code ausgeblendet. Dies ist nützlich für sehr lange Codeblöcke, an denen Sie gerade nicht arbeiten. Dies ist auch nützlich, wenn sich die Leser Ihrer Analyse nicht für die technischen Details interessieren und nur die Ergebnisse sehen möchten.
Ebenso können Sie mit der Schaltfläche „Ausgabe ausblenden“ lange Ausgaben ausblenden.
Diese Schaltflächen können auch zusammen verwendet werden, um sowohl Code als auch Ausgabe auszublenden.
Berichte veröffentlichen (nur DataLab)
DataLab ermöglicht es Ihnen, Ihre Notizbücher als Publikationen zu veröffentlichen. Dies ist eine großartige Möglichkeit, Ihre hervorragende Arbeit zu präsentieren und mit anderen Datenwissenschaftlern zusammenzuarbeiten.
Sie können Ihr Notizbuch veröffentlichen, indem Sie im Seitenmenü auf die Schaltfläche „Veröffentlichen“ klicken. Klicken Sie dort auf „Veröffentlichen“, um Ihr Notizbuch freizugeben. Es ist eine gute Idee, das Notizbuch vor der Veröffentlichung von oben nach unten durchzugehen. Auf diese Weise können Sie Ihren Code überprüfen und sicherstellen, dass er lesbar ist, da die meisten Leute ihn von oben nach unten lesen.
Sobald Ihr Notizbuch veröffentlicht wurde, können andere Benutzer die Veröffentlichung anzeigen und einzelne Zellen kommentieren. Sie können dasselbe auch für andere tun. Dies ist eine großartige Möglichkeit, eine Diskussion zu eröffnen oder einen komplexen Codeabschnitt zu verstehen. Hier ist ein Workplace-Beispiel :
Jupyter Notebooks freigeben (nur DataLab)
Das Teilen von Arbeitsmappen ist eine weitere nützliche, nur in DataLab verfügbare Funktion. Da das Notebook gehostet wird, können Sie einen öffentlichen oder privaten, zugriffskontrollierten Link teilen, den der Empfänger selbst ausführen kann.
Dies ist eine fantastische Möglichkeit zur Zusammenarbeit. Data Science ist ein tiefgründiges und weites Feld, d. h. es wird nicht erwartet, dass eine einzelne Person alles weiß. Datenwissenschaftler müssen zusammenarbeiten, um die besten Ergebnisse zu erzielen, sei es effizienter Code, überzeugende Visualisierungen oder ein genaues Modell. DataLab ermöglicht die Zusammenarbeit in Echtzeit, wobei mehrere Personen gleichzeitig ein Notebook bearbeiten können.
Um Ihr Notizbuch freizugeben, klicken Sie oben rechts auf die Schaltfläche „Teilen“. Hier können Sie den Link kopieren, das Notizbuch privat/öffentlich machen und festlegen, wer auf das Notizbuch zugreifen kann (falls es privat ist).
Es auf die nächste Stufe bringen
Beginnen Sie Ihre Data Science-Reise noch heute, indem Sie sich kostenlos bei DataLab anmelden . Wenn Sie nicht weiterkommen, finden Sie in der DataLab-Dokumentation weitere Informationen.