Universität von Kalifornien San Diego Kostenlose Online-Bildung

Genomische Datenwissenschaft und Clustering (Bioinformatik V)

Beschreibung

Wie können wir schließen, welche Gene verschiedene Prozesse in der Zelle steuern? Wie wanderten Menschen aus Afrika aus und verbreiteten sich auf der ganzen Welt? In diesem Kurs werden wir sehen, dass diese beiden scheinbar unterschiedlichen Fragen mithilfe ähnlicher algorithmischer und maschineller Lerntechniken beantwortet werden können, die sich aus dem allgemeinen Problem der Aufteilung von Datenpunkten in verschiedene Cluster ergeben.

In der ersten Hälfte des Kurses werden wir Algorithmen zum Clustern einer Gruppe von Objekten zu einer Sammlung von Clustern auf der Grundlage ihrer Ähnlichkeit vorstellen, ein klassisches Problem in der Datenwissenschaft, und sehen, wie diese Algorithmen auf Genexpressionsdaten angewendet werden können.

In der zweiten Hälfte des Kurses werden wir ein weiteres klassisches Werkzeug der Datenwissenschaft vorstellen, die Hauptkomponentenanalyse, mit der mehrdimensionale Daten vor dem Clustering vorverarbeitet werden können, um die Zahlendimensionen stark zu reduzieren, ohne viel vom „Signal“ in der Datenverarbeitung zu verlieren Daten.

Abschließend erfahren Sie, wie Sie gängige Bioinformatik-Softwaretools anwenden, um ein echtes Problem beim Clustering zu lösen.

Preis: Kostenlos anmelden!

Sprache: Englisch

Untertitel: Englisch

Genomische Datenwissenschaft und Clustering (Bioinformatik V) - Universität von Kalifornien San Diego