Angesichts der Beliebtheit und der Nachfrage nach Data Science und des gut dokumentierten Fachkräftemangels interessieren sich immer mehr Menschen für die Datenwissenschaft als Beruf. Im Laufe der Zeit habe ich immer mehr Fragen dazu erhalten, wie man als Datenwissenschaftler anfangen kann. Wie bei vielen anderen Berufen ist es in der Regel am schwierigsten, den ersten Job zu bekommen, da viele Arbeitgeber eine gewisse Berufserfahrung voraussetzen. Dies kann zu einem Teufelskreis führen: Wie bekommt man seine erste Stelle, wenn alle Arbeitgeber Vorkenntnisse voraussetzen?
In diesem Beitrag werde ich versuchen, Ihnen einige Ratschläge zu geben – basierend auf meiner eigenen Erfahrung, als ich vor einigen Jahren in die Datenwissenschaft wechselte, und meiner derzeitigen Erfahrung als Leiter einer Datenwissenschaftlichen Abteilung, der Dutzende von Bewerbern interviewt und jedes Jahr Hunderte von Bewerbungen prüft.
Was ist Ihr Hintergrund?
Meiner Erfahrung nach lassen sich Menschen, die eine Karriere in der Datenwissenschaft anstreben, in drei relativ unterschiedliche Gruppen einteilen. Es ist wichtig, herauszufinden, welcher dieser Gruppen Sie am ähnlichsten sind, um die besten nächsten Schritte zu finden.
Der MINT-Karrierewechsel
Dies sind Personen mit einem fortgeschrittenen akademischen Abschluss in einem technischen/wissenschaftlichen Bereich, die möglicherweise bereits einige Jahre Berufserfahrung in einem angrenzenden Bereich haben. Da der Hype um die Data Science zugenommen hat, haben sie begonnen, die Möglichkeit eines Wechsels in Betracht zu ziehen. Sie verfügen in der Regel über einen ausgeprägten Mathematik- und Forschungshintergrund und können die lineare Algebra und Statistik hinter den Modellen des maschinellen Lernens nachvollziehen. Sie haben Erfahrung im Lesen akademischer Arbeiten und lassen sich von den Formeln nicht einschüchtern. Ihre übertragbaren Fähigkeiten können ihnen helfen, relativ schnell gute Datenwissenschaftler zu werden.
Die neuen Absolventen der Data Science
Es hat zwar ein paar Jahre gedauert, aber die Universitäten haben begonnen, sich auf die Nachfrage der Industrie einzustellen, und verschiedene Fakultäten bieten jetzt Masterstudiengänge in Datenwissenschaft an. Je nach Universität können dies die Fachbereiche Statistik, Elektrotechnik oder Wirtschaftsingenieurwesen sein. Diese Abschlüsse können zwar nicht alles abdecken, aber sie entwickeln sich schnell zum Goldstandard für eine umfassende Data-Science-Ausbildung, die ein 3- oder 6‑monatiges Bootcamp nicht bieten kann. Ein gutes Programm beinhaltet auch eine Abschlussarbeit (und eine oder mehrere Veröffentlichungen), die dem Arbeitgeber die Möglichkeit gibt, Ihre Arbeit im Detail zu besprechen. Bei Vorstellungsgesprächen mit Hochschulabsolventen gehe ich auf ihre Abschlussarbeit ein und vergewissere mich, dass sie alternative Ansätze verstehen, erörtern, warum sie bestimmte Entscheidungen getroffen haben, und ermitteln, wie sie mit Feedback umgehen. Aufgrund des Umfangs einer Abschlussarbeit kann man in der Regel sehr gut einschätzen, wie jemand forscht und wie gut er sich mit der Materie auskennt – auf eine Art und Weise, die ein Kaggle-Projekt, das vor einiger Zeit durchgeführt wurde, nicht leisten kann.
Der Optimist
Dies ist jemand, der weder eine formale Data-Science-Ausbildung absolviert hat noch über einen umfassenden Statistik-/Mathe-Hintergrund verfügt. Sie haben vielleicht mehrere Jahre Erfahrung in der Datenanalyse in einem bestimmten Bereich (Finanzen, Gesundheitswesen usw.) und möchten ihre derzeitigen Fähigkeiten ergänzen, um schrittweise in eine Data-Science-Rolle zu gelangen. In der Vergangenheit haben sich mehrere Personen an mich gewandt, um sich über ihre Möglichkeiten als Data Scientist in der Fintech-Branche oder einer anderen spezifischen Branche beraten zu lassen. Auch wenn Geschäftssinn und Erfahrung in diesem Bereich wichtig sind, ist dies die falsche Denkweise. Die Gemeinsamkeiten zwischen den Data-Science-Rollen in verschiedenen Branchen sind erheblich – die Tools und Algorithmen lösen allgemeine mathematische Probleme, keine branchenspezifischen. Es ist einfacher, einem guten Datenwissenschaftler eine neue Domäne beizubringen, als einem Wirtschaftsanalytiker mit Fachkenntnissen das Programmieren beizubringen und ihm Statistik und maschinelles Lernen beizubringen. Wenn Sie ein Datenwissenschaftler sein wollen, dann wollen Sie genau das sein, kein Fintech-Datenwissenschaftler.
Wenn Sie bis hierher gelesen haben, wissen Sie wahrscheinlich, dass es viele Online-Kurse gibt, die alles, was mit Datenwissenschaft zu tun hat, lehren. Diese Kurse sind zwar grundlegend und liefern eine Menge Inhalt, aber die große Mehrheit versucht, so schnell wie möglich die meisten praktischen Informationen zu vermitteln. Das bedeutet in der Regel, dass Sie viele Modelle des maschinellen Lernens kennen lernen, aber nur eine kurze Erklärung darüber erhalten, wie der Algorithmus tatsächlich funktioniert. In vielen Kursen wird die Sache nicht durch komplexe Mathematik verkompliziert, damit sie für ein möglichst großes Publikum zugänglich bleiben. Es ist zwar durchaus möglich, Modelle zu trainieren und „Data Science“ zu betreiben, ohne die Feinheiten des Algorithmus zu verstehen, aber Ihre Möglichkeiten sind dann doch begrenzt. Angesichts des zunehmenden Trends zu automatisiertem ML wird man in naher Zukunft keinen Datenwissenschaftler mehr brauchen, um einen Algorithmus einzuschleusen und ein paar Standardoptionen auszuprobieren. Wie viele andere Berufe müssen auch Datenwissenschaftler einen Vorsprung gegenüber automatisierten Systemen haben, um ihren Arbeitsplatz zu behalten, was in der Regel ein viel tieferes Verständnis der Algorithmen bedeutet.
Da die Ausbildung zum Datenwissenschaftler sehr leicht zugänglich ist und es keine Standardqualifikationen für die Ausübung der Datenwissenschaft gibt, kann sich jeder, der einen 50-stündigen Kurs absolviert hat, selbst als Datenwissenschaftler bezeichnen. Wie auch anderswo gilt: Wenn eine Stelle stark nachgefragt wird, steigt das Angebot, um die Nachfrage zu befriedigen, und ein Zustrom neuer Bewerber beginnt, sich zu bewerben. Um eine ernsthafte Chance zu haben, in diesem Bereich Fuß zu fassen, ist eine erhebliche Zeitinvestition erforderlich.
Wie man in die Data Science einsteigt
Es gibt verschiedene Möglichkeiten, die Mindestanforderungen an Erfahrung und Wissen zu erfüllen, um eine erste Stelle im Bereich Datenwissenschaft zu erhalten. Bei der Einstellung für eine Junior-Position wird der Interviewer auf einige Dinge achten:
- Verstehen Sie die Grundlagen und die Theorie des Machine Learnings?
- Verfügen Sie über die erforderlichen Programmierkenntnisse (in der Regel Python oder R)?
- Können Sie diese beiden Punkte nachweisen (z. B. „walk the walk“, nicht nur „talk the talk“)?
Als Bewerber müssen Sie bedenken, dass die Verlustfunktion des Unternehmens asymmetrisch ist – die Einstellung eines schlechten Bewerbers kann ein viel schlechteres Ergebnis haben als die Ablehnung eines guten Bewerbers. Das bedeutet, dass die Unternehmen vorsichtig sein werden, wenn es darum geht, ein Risiko bei einem Bewerber einzugehen, der keine Erfolgsbilanz vorweisen kann. Sie müssen dem Personalverantwortlichen so gut wie möglich zeigen, dass Sie ein Kandidat mit geringem Risiko und großem Potenzial sind. Das bedeutet auch, dass Ihre Chancen relativ gering sein können und Sie emotional auf viele Absagen vorbereitet sein müssen, bevor Sie ein Angebot erhalten.
Es gibt drei Hauptwege, um das theoretische Wissen und die Fachkenntnisse zu erwerben, die für Ihre erste Stelle erforderlich sind, und diese können auf verschiedene Weise kombiniert werden:
Master-Abschluss (mit Abschlussarbeit)
Wie bereits erwähnt, ist dies heute wahrscheinlich der Goldstandard für die Ausbildung. Es kann zwar 1–2 Jahre dauern, aber die Zeit ist gut investiert, vor allem wenn man an einer bekannten Universität studiert. Das Ansehen der Universitäten ist je nach Standort unterschiedlich, daher ist es hilfreich zu wissen, welche Universität in Ihrer Nähe als gut gilt.
Bootcamp
Diese Programme dauern in der Regel 3–6 Monate bei Vollzeitprogrammen und viel länger, wenn sie in Teilzeit durchgeführt werden. Am besten achten Sie genau darauf, welchen finanziellen Anreiz das Programm für Ihre zukünftige Karriere bietet. Bei einigen Bootcamps ist es ganz einfach: Sie zahlen für die Ausbildung. Andererseits bieten die besten Bootcamps auch Einkommensbeteiligungsvereinbarungen an. In diesem Fall zahlen Sie nach Abschluss des Bootcamps nur dann einen Prozentsatz Ihres Gehalts, wenn dieses über einem bestimmten Schwellenwert liegt. Die Vereinbarung gilt in der Regel für 2 bis 4 Jahre und ist nach oben begrenzt (z. B. auf das 1,5- bis 2‑fache der anfänglichen Studiengebühren). In Israel arbeiten ITC und Y‑Data auf diese Art und Weise und legen einen größeren Schwerpunkt darauf, ihren Studenten zu helfen, ihre erste Stelle zu bekommen. Andere Bootcamps arbeiten so, dass sie Sie nach der Ausbildung zwei Jahre lang auf ihrer Gehaltsliste führen, in denen Sie an einem Projekt für ihre Kundenunternehmen arbeiten (z. B. Experis Academy in Israel). Das Bootcamp zahlt Ihr Gehalt direkt und kassiert die Differenz zwischen dem Gehalt und der Outsourcing-Gebühr, wobei dem Arbeitnehmer in der Regel eine Ausstiegsklausel angeboten wird (die seine Ausbildungskosten abdeckt). Im Allgemeinen decken diese Bootcamps eine breite Palette von Themen ab und umfassen theoretisches Wissen über maschinelles Lernen, Programmierkenntnisse, Statistik und (mindestens ein) Abschlussprojekt. Wie Sie verstehen können, bieten die verschiedenen Bootcamps unterschiedliche Anreize, um Ihre erfolgreiche Platzierung nach der Ausbildung zu gewährleisten. In manchen Fällen kann es sich lohnen, die Zeit in ein Bootcamp zu investieren, selbst wenn ein Großteil des Materials bereits bekannt ist, nur um von der Unterstützung bei der ersten Stelle zu profitieren.
Online-Kurse
Umfang und Qualität dieser Kurse haben sich grundlegend verändert und ermöglichen es jedem, weltweit von den besten Experten zu lernen. Die Tatsache, dass solch hochwertige Inhalte nun für jedermann frei zugänglich sind, hat die Einstiegshürde drastisch gesenkt. Auf einem sehr hohen Niveau kann man diese Kurse in zwei Arten unterteilen – Einführungskurse, die versuchen, ein wenig von allem im Bereich des maschinellen Lernens abzudecken, und Kurse für Fortgeschrittene, die tiefer in bestimmte Bereiche eintauchen. Mehrere der beliebten Einführungskurse können mit weniger als 80 Stunden Aufwand abgeschlossen werden. Das erfordert zwar Hingabe (vor allem, wenn man dies neben einem Vollzeitjob macht), ist aber im Vergleich zu vielen anderen hochbezahlten Berufen eine relativ geringe Zeitinvestition (denken Sie z. B. an die Zeit, die man benötigt, um Pilot, Anwalt oder Arzt zu werden). Ich habe einige Bewerber gesehen, die Andrew Ngs berüchtigten Kurs über maschinelles Lernen als ihre einzige Ausbildung in diesem Bereich angegeben haben. Ich stimme zu, dass es ein großartiger Kurs ist (es war der erste, den ich beim Übergang zu Data Science belegte), aber er war definitiv nicht ausreichend, um sich als Data Scientist zu qualifizieren. Sie sollten bei jedem Kurs, der behauptet, Ihnen das A‑Z von ML zu vermitteln, sehr vorsichtig sein. Sie mögen ein guter Einstieg in das Gebiet sein, aber Sie sollten sie als den ersten Schritt auf einer langen Reise betrachten.
Was bedeuten diese Trends für mich?
Der MINT-Karrierewechsel
Von den drei Wegen ist dies wahrscheinlich der schnellste, und wenn Sie genug Zeit investieren, sind Ihre Erfolgschancen ziemlich gut. Je näher Ihr Hintergrund an der Datenwissenschaft ist, desto besser. Je nach Ihrem Hintergrund verfügen Sie vielleicht bereits über den größten Teil des mathematischen Hintergrunds und müssen nur noch mehr in Ihre Programmierkenntnisse investieren. Für einen Arbeitgeber kann die Diskussion über die Diplomarbeit oder Dissertation eines Bewerbers zeigen, wie gut er komplexe Forschungsthemen versteht. Können sie sich in die Materie einarbeiten und schnell wieder auf den Boden der Tatsachen zurückkehren? Verstehen sie wirklich, warum sie verschiedene Entscheidungen getroffen oder bestimmte Algorithmen verwendet haben? Welchen Wert könnte ihre Forschung haben? Starke Forschungsfähigkeiten reichen für einen Datenwissenschaftler zwar nicht aus, aber die Überprüfung dieser Punkte kann dazu beitragen, das Risiko eines neuen Bewerbers zu verringern, insbesondere eines Bewerbers mit begrenzter direkter Erfahrung in diesem Bereich. Als jemand, der diesen Weg vor einigen Jahren eingeschlagen hat (mein MSc war in angewandter Physik), erlebe ich immer wieder, wie meine Ausbildung mir einen anderen Blickwinkel bei der Lösung von Problemen gibt als Kollegen mit einem Hintergrund in Mathematik, Statistik, Wirtschaft oder Biologie.
Jemand, der diesen Weg einschlägt, hat auch den Vorteil, dass er sich schnell in fortgeschritteneres Material einarbeiten kann. Wenn Sie sich erst einmal einen Überblick verschafft haben, werden Sie die Algorithmen weitgehend verstehen und ein Verständnis für die Hyperparameter entwickeln wollen. Dies ist viel einfacher, wenn Sie mit fortgeschrittener Mathematik vertraut sind.
Pro-Tipp: Wenn Sie in der Lage sind, Ihre Arbeit im Bereich Data Science / maschinelles Lernen hervorzuheben, die Sie vor Ihrem offiziellen Einstieg als Data Scientist geleistet haben, können Sie möglicherweise erreichen, dass zusätzliche Jahre Ihrer Erfahrung bei den Gehaltsverhandlungen als relevant anerkannt werden. Auch wenn Sie Ihre frühere Arbeit nicht beschönigen sollten, ist es sinnvoll, auf Ihre Erfahrungen in den Bereichen Programmierung, Datenanalyse, fortgeschrittene Statistik, Versuchsplanung, Algorithmenentwicklung oder andere angrenzende Arbeitsbereiche hinzuweisen.
Der frischgebackene Absolvent der Datenwissenschaft
Vorausgesetzt, Sie haben noch etwas Zeit bis zum Abschluss Ihres Studiums, suchen Sie nach außerschulischen Aktivitäten, mit denen Sie Erfahrungen sammeln können. Idealerweise wäre das ein Praktikum in einem Data-Science-Team. Einer meiner früheren Arbeitgeber hat jeden Sommer regelmäßig Praktikanten eingestellt und den vielversprechendsten von ihnen am Ende der Saison ein Angebot gemacht. Das war eine großartige Win-Win-Situation, und ein großer Teil der Neueinstellungen des Unternehmens kam durch dieses Programm zustande. Wenn ein Praktikum nicht möglich ist, hat Ihre Universität vielleicht ein Abschlussprojekt, in das Sie investieren können. Bei Riskified haben wir mit einer lokalen Universität zusammengearbeitet und einem ihrer Teams ein offenes Projekt zur Verfügung gestellt, an dem es unter unserer Anleitung als Abschlussarbeit arbeiten konnte. Wenn die Studenten investieren und wirklich gute Arbeit leisten (d. h. nicht nur, um ihren Kurs zu bestehen, sondern etwas, das im Unternehmen als gute Arbeit gelten würde), könnten wir daran interessiert sein, sie einzustellen oder zumindest ein Empfehlungsschreiben für zukünftige Arbeitgeber zu verfassen.
Pro-Tipp - Bei der Arbeit in der Datenwissenschaft (wie in fast allen Berufen) müssen Sie in der Lage sein, Menschen außerhalb Ihres Fachgebiets Dinge zu erklären (Anmerkung am Rande: Machen Sie nie den Fehler zu denken, dass nicht-technische Menschen nicht so schlau sind wie Sie). Bei Ihren Vorstellungsgesprächen werden Sie viel über Ihre Diplomarbeit gefragt werden. Suchen Sie sich einen klugen Freund mit begrenzten Kenntnissen im Bereich des maschinellen Lernens, der Sie dazu befragt. Können Sie ihnen erklären, was Sie getan haben und wie es sich von bestehenden Lösungen unterscheidet? Ich habe schon mit mehreren Hochschulabsolventen gesprochen, die zwar alle Details ihrer Forschungsarbeit beschreiben konnten, aber bei einleitenden Fragen auf hohem Niveau (z. B. warum ist diese Forschung wichtig?) ratlos waren.
Vergessen Sie nicht, dass Erfolg lebenslanges Lernen erfordert und Sie bisher nur eine Phase Ihrer Ausbildung abgeschlossen haben. Weiteres Lernen am Arbeitsplatz ist genauso wichtig und kann schwieriger sein, da es nicht so strukturiert ist.
Die Optimisten
Es gibt eine Menge Leute, die sich in Online-Kursen und Bootcamps zu Datenwissenschaftlern ausbilden lassen. Die Konkurrenz ist groß, und man wird keinen Job in diesem Bereich bekommen, wenn man 80 Stunden investiert. Arbeitgeber werden auf die Dauer Ihrer Kurse/Bootcamps achten und darauf, wie vertraut sie sind – Nano-Abschlüsse auf EdX oder ein 6‑monatiges Bootcamp werden viel beeindruckender sein als ein einzelner Kurs auf Udemy oder Coursera.
Meiner Meinung nach schrumpft das Zeitfenster für den Einstieg in die Datenwissenschaft ohne umfangreiche formale Ausbildung (z. B. autodidaktische Online-Kurse). Es ist zwar immer noch machbar, aber Sie müssen sich darüber im Klaren sein, dass es viele Menschen mit geringen Kenntnissen in diesem Bereich gibt und dass es viel mehr braucht, um Ihren ersten Job zu bekommen (bis September 2020 hatte Andrew Ngs Kurs 3,5 Millionen eingeschriebene Studenten). Wenn Sie diesen Weg einschlagen wollen, werden Sie wahrscheinlich immer noch mehrere Monate (sprich: Hunderte von Stunden) Kursarbeit und praktische Projekte mit einer guten Portion Glück benötigen.
Pro-Tipp: Wenn Sie können, sollten Sie Bootcamps in Betracht ziehen, die nachweislich eine Erfolgsbilanz von Absolventen haben, die eine Stelle im Bereich Data Science antreten (wenn der finanzielle Anreiz davon abhängt, umso besser). Ein mehrmonatiges Vollzeitstudium könnte zwar mehr kosten als die Investition, die Sie in Erwägung gezogen haben, aber es könnte den entscheidenden Unterschied ausmachen.
Aufgrund des langsamen, aber stetigen AutoML-Trends bedeutet dies auch, dass Sie sich weiterbilden und Ihr Fachwissen erweitern müssen, nachdem Sie Ihre erste Stelle angetreten haben. Man muss der Automatisierung immer ein paar Jahre voraus sein, und ein bisschen Paranoia kann für die langfristige Arbeitsplatzsicherheit gesund sein.
Abschließende Überlegungen
Im Vergleich zu anderen einkommensstarken und gefragten Berufen muss man nicht erst ein mehrjähriges Medizinstudium absolvieren oder tausend Flugstunden sammeln, bevor man als Datenwissenschaftler arbeiten darf. Die Nachfrage nach Datenwissenschaftlern ist zwar hoch, aber der Großteil dieser Nachfrage besteht aus sehr qualifizierten Personen, die ihren Wert nachweisen können. Sie müssen bedenken, dass es trotz fehlender gesetzlicher Hindernisse immer noch Marktkräfte gibt und die Unternehmen nicht viel Geld für jemanden mit wenig Erfahrung zahlen werden. Darüber hinaus benötigen neue Datenwissenschaftler viel Aufmerksamkeit, Schulung und Unterstützung durch erfahrenere Datenwissenschaftler. Da in den ersten Monaten fast ausschließlich das Unternehmen investiert, kann es ein Jahr dauern, bis der Beitrag eines neuen Datenwissenschaftlers wieder bei Null liegt. Paradoxerweise wird dieses Problem durch den Mangel an erfahrenen Datenwissenschaftlern noch verschärft – sie werden jetzt wirklich gebraucht, um an Problemen zu arbeiten, und können nur eine bestimmte Zeit mit der Schulung neuer Mitarbeiter verbringen.
Es ist kein einfacher Weg, aber er ist definitiv lohnend. Die Welt braucht mehr großartige Datenwissenschaftler, also fangen Sie an!
Quelle: medium.com
Erfahren Sie hier mehr über Lösungen im Bereich Machine Learning Development oder besuchen Sie eines unserer kostenlosen Webinare.