Warum Data Science wichtig ist

Im ersten Beitrag unserer Reihe zum Aufbau dateninformierter Unternehmen haben wir die wichtigsten Zutaten für den Aufbau eines dateninformierten Unternehmens zusammengefasst: den Schwerpunkt auf die Wirkung und den Aufbau einer dateninformierten Kultur. In diesem zweiten Beitrag konzentrieren wir uns darauf, warum Data Science wichtig ist, und diskutieren die Zukunft der Data Science im Kontext von Bauprodukten.

Was genau ist Data Science? Data Science ist eine wissenschaftliche und wahrheitssuchende Disziplin, die Daten verwendet, um Wissen und Erkenntnisse zu extrahieren. Data Science ist eine der am schnellsten wachsenden Funktionen und bietet bereits in allen Branchen und Studienbereichen einen enormen Mehrwert. Dennoch steckt die Datenwissenschaft noch in den Kinderschuhen und ist wie jedes sich entwickelnde Gebiet oft versucht, ihre Definition zu begrenzen. Anstatt zu kategorisieren, was als Datenwissenschaft zählt oder nicht, oder darüber zu streiten, warum wir dateninformiert, aber nicht datengetrieben sein sollten, halten wir es für äußerst wichtig, der Disziplin Raum für eine organische Entwicklung zu lassen.

Warum ist Data Science wichtig?

Dank verbesserter Konnektivität, sinkender Kosten für Cloud-Speicher und Computing und der Verfügbarkeit von Distributionsplattformen für die Erreichung von Zielgruppen ist es einfacher geworden, ein Technologieunternehmen zu gründen, ein gutes Produkt zu entwickeln und Traktion zu erlangen. Infolgedessen hat sich die Zeit, die ein Produkt benötigt, um 100 Millionen aktive Benutzer pro Monat zu erreichen, dramatisch verkürzt und schrumpft auch heute noch. Zum Beispiel dauerte es ungefähr 100 Monate, bis iTunes im Jahr 2003 100 Millionen aktive Benutzer erreichte, und nur wenige Tage, bis Pokemon Go dasselbe tat. Die folgende Tabelle enthält einige weitere gute Beispiele, beginnend mit dem Telefon.

Die Kombination aus mehr Produkten, mehr gekauften Geräten mit Internetverbindung und mehr Online-Zeit hat zu einem Anstieg des Volumens an Benutzerinteraktionsdaten geführt. Es bestand ein großes Interesse daran, diese Daten abzubauen und wichtige Erkenntnisse für die Entwicklung großartiger Produkte zu gewinnen. Die Wettbewerbsfähigkeit eines Unternehmens wird nun daran gemessen, wie erfolgreich es Analysen auf umfangreiche, unstrukturierte Datensätze aus unterschiedlichen Quellen anwendet, um Produktinnovationen voranzutreiben. Datenwissenschaftler sind daher sehr gefragt und ein Team intelligenter Datenwissenschaftler kann ein Produkt herstellen oder zerstören.

Dieses zunehmende Interesse an der Gewinnung von Erkenntnisdaten hat dazu geführt, dass Produktteams Daten verwenden, um sich auf vier bestimmte Ergebnisse zu konzentrieren.

  1. Bewertung des Gesundheitszustands des Unternehmens: Eines der wichtigsten Ergebnisse der Produktanalyse ist die Bewertung des Gesundheitszustands eines Produkts oder Unternehmens. Sobald wir den Produkterfolg anhand eines Ziels und einer Metrik definiert haben, besteht der nächste Schritt darin, die Metrik zu überwachen, um sicherzustellen, dass wir auf dem richtigen Weg sind, um das Ziel zu erreichen. Taktisch arbeiten Analysten daran, Ausreißer zu identifizieren, die Treiber für Änderungen von Metriken zu verstehen, Dashboards / Berichte / Visualisierungen usw. zu erstellen.
  2. Versenden Sie die richtigen Produkte und Funktionen: Eine weitere sehr wichtige Rolle der Analyse besteht darin, sicherzustellen, dass die richtigen Produkte und Funktionen erstellt werden. Viele Unternehmen führen zahlreiche Experimente durch und versenden Produkte, nachdem sie die Ergebnisse dieser Experimente ausgewertet haben. In der Regel helfen Datenwissenschaftler beim Entwerfen von Experimenten, identifizieren dateninformierte Hypothesen zu Phänomenen und leiten das Produktteam bei der ständigen Optimierung des Produkts durch die Datenerkenntnisse.
  3. Prognoseergebnisse und Stromerzeugungssysteme - Eine weitere Aufgabe von Datenwissenschaftlern besteht darin, Prototypen / Modelle und Stromerzeugungssysteme mit AI / ML zu erstellen. Diese Datenwissenschaftler trainieren Modelle des maschinellen Lernens eines Phänomens, um zukünftige Erwartungen und Trends vorherzusagen.
  4. Festlegen der Roadmap und Strategie für das Produkt: Eine eingehendere Untersuchung und Analyse der User Journey und der Phänomene generiert umsetzbare Erkenntnisse, die letztendlich zur Festlegung der Roadmap und Strategie für das Produkt führen. Die datengetriebene Roadmap und Strategie ist eines der wichtigsten Ergebnisse eines erstklassigen Produktanalyseteams.

Diese vier Ergebnisse haben speziell zu zwei unterschiedlichen Arten von Datenwissenschaftlern in der Branche geführt - Produktanalysten und Algorithmusentwickler.

WAS MACHEN DATENWISSENSCHAFTLER?

Der Titel Data Scientist umfasst mehrere Rollen, die sich in Unternehmen und Branchen erheblich unterscheiden. Das heißt, im Allgemeinen gibt es zwei Hauptlager von Datenwissenschaftlern:

  1. Produktanalysten, deren Aufgabe es ist, dateninformierte Storys zu liefern, die für eine Änderung des Produkts oder der Strategie eintreten. Beispielsweise ist unser SMS-Benachrichtigungssystem in Indien defekt. Daher müssen wir uns auf die Verbesserung der SMS-Benachrichtigungen in Indien konzentrieren, um das Wachstum wieder anzukurbeln.
  2. Entwickler von Algorithmen, deren Aufgabe es ist, datengesteuerte Funktionen in Produkte zu integrieren (z. B. Empfehlungen oder Suchergebnisse zu optimieren). Z.B. Die Betrugsquote in Indonesien hat zugenommen. Erstellen Sie ein neues Modell, das sich auf den jüngsten Betrugstrend in Indonesien konzentriert.

Produktanalysten konzentrieren sich auf das Setzen von Zielen und das Informieren von Produktfahrplänen und -strategien. Sie tragen zur Verbesserung der Produkte bei, indem sie ihren Gesundheitszustand bewerten und verstehen und Produktentscheidungen treffen (hauptsächlich durch Experimente). Das allgemeine Ergebnis von Produktanalysten ist ein Dokument für das Produktteam, in dem quantifizierbare Probleme, identifizierte Opportunities sowie datenbasierte Empfehlungen und Lösungen erläutert werden.

Die Hauptaufgabe eines Algorithmusentwicklers besteht darin, Daten zu nutzen, um die Produktleistung zu verbessern, um ein bestimmtes Endziel zu erreichen. Dabei werden in der Regel Ergebnisse prognostiziert oder Produktionssysteme erstellt. Algorithmusentwickler verwenden im Allgemeinen maschinelles Lernen und andere komplexe algorithmische Techniken, um Vorhersagen auf der Grundlage von Eingaben aus riesigen Datenmengen zu treffen. Im Allgemeinen haben Algorithmusentwickler Lösungsvorschläge prototypisiert und arbeiten eng mit Entwicklungsteams zusammen, um sie in der Produktion umzusetzen. Das von den Algorithmus-Entwicklern zu liefernde Produkt besteht aus Prototyp-Code und Dokumentation, die dem Engineering-Team zur Verfügung gestellt werden.

Während beide Arten von Datenwissenschaftlern eine analytische Sichtweise, quantitative Fähigkeiten und die Fähigkeit zur Priorisierung erfordern, ist es selten, eine Person zu finden, die zu beiden Rollen passt. Algorithmusentwickler benötigen anspruchsvollere technische Kenntnisse wie maschinelles Lernen und künstliche Intelligenz sowie Kenntnisse in der Softwareentwicklung, die denen der Ingenieure näher kommen. Produktanalysten sind in erster Linie Problemlöser, die sich aufgrund ihres Geschäfts, ihres Produkts und ihrer Fähigkeit unterscheiden, effektiv mit einer Vielzahl von Interessengruppen zu kommunizieren.

Während nur einige Unternehmen Algorithmenentwickler benötigen, profitieren alle Unternehmen, insbesondere diejenigen mit einer beträchtlichen Anwenderbasis, von Produktanalysten, die bei der Steuerung von Produkt-, Wettbewerbs- und anderen strategischen Herausforderungen behilflich sind. Später in dieser Reihe von Blogposts werden wir zusätzliche Anleitungen zur Einstellung, Schulung, Schulung und Verwaltung von Produktanalysten bereitstellen, damit diese auf höchstem Niveau Beiträge leisten können.

Müssen Unternehmen Algorithmenentwickler einstellen, die datengesteuerter sind, oder sollten sie Produktanalysten einstellen, die besser über Daten informiert sind? Die Ergebnisse sind rein datengesteuert, wenn Daten das einzige Signal sind, das für eine Entscheidung erforderlich ist. Im Gegensatz dazu sind Daten in dateninformierten Entscheidungen eine starke Eingabe, aber nicht die einzige Eingabe. Im Allgemeinen sind Produktanalysten dateninformiert und Algorithmusentwickler datengesteuert.

ENTWICKLUNG DER DATENWISSENSCHAFT

Stellen Sie sich eine Welt vor, in der eine Maschine alles über Sie weiß und für Sie einkaufen kann, ohne auch nur explizit danach zu fragen. kennt das Essen, das Sie mögen und kocht für Sie; kennt deine Entscheidungen und kann Entscheidungen für dich treffen und weiß, was gut für dich ist und plant dein Leben. Diese Welt ist weit entfernt von der Zukunft und erfordert künstliche Intelligenz, um einen Großteil unseres Lebens zu übernehmen. Damit wir diesen Traum verwirklichen können, müssen wir noch datengesteuerter werden.

In einer perfekten Welt mit perfekten Informationen und einem vollständigen Verständnis aller Treiber Ihres Systems und der Art und Weise, wie sie miteinander interagieren, würden die beiden Ansätze zusammenlaufen. Um ein perfektes Modell zu erstellen, muss das untersuchte Phänomen vollständig verstanden werden. Die Beziehung zwischen den Daten und dem Phänomen kann durch ein perfektes Modell (und den dazugehörigen Funktionsumfang) beschrieben werden. Um dieses Maß an Perfektion zu erreichen und auch in der Zwischenzeit Fortschritte zu erzielen, muss die Welt weiterhin Fortschritte bei der datengestützten Entscheidungsfindung erzielen. d.h. wir müssen unsere Entscheidungsfindung durch andere subjektive Maßnahmen erweitern, die noch nicht ohne weiteres vollständig quantifiziert werden können. Mit zunehmendem Verständnis der Beziehungen zwischen Objekten werden immer mehr Prozesse automatisiert und die Zukunft wird datengesteuerter sein als dateninformiert. Datengestützte Entscheidungen werden jedoch auch in den nächsten Jahrzehnten von größter Bedeutung sein, und datengestützte Entscheidungen werden sich nur mit Fortschritten von Menschen verbessern, die über Daten informiert sind.

Am anschaulichsten ist es, die Unterschiede zwischen datengestützter und datengestützter Entscheidungsfindung anhand von Beispielen zu verstehen.

  • Ziele setzen. Gute Ziele sind messbar und quantifizierbar. Ziele identifizieren und verfolgen zu können, wird zunehmend datengetrieben. Beispielsweise kann die Verfolgung der aktiven Nutzer durch Facebook vollständig automatisiert sein. Die Festlegung der richtigen vierteljährlichen und jährlichen Ziele für aktive Nutzer und Einnahmen ist jedoch möglicherweise nur teilweise automatisiert und wird weiterhin dateninformiert.
  • Roadmap und Strategie definieren. Die Erstellung eines Fahrplans und einer Strategie ist nicht quantitativ und erfordert daher datenbasierte Ansätze. Mithilfe von Daten kann beispielsweise eine Roadmap entwickelt werden, um die tägliche aktive Nutzung zu erhöhen, indem der Schwerpunkt auf der SMS-Benachrichtigung liegt. Ein guter Fahrplan berücksichtigt die relevanten Ziele, die Treiber dieser Ziele, die Hebel des Produktteams und alle möglichen Maßnahmen. Ein Großteil davon ist qualitativ, sodass der Prozess der Erstellung einer Roadmap und der Festlegung einer Strategie in erster Linie dateninformiert ist.
  • Prognose der Ergebnisse. Die Prognose der Ergebnisse erfolgt größtenteils datengesteuert. Wenn Sie beispielsweise herausfinden möchten, ob Sie einem Benutzer eine Story zeigen möchten oder nicht, müssen Sie mehrere Faktoren verstehen, einschließlich der Wahrscheinlichkeit, dass ein Benutzer auf diese Story klickt oder sie liest. Unternehmen entwickeln in der Regel Modelle, die fortlaufend wiederholt werden, um dieses spezifische Ergebnis vorherzusagen.
  • Produktionssysteme antreiben. Für Unternehmen wie PayPal ist es unerschwinglich, betrügerische Aktivitäten bei Transaktionen manuell zu ermitteln. Infolgedessen verlassen sie sich weitgehend auf maschinelles Lernen, um ihre Produktionssysteme zu betreiben und die Berechnung der Wahrscheinlichkeit einer schlechten Transaktion zu automatisieren. Ein Großteil der Entscheidungen, die auf die Bewertung der Wahrscheinlichkeit folgen, werden ebenfalls automatisiert. In Bereichen, in denen das Vertrauen in die Wahrscheinlichkeitsbewertungen geringer ist, könnte der Entscheidungsprozess über Daten informiert werden.

TAKEAWAYS

  • Die Verbesserung von Produkten und die Monetarisierung durch Daten ist in den letzten Jahren zu einem Wettbewerbsvorteil geworden. Eine starke und gut organisierte Datenorganisation ist ein starkes Unterscheidungsmerkmal.
  • Datenwissenschaftler treiben unternehmensweit wichtige Produktentscheidungen voran und entwickeln Algorithmen der nächsten Generation, um die Entscheidungsfindung zu verbessern.
  • Die Welt wird weiterhin zunehmend datengesteuert sein, aber datengestützte Entscheidungen bleiben relevant.

Diese Arbeit ist ein Produkt des Data Science-Teams von Sequoia Capital. Chandra Narayanan, Hem Wadhar und Ahry Jeon haben diesen Beitrag geschrieben. Die vollständige Reihe zu Data Science finden Sie hier. Bitte senden Sie eine E-Mail an data-science@sequoiacap.com mit Fragen, Kommentaren und anderem Feedback.

Diese Geschichte wurde in The Startup veröffentlicht, der größten Veröffentlichung zu Unternehmertum von Medium, gefolgt von +432.678 Personen.

Abonnieren Sie hier unsere Top Stories.