Wie Sonos im Zeitalter von Tech-Giganten einen intelligenteren Smart Speaker entwickelte.

Die Entscheidung von Sonos, einen Speaker mit Sprachsteuerung herauszubringen, bedeutete nicht nur ein neues Produkt. Es war auch eine strategische Wende. Unser Team stand dabei vor zwei Herausforderung: einen Voice-fähigen Speaker für ein Multiroom-Soundsystem zu entwickeln – das gab es noch nicht. Und wir waren jetzt auf Augenhöhe mit einigen der größten Technologieunternehmen der Welt. Zum Glück konzentriert sich Sonos seit mehr als 15 Jahren darauf, den Sound für zuhause immer weiterzuentwickeln.

Brendan Welch, Product Creation Leader
Brendan Welch, Product Creation Leader

In diesen 15 Jahren entstanden einzigartige Innovationen und Erfolgsgeschichten, die uns bei der Lösung dieser neuen Aufgabe helfen würden – eine neue Art des Musikhörens zu entwickeln. Es gibt viele sogenannte Smart Speaker. Allerdings haben wir schnell festgestellt, dass keines dieser bemerkenswerten Geräte fürs Musikhören konzipiert wurde. Sprachsteuerung und künstliche Intelligenz werden dabei hauptsächlich verwendet, um die Produktivität zu steigern, das Einkaufen zu erleichtern und die Zusammenarbeit mit bestimmten Tech-Plattformen zu fördern. (Zugegeben, man kann natürlich auch damit Musik hören.) Unser Ziel war es, einen smarteren Speaker zu entwickeln, bei dem die Freude am Hören im Mittelpunkt steht.

Das erste und wahrscheinlich schwierigste Kriterium, das wir berücksichtigen mussten, um dieses Ziel zu erreichen, war Offenheit. Sonos war schon immer offen für verschiedene Musikdienste. Und wir haben erkannt, wenn wir unserem eigenen Anspruch bei diesem neuen Produkt gerecht werden wollten, mussten wir auch für mehrere Sprachassistenten offen sein. Nur so würden die Menschen Musik auf ihre eigene Art und Weise erleben können.

Außerdem haben wir festgestellt, dass viele Smart Speaker so konzipiert sind, dass ihre Aufmerksamkeit der Technik und nicht der Musik gilt. Der Speaker musste selbstverständlich gut aussehen. Dabei ist für uns aber immer das Wichtigste, dass sich unsere Speaker natürlich in das Zuhause der Leute einfügen. Das bedeutet, dass sie sich nicht mitten im Raum befinden müssen, um großartig zu klingen. Und sie brauchen auch keine Lichter und Warnungen, um Aufmerksamkeit zu erregen.

Um diese ehrgeizige Vision zu verwirklichen, hat sich ein relativ kleines Team zusammengetan, um den Sonos One und die revolutionäre Software dahinter zu entwickeln. Was sie erschaffen haben, ist nicht nur für Sonos als Home Sound System ein großer Schritt nach vorne. Sondern auch für die Plattform, auf der neue und aufregende Dinge entstehen können, wie hier einige Insider berichten.

Von Grund auf neu entwickelt – na ja, fast.

Was braucht ein Speaker mit Sprachsteuerung? Natürlich einen Sprachassistenten. Wir wussten, dass Amazon schon einige Erfahrungen in diesem Bereich hatte. Die Echo Produkte von Amazon waren eine Inspiration. Und Alexa war zu einer bemerkenswert leistungsfähigen Voice-Plattform herangewachsen, die von einigen der fortschrittlichsten Maschinen-Lerntechnologien der Welt unterstützt wurde. Und statt Alexa ganz für sich alleine zu behalten, machte Amazon daraus eine offene Plattform, mit der jeder ohne Probleme arbeiten kann. Da war es nur logisch, dass Alexa unser erster Partner für die Sprachsteuerung wurde.

Doch bevor wir die Komponenten unseres ersten Voice-Speakers entwickeln konnten, mussten wir uns erst einmal auf das Design festlegen. “Letztendlich haben wir uns entschieden, den Play:1 als Basis zu nehmen”, erklärt Produktmanager Allan Velzy. “Der Play:1 war zu diesem Zeitpunkt unser beliebtester Speaker. Er klingt nicht nur großartig, sondern passt auch in jeden Raum.”

Allan Velzy, Product Manager
Allan Velzy, Product Manager

Doch obwohl sich der Sonos One und der Play:1 äußerlich kaum unterscheiden, haben sie nur zwei Gemeinsamkeiten: die Füße und die Basis. “Da wir Mikrofone und LED-Anzeigen hinzugefügt haben, mussten wir das Design komplett überarbeiten”, so Velzy. Diese Komponenten machen zwar nur einen kleinen Teil des Speakers aus, sie mussten aber genauso wie die Hoch- und Tieftöner an die einzigartige Architektur des Sonos One angepasst werden.

Bei den Überlegungen, wie der Sonos One aussehen sollte, befasste sich das Team intensiv mit dem Amazon Echo. “Wir wollten unbedingt eine Möglichkeit zum Ausschalten der Mikrofone einbauen”, erklärt Velzy. Beim Echo leuchtet eine rote LED-Anzeige auf, wenn die Mikrofone aus sind. “Das fühlte sich für uns allerdings irgendwie falsch an. Stattdessen haben wir uns für ein Mikrofonsymbol und eine kleine LED-Statusanzeige entschieden. Wenn das Licht aus ist, sind auch die Mikrofone aus. Die Mikrofone sind fest mit der LED-Anzeige verdrahtet. Die Mikrofone können also nicht an sein, ohne dass die LED leuchtet. Es ist nur ein kleines Feature, bietet aber große Sicherheit.”

Der Sonos One sollte sich dezent in jeden Raum einfügen, aber mit sattem Sound überzeugen.

Das Team interessierte sich auch für die visuelle Schnittstelle des Echo. Sagt man z. B. “Alexa”, leuchtet das Gerät blau. Sonos verfolgte einen anderen Ansatz. “Der Sonos One sollte sich dezent in jeden Raum einfügen, aber mit sattem Sound überzeugen. Daher entschieden wir uns für eine Audioschnittstelle”, so Velzy. “Sagt man ‘Alexa’, antwortet der Sonos One mit einem Bestätigungston.”

Ein Speaker, der genauso gut hört wie er klingt.

Dem Sonos One beizubringen Befehle zu hören, war allerdings eine echte Herausforderung. Denn bis zu diesem Projekt musste sich das Team nur damit befassen, wie der Sound aus dem Speaker kommt, nicht wie er hineingeht.

Brendan Welch spielte bei der Entwicklung der Hardware für den Sonos One eine wichtige Rolle. Er war für den Einbau der Mikrofone zuständig. “Zunächst mussten wir uns um das elektrische Design kümmern, um Interferenzen mit Sprachsignalen zu vermeiden”, erklärt er. “Danach wählten wir ein Mikrofon aus, das empfindlich genug war, um Sprachbefehle zu erkennen, und gleichzeitig dem hohen Schalldruck des Speakers standhielt.” Schließlich mussten die Mikrofone noch mit einer transparenten akustischen Barriere ausgestattet werden, um konstante Leistung und Schutz vor externen Faktoren zu gewährleisten.

Klaus Hartung, Director of Smart Audio and Voice
Klaus Hartung, Director of Smart Audio and Voice

Klaus Hartung, Director Smart Audio and Voice, und sein Team entwickelten eine Software, die Sprachbefehle von Musik, Gesprächen und anderen Hintergrundgeräuschen unterscheiden konnte. “Die Leute glauben, dass sich die Musik ganz einfach vom Mikrofonsignal trennen lässt. Doch in Wirklichkeit ist es viel komplizierter”, verrät Hartung.

Damit die Menschen den Speaker an einen beliebigen Ort im Raum stellen können, mussten wir die Echounterdrückung anwenden. “Jeder Raum und jede Position sind einzigartig”, erklärt Hartung. “Die Schallwellen werden unter anderem von der Größe des Raums, den verwendeten Baumaterialien sowie der Position des Speakers und der Personen im Raum beeinflusst.”

Damit der Sonos One das Musiksignal isolieren kann, kommt ein Algorithmus zum Einsatz, der diese Variablen einbezieht. Dieser erstellt einen Filter, der die Akustik des Raums simuliert. Mit Hilfe eines sogenannten Beamformers ist der Sonos One in der Lage, unerwünschte Geräusche, z. B. von anderen Geräten, zu unterdrücken. “Ein weiterer Algorithmus sorgt dafür, dass der Sonos One nur reagiert, wenn er das Wort ‘Alexa‘ hört. ”

Ein Smart Speaker, der wirklich smart ist.

Die Entwicklung einer Sprachsteuerung für ein ganzes Home Sound System war absolutes Neuland. Die Teams von Sonos und Amazon Alexa mussten sicherstellen, dass der Sonos One jeden Befehl ausführen konnte, der mit dem Wort ‘Alexa’ beginnt.

Mieko Kusano, Senior Director of Product
Mieko Kusano, Senior Director of Product

“Beim Echo sagt der Nutzer ‘Alexa, spiel die Beatles’, und die Musikwiedergabe beginnt. Wir wollten, dass der Sonos One genauso schnell und einfach funktioniert“, erklärt Mieko Kusano, Senior Director Product Management. Da es sich bei Sonos um ein Multiroom-System handelt, war jedoch eine tiefere Integration von Alexa erforderlich. “Ansonsten hätten wir Sprachbefehle wie ‘Alexa, sag Sonos, dass die Beatles über Spotify im Schlafzimmer gespielt werden sollen’ gehabt. Nicht besonders nutzerfreundlich“, so Kusano schmunzelnd.

Gemeinsam arbeiteten die Teams daran, die Sprachbefehle zu verbessern. “Anstatt jedes Mal ’sag Sonos‘ einfügen zu müssen, wird Alexa während der Einrichtung mit Sonos verknüpft. Und um nicht immer ‘über Spotify’ sagen zu müssen, kann in der Alexa App der bevorzugte Musikdienst festgelegt werden. Auch der Name des Raums, in dem man sich gerade befindet und Musik hören will, muss nicht extra hinzugefügt werden. Die Musik wird automatisch über den Speaker im Raum und alle gruppierten Speaker wiedergegeben”, erklärt Kusano.

Der Nutzer soll einfach nur den Sound genießen können, ohne sich mit der Technik herumschlagen zu müssen.

 

Dayn Wilberding, Creative Director of Experience
Dayn Wilberding, Creative Director of Experience

Wichtig war dem Team auch die einfache und intuitive Bedienung. Das bedeutet, dass man Sonos über unsere App, über Partner-Apps wie Spotify, die Buttons auf dem Speaker oder über die Stimme steuern kann – und zwar ohne das kleinste Problem. Selbst wenn Leute von einer Bedienung zur anderen wechseln.

“Der Nutzer soll einfach nur den Sound genießen können, ohne sich mit der Technik herumschlagen zu müssen”, sagt Dayn Wilberding, Creative Director of Experience bei Sonos. “Die Menschen sollten nicht darüber nachdenken müssen, wie die Musik gestartet wurde oder welche Schnittstelle verwendet werden muss – alles sollte ineinandergreifen.”

Mit der Zeit immer besser.

Lidiane Jones, Senior Director of Software Product Management
Lidiane Jones, Senior Director of Software Product Management

Der Sonos One sollte nicht nur funktionieren, sondern er sollte mit der Zeit auch immer besser werden. Daher haben wir eine eigene Voice-Plattform entwickelt, um mit dem rasanten technologischen Fortschritt mitzuhalten. Natürlich wird Alexa im Laufe der Zeit intelligenter werden. Genauso wie die gesamte Sonos Plattform, wenn neue AI-unterstützte Sprachassistenten hinzukommen.

Sprachsteuerung lässt die Technologie in den Hintergrund treten …

“Die Sprachsteuerung steckt noch in den Kinderschuhen”, weiß Lidiane Jones, Senior Director Software Product Management. “Daher haben wir bei der Entwicklung des Sonos One besonderen Wert auf Flexibilität für künftige Innovationen und Entwicklungen gelegt. Im Laufe der Zeit kommen dann Updates zur Unterstützung für Google, Sprachsteuerung für weitere Musikdienste und zusätzliche Funktionen in der Sonos App hinzu. Genauso wie wir viele Musikdienste unterstützen, wollten wir auch verschiedene Sprachdienste unterstützen.”

Chris Kuruc, a Principal Product Manager
Chris Kuruc, Principal Product Manager

Sonos ist ein relativ kleines Unternehmen, das am Strand von Santa Barbara begann und noch immer außerhalb der Reichweite des Silicon Valleys operiert. Daher brachte die Entwicklung eines Produkts, das so komplex ist wie der Sonos One, in kurzer Zeit einige inhärente und unvorhergesehene Risiken mit sich. Die Möglichkeit, dass die User Experience nicht den hohen Erwartungen der Kunden entsprach, war besonders abschreckend. Nach monatelangem, konzertiertem, fast hektischem Einsatz fiel die Spannung vom Team ab, und alle warteten auf die Reaktionen.

“Der Smart Speaker mit dem besten Klang, den man kaufen kann”, erklärte eine renommierte Tech-Website. “Alexa bekommt die Sound-Qualität, die sie verdient”, schrieb eine andere. Fast alle waren sich einig: Dem Sonos One ist es gelungen, Sprachsteuerung, Flexibilität und Klangqualität auf eine einzigartige Weise zu vereinen.

Michael Papish, Director of Platform Marketing
Michael Papish, Director of Platform Marketing

Für Sonos wäre dieser Erfolg nicht möglich gewesen, ohne den beispiellosen Einsatz mehrerer Teams im gesamten Unternehmen. Denn alle hatten vom ersten Moment erkannt, wie mächtig Sprachsteuerung sein würde.

“Es hatte einen Hauch von Magie”, erinnert sich Michael Papish, Director Platform Marketing, an den Beginn des Projekts Voice Control. Mittlerweile ist die Technologie zwar weitverbreitet, doch die Begeisterung der ersten Stunde ist geblieben. “Die eigentliche Magie lag in der Teamarbeit mit dem Ziel, die Technologie im Sinne des Nutzers immer weiter zu verbessern, bis sie irgendwann quasi nicht mehr wahrnehmbar ist”, so Papish. “Es ist der Beginn einer neuen Ära.”

Dieser Beitrag ist auch erhältlich in: en en-gb en-au fr it es da nl sv no