Microsoft führt automatische Musikerkennung und Rauschunterdrückung in Teams ein

Microsoft führt automatische Musikerkennung und Rauschunterdrückung in Teams ein

Der Einsatz von Online-Kollaborations- und Kommunikationssoftware ist im Zeitalter der hybriden Arbeit enorm wichtig geworden. Ein solches Programm ist Microsoft Teams, das das Unternehmen häufig aktualisiert, um die Verwendung für verschiedene Kunden zu vereinfachen. Jetzt hat das in Redmond ansässige Technologieunternehmen eine Reihe von Audioverbesserungen für seine Kommunikationsplattform angekündigt , und obwohl nicht alle neu sind, sind sie sicherlich willkommen.

Etwas, das Microsoft kürzlich in Teams eingeführt hat, ist ein High-Fidelity-Musikmodus. Diese Funktion ist wichtig, da sie zahlreiche Anwendungsfälle wie Musikunterricht und medizinische Hinweise bei virtuellen Terminen mit Ihrem Gesundheitsdienstleister vereinfacht. Die Teams erreichen dies, indem sie solche Audiosignale mit einer Abtastrate von 32 kHz (16 kHz Bandbreite) bei 128 kbps übertragen. Es schafft es, High Fidelity bereitzustellen und gleichzeitig die Bitrate im Vergleich zur verlustfreien Codierung um den Faktor vier zu reduzieren. Wie Sie davon profitieren können, erfahren Sie, indem Sie den Anweisungen von Microsoft hier folgen .

Ein neues Feature, das den Musikwiedergabemodus in hoher Qualität verwendet, ist die Rauschunterdrückung durch maschinelles Lernen, die jetzt standardmäßig für Teams-Clients aktiviert ist. Dieses Modell nimmt Nicht-Sprachsignale als Eingabe und bestimmt dann, ob es dieses Rauschen unterdrücken soll oder nicht. Wenn es die Eingabe als Musik identifiziert, wie sie beispielsweise während einer Geigenstunde gespielt wird, warnt es den Benutzer, die High-Fidelity-Musikwiedergabe zu aktivieren. Wenn es ein falsches positives Ergebnis erkennt, kann der Benutzer dieses Banner einfach schließen. Und wenn das maschinelle Lernmodell unerwünschte Geräusche erkennt, die keine Musik sind, werden sie automatisch unterdrückt.

Microsoft sagt, dass es dieses Modell gebaut hat, indem es ein konvolutionelles neuronales Netzwerk auf einem Trainingsset trainiert hat, das eine Million Audio- und Musikclips enthält. Das Trainingsset enthielt Klänge aus verschiedenen Umgebungen und Instrumenten für eine Vielzahl von Anwendungsfällen. Das Ausgabemodell wurde dann an einer Sammlung von 1000 Audioclips getestet und ergab eine Genauigkeit von 81 %. Microsoft behauptet, dass sein Modell alle veröffentlichten Forschungsergebnisse in diesem Bereich übertroffen hat, und Sie können sein Forschungspapier hier einsehen .

Die auf maschinellem Lernen basierende Geräuschunterdrückung ist jetzt standardmäßig für „die meisten“ Teams-Benutzer aktiviert, und die automatische Musikerkennung wird in den kommenden Monaten eingeführt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert