Audio -Suchmaschine

Ein Audio -Suchmaschine ist ein webbasiertes Suchmaschine die kriecht Das Web für Audio- Inhalt. Die Informationen können aus Webseiten, Bildern, Audiodateien oder einem anderen Dokumenttyp bestehen. Für die Forschung zu diesen Motoren gibt es verschiedene Techniken.

Arten der Suche

Audio -Suche aus Text

Der vom Benutzer eingegebene Text wird mit der Datenbank der Suchmaschine verglichen. Übereinstimmende Ergebnisse werden mit einer kurzen Beschreibung der Audiodatei und ihrer Eigenschaften wie Stichprobenfrequenz, Bitrate, Dateityp, Länge, Dauer oder Codierungstyp begleitet. Der Benutzer erhält die Möglichkeit, die resultierenden Dateien herunterzuladen.

Audio -Suche vom Bild

Das Abfrage nach Beispiel (QBE) System ist ein Suchalgorithmus, der verwendet inhaltsbasiertes Bildabruf (CBIR). Schlüsselwörter werden aus dem analysierten Bild generiert. Diese Schlüsselwörter werden verwendet, um nach Audiodateien in der Datenbank zu suchen. Die Ergebnisse der Suche werden gemäß den Benutzereinstellungen in Bezug auf die Art der Datei (WAV, MP3, AIFF…) oder andere Merkmale angezeigt.

Über: ein Ton A Wellenform
Unter: ein Ton A Spektrogramm

Audio -Suche aus Audio

Im Audio -Suche aus AudioDer Benutzer muss das Audio eines Songs entweder mit einem Musikspieler spielen, indem er singt oder durch das Summen zum Computermikrofon. Anschließend ein Klangmuster, A, wird aus der Audiowellenform abgeleitet, und eine Frequenzdarstellung wird von IHS abgeleitet Fourier-Transformation. Dieses Muster wird mit einem Muster abgestimmt, B, entsprechend der Wellenform und Transformation von Sounddateien in der Datenbank. Alle diese Audiodateien in der Datenbank, deren Muster der Mustersuche ähneln, werden als Suchergebnisse angezeigt

Design und Algorithmen

Ein Spektrogramm des Klangs einer Geige.
Die Zielzone eines von Shazam gescannten Songs.[Klarstellung erforderlich]

Die Audio -Suche hat sich langsam durch mehrere grundlegende Suchformate entwickelt, die heute existieren und alle verwenden Schlüsselwörter. Die Schlüsselwörter für jede Suche finden Sie im Titel der Medien, alle Text, die an die Medien- und Inhalte verknüpften Webseiten beigefügt sind, die ebenfalls von Autoren und Benutzern von Video -gehosteten Ressourcen definiert sind.

Einige Suchmaschinen können aufgezeichnete Sprache wie Podcasts durchsuchen. Dies kann jedoch schwierig sein, wenn Hintergrundgeräusche vorhanden sind. Ungefähr 40 Phoneme existieren in jeder Sprache mit etwa 400 in allen gesprochenen Sprachen. Anstatt einen Text-Suchalgorithmus nach Abschluss der Sprach-Text-Verarbeitung anzuwenden, verwenden einige Motoren einen phonetischen Suchalgorithmus, um Ergebnisse innerhalb des gesprochenen Wortes zu finden. Andere arbeiten, indem sie den gesamten Podcast anhören und eine Texttranskription erstellen.

Anwendungen als Munax verwenden Sie mehrere unabhängige Ranking -Algorithmenprozesse, die die Umgekehrter Index zusammen mit Hunderten von Suchparametern, um das endgültige Ranking für jedes Dokument zu erstellen. Auch wie Shazam, der funktioniert, indem er den erfassten Sound analysiert und ein Match sucht, der auf einem basiert Akustischer Fingerabdruck in einer Datenbank von mehr als 11 Millionen Songs. Shazam identifiziert Songs basierend auf einem Audio-Fingerabdruck, der auf einem Zeitfrequenzdiagramm namens a basiert Spektrogramm. Shazam speichert einen Katalog von Audiofingerabdrücken in einer Datenbank. Der Benutzer markiert 10 Sekunden lang einen Song und die Anwendung erstellt einen Audiofingerabdruck. Sobald es den Fingerabdruck des Audio erstellt hat, startet Shazam die Suche nach Übereinstimmungen in der Datenbank. Wenn es eine Übereinstimmung gibt, gibt es die Informationen an den Benutzer zurück. Andernfalls gibt es einen Dialog "Song nicht bekannt" zurück. Shazam kann identifizieren, die aufgenommene Musik aus jeder Quelle wie Radio, Fernsehen, Kino oder Musik in einem Verein ausgestrahlt werden, vorausgesetzt Die Datenbank der Software.

Bemerkenswerte Motoren

Deep Audio Search

  • Picsearch Die Audio -Suche ist seit 2006 für Suchportale lizenziert.

Für Smartphones

  • Sound Hound (zuvor bekannt als als Midomi) ist eine Software und ein Unternehmen (beide mit demselben Namen), mit dem Benutzer Ergebnisse mit Audio finden können. Seine Funktionen sind beide ein Audio-basierter künstliche Intelligenz Service und Dienste, um Songs und Details dazu zu finden Singen, summen oder sie aufzeichnen.
  • Shazam ist eine App für Smartphone oder Mac, die für seine Musikidentifikationsfunktionen bekannt ist. Es verwendet ein integriertes Mikrofon, um eine kurze Probe des gespielten Audios zu sammeln. Es schafft eine Akustischer Fingerabdruck Basierend auf der Stichprobe und vergleicht es mit einer zentralen Datenbank für eine Übereinstimmung. Wenn es ein Match findet, sendet es Informationen wie den Künstler, den Songtitel und das Album an den Benutzer zurück.
  • Doreso identifiziert ein Lied, indem er die Melodie mit einem Mikrofon summt oder singt; und durch direkte Eingabe des Namens eines Songs oder Sängers. Die App gibt Informationen über den Songtitel, seinen Sänger und ermöglicht es Ihnen, das Lied zu kaufen.
  • Munax (Definct) ist ein Unternehmen, das ihre All-In-Incontent-Suchmaschine in seiner ersten Version 2005 veröffentlicht hat. Die im Juli 2007 erstellte Suchmaschine PlayudioVideo Multimedia war die erste echte Suchmaschine für Multimedia, die im Web nach Bildern gesucht wurde, Video, Video und Audio in derselben Suchmaschine und ermöglichen den Benutzern, sie auf derselben Seite anzunehmen. Munax hat seitdem geschlossen.

Siehe auch

Verweise