Gerade entdeckt: Google Audio Indexing

Google transkribiert den gesprochenen Text der bei youtube im “Political Channel” hochgeladen Videos. Und warum machen die das? Weil sie’s können. Und wie die FAQ sagt:

Google’s mission is “to organize the world’s information and make it universally accessible and useful”. As more video content is being created everyday, Google Audio Indexing tries to make it easier for people to find and consume spoken content from videos on the Web.



Bis jetzt findet die meiste Auswertung der Daten noch bei den Menschen statt. Das heißt der User entscheidet nach was er sucht und was er damit macht. Die Ergebnisse der Suche sind natürlich durch Mensch und Machine gegangen und vorgefiltert, die automatisierte Suche als solches gibt es aber noch nicht, kommt noch. Dieses Suchen der Menschen erzeugt wiederum ein Haufen Daten, welche detailiert zu durchsuchen ein Privileg der Suchmachine selbst ist. Wie mächtig die Auswertung der Daten (sprich wie wertvoll die Daten) sind, sieht man bei Flu Trends. Sie behaupten Grippe-Ausbrüche 10 Tage früher erkennen zu können, als die übliche auf das Gesundheitswesen basierende Methode der CDC. Not bad.
Imprinzip ist es allerdings nichts weiter als eine Anwendung von Google Trends auf das Suchwort “Grippe”, jedoch schön örtlich und zeitlich aufgelöst.