2009-03-16 9 views
23

Je ne suis pas sûr si Youtube est le seul site avec cette technologie, mais l'identification contenu dans YT (ID de contenu) est essentiellement une technologie pour identifier et supprimer automatiquement les violations du droit d'auteur. Vous pouvez en lire davantage ici:Youtube technologie d'identification de contenu?

http://www.youtube.com/t/contentid

Eh bien quand une de mes vidéos (contenant un morceau de musique particulier) a obtenu signaler et mettre pour violation du droit d'auteur, je pensais que [le sytstem contenu ID] était probablement stupide. Alors je l'ai fait quelques expériences: aucun d'entre eux dupé le filtre ~

  • Ajout d'une série de signaux sonores au milieu de la chanson
  • Changé le terrain plusieurs fois à travers la chanson
  • Changé le volume plusieurs fois
  • Ajusté la vitesse
  • Ajout d'une superposition audio
  • ajouté quelques effets audio

D'un autre côté, je ne connais aucun document faussement apparié comme étant protégé par des droits d'auteur. Une version de piano d'une chanson, par exemple, ne déclencherait pas faussement le censeur.

Je ne suis pas rodomontades sur mes vidéos RETIRE. Je suis juste surpris de l'efficacité de la censure de contenu. Je me demande comment l'algorithme identifie correctement la chanson comme violation des droits d'auteur, même après tous mes efforts pour la contourner. Toute tentative de correspondance directe aurait été vaincue immédiatement, tout algorithme impliquant des motifs de notes serait probablement berné par les bips et le changement de hauteur.

Eh bien, c'est plus de ma curiosité qu'une question urgente ..

+0

Je trouve aussi quelque chose de similaire sur imeem.com, ils peuvent identifier des "doublons" d'une chanson même si le nom, les tags, etc. sont tous différents! – hasen

+0

Hmm, à peine relevent parce que tout appariement ou hachage des deux chansons reviendrait vrai. En supposant que les chansons sont identiques. – Bai

+0

Ils utilisent une forme de [empreinte digitale acoustique] (https://en.wikipedia.org/wiki/Acoustic_fingerprint). Alors que Google a publié des articles sur le sujet, je crois que l'algorithme qu'ils utilisent n'est pas public (probablement pour rendre la tâche plus difficile aux gens de contourner le problème). – Zaz

Répondre

14

Pedro Moreno et d'autres au travail Google/Youtube là-dessus. Ils utilisent finite-state transducers pour reconnaître des séquences de unités de téléphone de musique, semblable à phonèmes dans la reconnaissance automatique de la parole.

Vérifiez cet article:

Si vous modifiez la vitesse ou la hauteur tout au long de la chanson ensemble, je suis surpris que ces algorithmes reconnaissent encore la chanson. Mais peut-être qu'ils normalisent la hauteur et la vitesse (en utilisant le temps entre les battements) pour être en mesure de reconnaître les versions couvertes, et pas seulement les versions originales. Mais il n'est pas surprenant qu'il puisse ignorer les bips que vous avez ajoutés, car il y a assez de similarité dans votre flux audio. (En fait, l'algorithme basé sur les états finis serait génial à appliquer à ma bibliothèque iTunes, pour étiqueter les fichiers correctement.Comme des services comme MusicBrainz s'appuient sur des correspondances plus ou moins exactes de votre audio et l'entrée de la base de données, alors que la méthode du transducteur semble plus tolérante aux différences dans la reconnaissance des fichiers.

+0

alors je me demande toujours comment d'autres personnes peuvent télécharger des clips vidéo partiels et ne pas être bloqués? –