2008-10-25 9 views
4

Je trouve que la In Quotes de Google est une application vraiment géniale, et en tant que CS, je dois comprendre comment cela fonctionne. Comment pensez-vous qu'il transforme les articles de nouvelles en une liste de citations attribuées à des personnes spécifiques? Bien sûr, il y a quelques erreurs, mais leur algorithme semble être plus intelligent qu'une simple heuristique ou plusieurs expressions régulières. Par exemple, une citation peut être attribuée à quelqu'un même si son nom n'a été mentionné que dans le dernier paragraphe.Comment fonctionne Google In Quotes?

Des idées? Tout document connu sur le sujet?

Répondre

0

Je n'ai pas de papier mais une idée. Google prend des citations d'un ensemble de personne. Facile pour eux avec Google Actualités et autres accès aux médias.

Ils ont un autre ensemble de sujets. L'ensemble de sujet de match de Google avec l'ensemble de personne (les deux ensemble sont finis). Le dernier ensemble est toute la citation,

Si vous remarquez, le sujet contient 1 mot mis en évidence dans le devis. Il y a donc une relation entre l'ensemble du sujet et l'ensemble de citation pour chaque ensemble de personnes. Depuis Google est le maître de l'information, il doit être très facile d'obtenir un lien entre tous ces ensembles.

0

Je n'ai pas de réponse à votre question, mais je vous suggère de demander directement à un ingénieur Google le numéro Google moderator. Vous ne pouvez pas obtenir une réponse rapidement (ou pas du tout) mais vous obtiendrez une réponse précise là-bas.

1

C'est simple, ça vérifie les mots, mais il peut y avoir n'importe quoi entre eux, tant qu'ils sont toujours en ordre. "Bonjour tout le monde!" deviendrait le regex/hello [.] * monde/

Questions connexes