Je suis confronté à un problème lorsque vous faites la recherche en texte intégral avec PostgreSQL sur le texte qui contient de caractère espagnol ÑPostgreSQL Texte intégral Recherche caractère espagnol Ñ
Lorsque je tente de tokenizer le mot espagnol Ano '(année) Je reçois les résultats suivants en fonction de si l'entrée est supérieure ou inférieure cas:
SELECT to_tsvector('spanish','AÑO'),to_tsquery('spanish','año')
"to_tsvector" "to_tsquery"
"'aÑo':1" "'año'"
Comme vous pouvez le voir le résultat n'est pas le même et il est sensible à la casse, il fait ma demande de recherche en texte intégral interroge la casse si elles contient ce caractère.
Y at-il un moyen de résoudre ce problème? J'ai recherché dans la documentation de PostgreSQL sur la recherche en texte intégral, et je ne sais pas comment changer ce comportement sur les dictionnaires installés.
Merci beaucoup. Martí
quel est votre 'client_encoding' .. et le serveur? un? .. '' 't = # SELECT to_tsvector ('espagnol', 'AÑO'), to_tsvector ('espagnol', 'año'); to_tsvector | to_tsvector ------------- + ------------- 'año': 1 | 'año': 1 (1 ligne) Durée: 69,873 ms t = # show client_encoding; client_encoding ----------------- UTF8 (1 row) '' 'ne peux pas reproduire avec UTF8 –
mon codage client et serveur est UTF8. –
mes db paramètres sont les suivants: CREATE DATABASE cda_repository avec le propriétaire = cda_repository_owner encoding = 'UTF8' TABLESPACE = cda_repository_fast_ts LC_COLLATE = 'C' LC_CTYPE = 'C' CONNECTION LIMIT = -1; ALTER BASE DE DONNÉES cda_repository SET default_text_search_config = 'pg_catalog.Espanol'; Merci beaucoup –