int IndexOfAny (String [] RGS) serait en effet agréable mais il est théoriquement une opération O (n^2). Si, dans votre application, l'ensemble des chaînes rgs est grand et toujours le même, l'approche la plus efficace consiste à les charger une fois dans une structure de données trie, puis à les utiliser à plusieurs reprises pour les rechercher dans les chaînes inconnues lors de l'exécution.
Voici le code pertinent, adapté d'une source C# trie trouvée sur le web, attribuée à "Kerry D. Wong". Dans ma version, chaque chaîne dans le trie a une "charge utile" de type générique TValue. Pour utiliser cette fonction pour rechercher simplement les sous-chaînes, la charge utile peut toujours être définie sur true, comme illustré avec simple_trie.
L'autre chose que j'ai changé ici est que ce trie adapte automatiquement le stockage des chaînes Unicode arbitraires. Le tableau de chaque nœud, qui caractérise un trie, ajuste sa base et sa longueur pour s'adapter à la plage de caractères Unicode devant être stockée sur ce nœud. Cela permet une correspondance sensible à la casse, par exemple. La syntaxe d'initialisation C# 3.0 est pratique pour cette opération, mais son activation nécessite une implémentation fictive de IEnumerable afin de compiler. Le CLR ne semble pas appeler GetEnumerator() et je suggère que vous n'essayez pas d'énumérer avec son résultat non plus.
using System;
using System.Collections.Generic;
using System.Linq; // only used in Main()
class Program
{
// trie with payload of type <String>
static Trie<String> value_trie = new Trie<String>
{
{ "rabbit", "cute" },
{ "giraffe", "tall" },
{ "ape", "smart" },
{ "hippo", "large" },
};
// degenerate case of a trie without payload
static Trie<bool> simple_trie = new Trie<bool>
{
{ "rabbit", true },
{ "giraffe", true },
{ "ape", true },
{ "hippo", true },
};
static void Main(String[] args)
{
String s = "Once upon a time, a rabbit met an ape in the woods.";
// Retrieve payloads for words in the string.
//
// output:
// cute
// smart
foreach (String word in value_trie.AllSubstringValues(s))
Console.WriteLine(word);
// Simply test a string for any of the words in the trie.
// Note that the Any() operator ensures that the input is no longer
// traversed once a single result is found.
//
// output:
// True
Console.WriteLine(simple_trie.AllSubstringValues(s).Any(e=>e));
s = "Four score and seven years ago.";
// output:
// False
Console.WriteLine(simple_trie.AllSubstringValues(s).Any(e => e));
}
}
class TrieNode<TValue>
{
private TrieNode<TValue>[] nodes = null;
private TValue m_value = default(TValue);
private Char m_base;
public Char Base { get { return m_base; } }
public bool IsEnd { get { return !m_value.Equals(default(TValue)); } }
public TValue Value
{
get { return m_value; }
set { m_value = value; }
}
public IEnumerable<TrieNode<TValue>> Nodes { get { return nodes; } }
public TrieNode<TValue> this[char c]
{
get
{
if (nodes != null && m_base <= c && c < m_base + nodes.Length)
return nodes[c - m_base];
return null;
}
}
public TrieNode<TValue> AddChild(char c)
{
if (nodes == null)
{
m_base = c;
nodes = new TrieNode<TValue>[1];
}
else if (c >= m_base + nodes.Length)
{
Array.Resize(ref nodes, c - m_base + 1);
}
else if (c < m_base)
{
Char c_new = (Char)(m_base - c);
TrieNode<TValue>[] tmp = new TrieNode<TValue>[nodes.Length + c_new];
nodes.CopyTo(tmp, c_new);
m_base = c;
nodes = tmp;
}
TrieNode<TValue> node = nodes[c - m_base];
if (node == null)
{
node = new TrieNode<TValue>();
nodes[c - m_base] = node;
}
return node;
}
};
class Trie<TValue> : System.Collections.IEnumerable
{
private TrieNode<TValue> _root = new TrieNode<TValue>();
// This dummy enables C# 3.0 initialization syntax
public System.Collections.IEnumerator GetEnumerator()
{
return null;
}
public void Add(String s, TValue v)
{
TrieNode<TValue> node = _root;
foreach (Char c in s)
node = node.AddChild(c);
node.Value = v;
}
public bool Contains(String s)
{
TrieNode<TValue> node = _root;
foreach (Char c in s)
{
node = node[c];
if (node == null)
return false;
}
return node.IsEnd;
}
public TValue Find(String s_in)
{
TrieNode<TValue> node = _root;
foreach (Char c in s_in)
{
node = node[c];
if (node == null)
return default(TValue);
}
return node.Value;
}
public IEnumerable<TValue> FindAll(String s_in)
{
TrieNode<TValue> node = _root;
foreach (Char c in s_in)
{
node = node[c];
if (node == null)
break;
if (node.Value != null)
yield return node.Value;
}
}
public IEnumerable<TValue> AllSubstringValues(String s)
{
int i_cur = 0;
while (i_cur < s.Length)
{
TrieNode<TValue> node = _root;
int i = i_cur;
while (i < s.Length)
{
node = node[s[i]];
if (node == null)
break;
if (node.Value != null)
yield return node.Value;
i++;
}
i_cur++;
}
}
};
Je suis en désaccord avec le double. Il semble vouloir rechercher une sous-chaîne dans chaque chaîne du tableau. – Samuel
@Samuel, d'où obtenez-vous cela, il a clairement myName et recherche à travers un tableau de "noms"? – TStamper
@TStamper: De IndexOfAny (...), à moins qu'il ne soit terriblement confus au sujet des méthodes de chaîne C#. – Samuel