Bardzo ważne jest, aby ułatwić klientom odnalezienie się w Twojej witrynie. Niektóre z nich można osiągnąć dzięki dobrej logice projektowania, dobrym stylom i zapewnieniu prostych map witryn. Jednym z podejść jest wprowadzenie kategoryzacji, czyli podziału informacji na kategorie, które mają odrębne znaczenie. Yahoo jest jednym z przykładów portalu, który przyjmuje to podejście. Ale jeśli witryna jest duża i złożona, należy również zapewnić jakąś formę wyszukiwarki, niezależnie od tego, czy witryna jest przeznaczona dla handlu detalicznego, czy dla firm i czy jest to metatagowane, czy nie. Skuteczne przeszukiwanie dużych ilości informacji to złożony proces i bardzo aktywny obszar badań. W części 3, Zarządzanie wiedzą e-biznesową, omówiliśmy niektóre teorie, ale szczególnie w odniesieniu do zarządzania wiedzą korporacyjną. Możemy rozszerzyć tę dyskusję, aby objąć podejścia szczególnie istotne dla wyszukiwania zorientowanego na klienta. Najprostszy przypadek pojawia się przy ograniczonych ilościach danych udostępnianych na statycznych stronach WWW. Tutaj wszystko, co jest wymagane, to przesłanie zapytania wyszukiwania (zwykle w formie formularza) do zainicjowanego przez CGI procesu, który przeprowadza porównanie między ciągiem danych wprowadzonych przez użytkownika a tekstem na stronach internetowych. Bardzo często te programy CGI są napisane w języku Perl, który ma dobre możliwości obsługi ciągów znaków i obszerną bibliotekę typowych operacji. Stosunkowo łatwo jest zapewnić dość złożone udogodnienia, na przykład możliwość znalezienia ciągów znaków, w których kilka pojedynczych słów występuje w pewnej odległości od siebie i tak dalej. Możliwe jest również, przy większym nakładzie pracy programistycznej, zapewnienie podstaw, wyszukiwań, które obejmują nie tylko określony ciąg, ale także jego warianty; na przykład wyszukiwanie hasła „samochód na zamówienie” może dać pozycje w kategoriach „samochód niestandardowy”, „samochód niestandardowy”, a nawet „samochody niestandardowe” lub „samochody dostosowywane”. Aby zaprogramować je w systemie, programista musi zdecydować, czy utworzyć proste listy słów, które są uważane za synonimy – metadane, metadane, metainformacje – czy też wprowadzić ogólne reguły gramatyczne, takie jak: Reguła: pary słów X Y to synonim słowa z łącznikiem X–Y, dla dowolnych słów X i Y. Nie ma ogólnej zasady zachowania równowagi między podejściem opartym na synonimach a podejściem opartym na regułach. Jeśli witryna jest wystarczająco duża, opłacalnym może być zakup gotowej wyszukiwarki. Dostępnych jest ich wiele, a recenzje są publikowane w Internecie. Jeśli katalog produktów znajduje się na nowoczesnej bazie danych, takiej jak serwer Microsoft SQL w wersji 7, możliwe jest skonfigurowanie operacji indeksowania na stronach przechowywanych w bazie danych. Typowe operacje indeksowania mogą skutkować utworzeniem liczników częstotliwości słów dla każdej zapisanej strony (co może automatycznie wykluczyć „zwykłe słowa” – „i” i „i”, które prawdopodobnie nie dają żadnych informacji na temat „około” strony), listy adresów URL itp. Łatwo jest zaprogramować wyszukiwarkę do badania indeksu, a nie wersji pełnotekstowej, co przyspiesza działanie. Stmming i inne inteligentne operacje stają się również dostępne jako standardowe składniki baz danych. Na koniec wracamy do naszej dyskusji na stronie 200 dotyczącej trudności w jednoczesnym uzyskaniu wszystkich potrzebnych informacji (przypominanie) przy jednoczesnym odrzuceniu niechcianego materiału (precyzja). To zawsze będzie problemem, który nie ma rozwiązania analitycznego, a wydajność witryny można znaleźć tylko poprzez regularne testowanie.