Wyszukiwarka – bezduszna maszyna czy inteligentne stworzenie ?
Serfując po sieci, bardzo często spotykamy różnego rodzaju strony internetowe wyposażone w możliwość wyszukiwania interesujących nas fraz, poprzez narzędzie zwane powszechnie „wyszukiwarką”. Korzystamy z niej do szybkiego odnajdywania wszelkiego rodzaju informacji czy usług. W sklepie internetowym będzie to produkt, którego zakupem jesteśmy zainteresowani.
Jak to działa ?
Zasada działania jest prosta. Wpisujemy w pole tekstowe żądaną frazę i oczekujemy wyników zaspokajających nasze zapytanie. Większość wyszukiwarek nie zachwyca finezją w dostarczaniu wysoko jakościowych wyników posługując się zasadą - znajdź wszystkie pozycje, które zawierają szukane przez użytkownika wyrazy. To wszystko, żadnej dodatkowej logiki. Takie rozwiązania są prostsze do wdrożenia, nie wymagają specjalistycznych narzędzi i dodatkowej pracy, niezbędnej do zaszczepienia dozy inteligencji w silniku wyszukiwania.
W zależności od restrykcyjności wyszukiwarki, najczęściej poszukiwanie odbywa się w dwojaki sposób. Załóżmy, że użytkownik szuka zwrotu „ala ma kota”:
- pierwsza metoda to poszukiwanie każdego z wyrazów występujących w dosłownej formie, czyli w wynikach wyszukiwania zostaną zwrócone te pozycje, które zawierają dokładnie słowa: „ala”, „ma”, „kota”. W tym wypadku szukane słowa powinny być trafniej dobierane, aby mogły zostać odnalezione. Użytkownik powinien wiedzieć czego szuka.
- drugie podejście, to poszukiwanie każdego z tych wyrazów jako podciągów.
W przeciwieństwie do pierwszego sposobu, wyszukiwarka próbuje odnaleźć: „ala” ,''ma”, „kota” jako fragmenty innych słów. Tekst zawierający słowo „kalafior” również zostanie zwrócony, ponieważ „ala” jest podciągiem „kalafior”.
Ta metoda jest bardziej liberalna, przez co zwraca więcej wyników i daje poczucie lepszej trafności u użytkowników, którzy nie są pewni szukanych fraz np. nie znają pełnej nazwy produktu w sklepie internetowym. Wówczas istnieje szansa, że znając chociaż fragment nazwy, produkt zostanie odnaleziony.
Jakość ma znaczenie
Wszystko fajnie, tylko co w sytuacji kiedy zadane pytania nie są selektywne - tzn. nie zawężają ilości trafionych rekordów, przez co liczba pasujących do zapytania wyników jest bardzo duża i trudna do przejrzenia. Tak się może dziać, gdy poszukiwane słowa w dosłownej formie, lub też słowa zawierające podciągi („ala” > „kalafior”) będą bardzo popularne w zbiorze wszystkich zgromadzonych w bazie danych treści. Przy mniejszych zbiorach, ten problem może nie być bardzo odczuwalny. Sytuacja zmienia się, gdy liczba trafień jest na tyle duża, że trudno jest przeglądać wyniki nie uporządkowane pod względem jakości tj. „najlepsze na samej górze”. Jak określić, które są najlepsze? Istotny jest kontekst w jakim występują poszukiwane wyrazy. Szukając frazy „czerwona koszulka” w sklepie internetowym z odzieżą, interesują nas produkty, które są koszulkami w kolorze czerwonym. Niestety domyślne mechanizmy wyszukiwania spowodują, że zostaną odnalezione wszystkie produkty, które np. w opisie zawierają słowa: „czerwona”, „koszulka” nawet, jeśli kontekst jest inny. Przykładowo, nazwa produktu brzmiąca: ”Super modna koszulka, w prezencie czerwona czapka GRATIS” również będzie pasować .
Tego typu trafienia zaburzają wyniki wyszukiwania i wpływają na ich jakość, przekładając się na rozczarowanie i frustrację klientów. Na dodatek, zwracane wyniki nie są uporządkowane wg. żadnego klucza, który na pierwszych miejscach umieszczałby bardziej wartościowe trafienia. W sklepie internetowym można by przyjąć, że najwartościowsze produkty to te najtańsze, biorąc jako główne kryterium ich cenę. Nadal jednak, na pierwszych miejscach mogą znajdować się te niesławne „czerwone koszulki”, zaniżając odczucia użytkownika co do skuteczności mechanizmu wyszukiwania.
Przebłysk inteligencji
Redhand nieustannie pracuje nad innowacjami i ciekawymi rozwiązaniami. Sklepy internetowe, które tworzymy oraz utrzymujemy na naszych serwerach, mogą zostać wyposażone w inteligentną wyszukiwarkę, zapewniającą najwyższą jakość zwracanych wyników ku uciesze klientów jak i sprzedawców. Prezentowane wyniki uporządkowane są wg. precyzji trafienia. Wyżej punktowane są pozycje, które odwzorowują kontekst. Produkt o nazwie: ”Super modna koszulka, w prezencie czerwona czapka GRATIS” będzie znacznie niżej sklasyfikowany niż „Super fajna czerwona koszulka”, ze względu na występowanie słów: „czerwona”, „koszulka” zaraz obok siebie. Dopasowanie takie jest bardziej wartościowe, bo odpowiada kontekstowi w jakim słowa zostały użyte. Dzięki temu, nawet jeśli do zapytania pasuje wiele produktów, mamy gwarancję, że na pierwszych pozycjach znajdą się te najbardziej trafne.
Ktoś by zapytał „I to tyle?” Nie, deser dopiero przed nami!
„Wisienką na torcie” jest nowatorski mechanizm wyszukiwania pozwalający na korekcję błędów oraz dopasowywanie wyrazów występujących w innych formach odmiany.
Korekcja błędów
Pierwsza innowacja polega na zdolności do poprawiania błędnie wpisanych słów kluczowych. Załóżmy, że użytkownik błędnie wpisuje frazę „telefizor panasonik”. Jak widać popełnił dwa błędy w obu wyrazach.
W normalnych okolicznościach nic nie zostanie odnalezione, a klient może nawet nie zauważyć błędu i zniechęcony brakiem wyników opuści nasz sklep. Nasz system działa inaczej. W sytuacji, gdy zadane pytanie nie zwraca wyników, uruchamiany jest mechanizm korekcji błędów, który na podstawie treści zgromadzonych w bazie danych może wywnioskować, że chodziło o „telewizor panasonic” i zaproponować taką frazę jako poprawną. Co więcej, sugerowane są tylko te zwroty, które dają gwarancję pomyślnego odnalezienia. Dzięki temu potencjalny klient jest o krok bliżej do złożenia zamówienia w naszym sklepie.
Różne formy odmiany
Druga z nowinek opera się na znajomości odmian słów wykorzystując do tego słownik języka polskiego.
Jak pisałem na samym początku, restrykcyjne wyszukiwanie będzie zwracało wyniki, jeśli użytkownik będzie znał dosłowne brzmienie wyrazów. W przeciwnym wypadku nic nie zostanie znalezione. A może by nauczyć wyszukiwarkę odmian wyrazów języka polskiego ? Miło by było, gdyby szukając „koszulki czerwone” została odnaleziona również „koszulka czerwona”, pomimo, że nigdzie w opisie czy nazwie produktu nie występuje szukana fraza. W ten sposób dostarczamy użytkownikowi dodatkowy produkt, który może okazać się obiektem jego zainteresowania, a który normalnie nie miał by szansy pojawić się w wynikach.
Tyle teorii, pora na "grand finale"
Wiele można by pisać, ale nic tak dobrze nie zobrazuje tekstu, jak namacalny przykład z życia wzięty. Jeden z zaprojektownych przez nas sklepów - sklep z militariami - www.naostrzu.pl, został wyposażony we wszystkie opisane tutaj funkcjonalności, podnosząc wrażenia z wyszukwania na wyższy poziom.
- zdolność poprawiania błędów - przykład "multitol leterman" - wynik
- umiejętność odmieniania wyrazów - przykład "bluzy" - wynik
- sortowanie wyników wg. jakości trafienia - przykład "kabura" - wynik
Dodatkową opcją jest dynamiczne podpowiadanie nazw produktów, na etapie wpisywania słowa kluczowego w pole wyszukiwarki.
W kolejce są już następne wdrożenia, a ostatnie z nich to sklep z akcesoriami i materiałami biurowymi - solokolos.pl
Inspiracja
Nie da się ukryć, że wyszukiwarka Google zrewolucjonizowała sposób w jaki korzystamy z tego typu narzędzi. Z naszych obeserwacji wynika, że użytkownicy przenoszą nabyte przyzwyczajenia i próbują używać napotkanych na stronach wyszukiwarek, w spoósb najbardziej dla siebie naturalny. Liczą, że wybaczą im one pomyłki lub będą na tyle mądre, aby odgadnąć co mają na myśli. W znacznej większości przypadków, tak niestety nie jest.
Wszystkie opisane tutaj rozwiązania, mają na celu zaprezentowanie klientowi jak narzetelniejszych wyników, oszczędzając jego czas i budując zaufanie do sklepu internetowego. Naszą misją jako Redhand, jest natomiast udostępnianie swoim klientom nowoczesnych technologii i kreatywności przy projektowaniu stron i sklepów internetowych, tak aby mogli oni rozwijać swoje przedsięwzięcia w oparciu o najnowsze zdobycze techniki.
Autor: Michał Grabowski