Sökning med Metaphone

Sökmetoden Metaphone som vi använder för sökning i namnfälten i vår databas är en så kallad fonetisk metod. Det betyder att namn som låter ganska lika kommer att kodas lika och att därmed hittas vid samma sökning. Exempel på detta är t.ex Mats, Mattias och Mattes som enligt Metaphone-kodningen betraktas som samma namn. I huvudsak så används inte vokaler i Metaphone-kodningen även om det finns undantag när t.ex en konsonant och en eller flera vokaler bildar ett speciellt ljud.

Men nu är det så att Metaphone är konstruerat utgående från det engelska språket och det betyder att en del konstigheter kommer att uppträda när vi använder det för svenska namn. Det finns ju ljud i det engelska språket som det inte finns motsvarigheter till i svenskan. Det finns också ljud i engelskan som stavas på ett sätt som skulle uttalas helt annorlunda på svenska. Exempel på detta är t.ex laugh (skratta) som faktisk kommer att kodas exakt lika som Leif. Leif/Lejf visar förresten ett annat problem och det är egentligen bokstaven ”i” som ibland tolkas som vokal, men i kombination med en annan bokstav, ”t” kan bli ett eget ”tje-ljud”, t.ex i Matias (med tje-ljud). I Mattias betraktas dock i som en vanlig vokal. I svenskan kanske ”i” ibland skulle tolkas som ”j”, men tyvärr, så är det inte i engelskan. Andra bokstäver som kan var problematiska är bl.a ”w”, ”f”, ”g” och ”h”. Även t och th är problematiskt och måste sökas separat.

Här är en lista på några vanliga namn som inte betraktas som lika vid metaphone-sökning:
(Inom parentes visas själva Metaphone-koden.)
thore

  • Maria (MR) – Marja (MRJ)
  • Matias (MXS) – Mattias (MTS)
  • Johan (JHN) – John (JN)
  • William (WLM) – Villiam (FLM) – Willjam (WLJN)
  • Göran (KRN) – Jöran (JRN)
    Obs, Karin (KRN) kodas lika som Göran, dvs sökningar på Göran kommer sannolikt att ge väldigt många träffar på Karin 🙁
  • Tore (TR) – Thore (0R)
  • Martin (MRTN) – Marthin (MR0N)

Slutsats, var kreativ när det gäller sökningar och lita inte blint på det första resultatet. Sök med olika stavningar och söktyper, t.ex ”Börjar med”.

I en framtid kanske vi kan få se en förbättrad sökning med Metaphone, men det dröjer åtminstone fram till sommaren 2008 eller längre…
Goda nyheter (2020-07-06), vi jobbar just nu med ett nytt, förhoppningsvis lite modernare, sökgränssnitt. Och det ser ut som vi kommer att lösa de flesta av konstigheterna som beskrivs ovan.

/webmaster

Uppdaterat: 2016-04-05
Uppdaterat: 2020-07-06

2 Comments
moj 2016-04-06
| | |
Utökat testen i föregående kommentar lite. Fungerar nu för förnamn med stavningsvarianterna t-td-dt-dth tror jag. Lite osäkert om det är tillräckligt bra prestanda, det kan ta för lång tid ibland...
moj 2016-04-05
| | |
Har testat med lite variationer på hur ovanstående problem skulle kunna lösas. http://www.slaktdata.org/index-testdmetaphone.php/regsearch?fnamn=marthin&mfnamn=&enamn=&type%5B%5D=freg&year=1804 (Länken ovan är bara test och kan sluta att fungera när som helst) Ordinarie sökning nu: - Martin hittar bara Martin (plus lite annat som t.ex Mårten) - Marthin hittar bara Marthin Testsökningen - Martin hittar bara Martin, som innan... - Marthin hittar både Martin och Marthin! Motsvarande bör gälla för andra stavningsvarianter också. Inte testat dock. Även om testsökningen är "bättre" så känns det inte konsekvent, så jag tror inte att vi ska publicera denna version. Rätt eller fel?