В базе хранятся названия радиодеталей. Например:
- Транзистор BL3/2 XT
- Диод катодный T100-E (европа)
- LDE E27 LUM1000 Red
Раньше использовал обычный FULL TEXT поиск чтобы найти.
А потом начал изучать что ищут пользователи и вижу:
вместо BL3/2 XT набирают BL3XT (без двойки и целиком)
вместо T100-E набирают T100E (без дефиза)
вместо LUM1000 Red набирают 1000 RED (без части названия)
Может кто-то уже думал как находить похожести, когда как-то срезают/наращивают названия.
Наименований более 100 тысячь...
Уже хотел делать програмку которая приводит все названия к какому-то виду типа:
BL3/2 XT -> BL 3 2 XT
T100-E -> T 100 E
LUM1000 Red -> LUM 1000 Red
и через этот фильтр будет создаваться отдельное поле для поиска, и потом правиться все запросы...
Но правильно ли это? Может я изобретаю велосипед? Может есть уже готовые надстройки? Или кто-то поделится своими мыслями/опытом?