Разработать алгоритм сопоставления деталей поставщика и наших деталей

Имеется большой датасет, состоящий из примерно 200 000 строк, который содержит соотнесение предложений поставщиков с моими деталями. В датасете следующие колонки: имя от поставщика, бренд от поставщика, артикул от поставщика и все то же самое, только с моей стороны. Одна и та же деталь может называться по-разному у разных поставщиков, однако уже правильно сопоставлена в данных с моими деталями.

Требуется создать модель машинного обучения (или любой другой алгоритм), который будет с нормальной точностью сопоставлять новые предложения поставщиков с моими деталями.

Прилагаю три файла:
1) Для обучения (уже корректные привязки) - https://docs.google.com/spreadsheets/d/1Tz3prx7yaT...
2) Предложения поставщиков - https://docs.google.com/spreadsheets/d/1EfPrgzaMPh...
3) Наши детали (все) - https://docs.google.com/spreadsheets/d/1Yz7mbffDwW...

Итогом работы будет правильно сопоставленные файлы 2 и 3

Читайте на 123ru.net