...
По данным наших экспериментов, точность традиционных методов автоматизации сопоставлений не достигла бы и 25% для номенклатур наших клиентов. Тут нужно не просто анализировать текст, но и понимать его смысл (например, что «укроп» и «зелень» — это очень близкие по значению слова) и исходя из этого делать предположения о схожести номенклатур. С такими задачами отлично справляются языковые модели на основе искусственного интеллекта, а конкретнее — машинного обучения (machine learning, ML).
Что у нас получилось
Теперь DocsInBox будет предлагать вам до трёх вариантов сопоставлений при открытии поля:
Языковая модель анализирует анализирует ваш набор номенклатур, сравнивает их с тем, что прислал поставщик, и на основе этих данных выбирает самые подходящие номенклатуры. DocsInBox подбирает до трёх вариантов самых подходящих по мнению AI номенклатур и выдаём вам в быстрый доступ. Для выбора достаточно просто кликнуть на одну из них. Конечно, возможность найти номенклатуру по-старому, через поиск, никуда не исчезла.
Как это работает
Если не вдаваться в технические и математические особенности, основной смысл заключается в том, чтобы перевести названия номенклатур из букв, понятных человеку, в наборы данных, понятные компьютеру. Компьютер размещает эти данные в векторном пространстве (условно на плоскости координат), где чем ближе расстояние между словами, тем ближе их значение. Далее, обучая нейросеть, мы влияем на эти значения и заставляем языковую модель размещать значения, схожие по смыслу, ближе друг к другу (например, «укроп» и «зелень»). Соответственно, непохожие значения располагаются дальше друг от друга.
...
- перевести все номенклатуры ресторана в вид, понятный компьютеру;
- разместить их на графике;
- сделать то же самое с номенклатурой поставщика;
- найти в этом пространстве самые близкие понятия.
На качество AI-сопоставлений влияет очень много факторов. Основные — размер справочника номенклатур и количество схожих номенклатур. Если у вас десятки тысяч номенклатур в учётной системе и дублирующиеся позиции, то задача подбора сопоставления значительно усложняется, а вероятность, что AI подберёт нужную номенклатуру, уменьшается.
Это пока только бета-версия наших AI-сопоставлений. Мы анализируем результаты ваших сопоставлений и будем улучшать результаты работы AI, но уже сейчас на большинстве тестовых выборок AI показывает результаты не менее 70% попаданий в топ-3. В планах — использовать языковую модель для категоризации номенклатур, связывания документов и других задач по сравнению разных характеристик документов. Всё, чтобы ваша работа с документами стала ещё удобнее.
Если вам необходимо отключить AI-сопоставления — обратитесь в техподдержку DocsInBox: Как связаться с тех.поддержкой

