Nick23 |
---|
Заинтересовала такая программа, которая интегрирует данные из документа word в базу данных access. На вход подается договор в формате *.doc, происходит семантический анализ текста и далее вся инфа по договору заносится в бд. В соответствующие ячейки таблицы вставляются нужные значения из документа договора. (Номер, дата, клиент, сумма и т.п) |
Договора стандартные?
Если договора шаблонные, то всё довольно просто. Тогда даже не нужен семантический анализ -- достаточно
1) повырезать интересующую вас информацию, ориентируясь по ключевым словосочетаниям и их взаиморасположению
2) отформатировать полученные текстовые переменные к нужному типу (CLng(), CCur() и пр)
3) распихать по нужным таблицам
т.е. В таком случае, вся работа сводится к настройке пары шаблонов.
Если же договора не укладываются в стандартный набор шаблонов, то тут действительно нужен семантический разбор и, возможно, ИИ.