Программа, которая запускается из командной строки и автоматически извлекает данные из PDF-квитанций коммунальных услуг в CSV / Excel.
[gif show]
Есть инструмент для проверки (Инструмент Проверки Коммунальных Счетов)
Чтобы проверить правильно ли начислены суммы в квитанциях, - из каждой квитанции мне нужны одинаковые данные: объем, тариф, сумма. НО: все квитанции приходят от разных компаний и имеют разный формат.
Исследовать возможность одновременного извлечения данных из нескольких файлов.
=> Создание парсера.
=> Логика парсера
CSVExcel[схемка]
[gif с демонстрацией]
Основная сложность — различие форматов PDF у разных поставщиков. Поэтому под каждый тип квитанции (каждый отдельный PDF-файл) адаптировала отдельную функцию. Т.е. решение пока не унифицировано - нельзя взять любую квитанцию и получить из нее данные. Под каждый новый вид квитанции код нужно адаптировать. Пока что.
[ссылка на репозиторий]