best-doctor / import_me

Python library to simplify importing data from xls/xlsx
MIT License
11 stars 12 forks source link

Стратеги поиска данных в файле #21

Open yakovistomin opened 4 years ago

yakovistomin commented 4 years ago

Проблема 1: Сейчас парсер получает данные из первого (активного) листа xlsx файла.

Не обработаны случаи:

Проблема 2: Сейчас заголовок таблицы ищется в строке header_row_index страницы.

Не обработаны случаи:

Проблема 3: Под таблицей с данными может быть колонтитул (например ячейки с местами для подписи).

Не решена проблема определения последней строки с данными. Сейчас можно или указать last_row_index, или завязаться на наличие значение в какой-то из колонок и делать SkipRow для всех строк, у которых в этой ячейке нет данных. Кажется, что этого мало.

Решение Предлагаю ввести понятия:

Стратегия поиска листа с данными

Актуально только для xlsx документов

Стратегия поиска заголовка таблицы с данными

Стратегия поиска первой строки с данными

Стратегия поиска последней строки с данными