В BI Конструкторе можно создавать датасеты из CSV-файлов. При загрузке файла могут возникать ошибки из-за некорректных разделителей, форматов данных или других особенностей файла. Ошибки могут нарушить структуру данных, и информацию не получится загрузить в датасет.
В статье расскажем, какие ошибки могут возникнуть при импорте данных из CSV‑файлов и как их избежать.
Возможные ошибки:
- разные разделители в файле,
- разделители внутри строк,
- несовпадение форматов дат,
- неправильная кодировка файла,
- лишние символы в числовых полях,
- неправильные типы данных колонок.
Если вы хотите создать датасет из CSV-файла, посмотрите статью
Как создать датасет.
Правильно настроить форматы и типы данных при импорте, поможет статья
Как настроить форматы и типы данных.
Разные разделители в CSV-файле
Если в файле используются разные разделители, это может привести к ошибкам при импорте. Например, часть данных разделена точкой с запятой ;
, а другая — запятой ,
. В результате структура файла будет нарушена, и данные будут считаны некорректно.
При импорте файла с разными разделителями BI Конструктор покажет ошибку или загрузит все данные датасета в одну колонку.
Решение. Проверьте разделители в CSV-файле и измените их на одинаковые. Например, используйте только точку с запятой.
Разделители внутри строки CSV-файла
Если в тексте строки есть символ, который совпадает с разделителем файла, структура датасета может нарушиться. BI Конструктор воспримет этот символ как границу новой колонки и сместит данные в таблице датасета.
При импорте файла BI Конструктор покажет ошибку.
Решение. Уберите лишние разделители в файле или добавьте двойные кавычки к текстовым данным. Например запишите строку как 2025-02-01:"Магазин: в ТЦ Глобал":550000.0:Антон Смирнов
. После этого информация в датасете будет отображаться правильно.
Перед импортом рекомендуем проверить весь CSV-файл в текстовом редакторе и убедиться, что все данные записаны корректно.
Разные форматы дат в CSV-файле
Если даты в файле записаны в разных форматах или с разными разделителями, конструктор может неправильно их распознать. Например, если даты записаны как 2025-03-01
, а в настройках выбран формат день/месяц/год (DD/MM/YYYY)
. BI Конструктор не сможет распознать эти значения как даты.
В результате строка датасета может остаться пустой или отображаться как текст.
Решение. Приведите все даты к единому формату. Например, запишите даты в формате DD/MM/YYYY
или DD-MM-YYYY
и используйте одинаковые разделители во всем файле.
Неправильная кодировка CSV-файла
Если при импорте указать неподходящую кодировку файла, вместо текста появятся нечитаемые символы. Работать с такими данными в датасете не получится.
Решение. Выберите другую кодировку в настройках или попробуйте сохранить CSV‑файл в текстовом редакторе с кодировкой UTF-8.
Лишние символы в числовых полях
Если в числовых полях есть текст или опечатки, BI Конструктор может неправильно обработать информацию. Например, если вместо цифры 0
окажется буква O
, в датасет попадут некорректные данные.
При импорте файла BI Конструктор не покажет ошибку, но данные будут некорректно записаны в датасет.
Решение. Исправьте символы и убедитесь, что все значения в числовых полях записаны правильно.
Неправильные типы данных для колонок датасета
Если выбрать неправильный тип данных для колонок, информация может записаться некорректно или не отображаться в датасете. Например, если для числовой колонки задать тип Дата, BI Конструктор покажет пустую колонку в датасете.
Решение. Убедитесь, что для каждой колонки выбран подходящий тип данных. Он должен совпадать с форматом данных в импортируемом файле.
Коротко
- В BI Конструкторе можно создавать датасеты из CSV-файлов, но при импорте могут возникнуть ошибки.
- Разные разделители в файле могут нарушить структуру данных. Убедитесь, что во всем файле используется один тип разделителей.
- Символы разделителей внутри строк могут сместить данные в датасете. Используйте кавычки, чтобы выделить текстовые данные или удалите лишние символы из строк.
- Если даты в файле записаны в разных форматах, конструктор может неправильно их распознать. Приведите даты к единому формату и используйте одинаковые разделители.
- Неправильная кодировка файла может отобразить текст как нечитаемые символы. Выберите другую кодировку в настройках или попробуйте сохранить CSV-файл в текстовом редакторе с кодировкой UTF-8.
- Лишние символы в числовых полях могут привести к некорректному считыванию данных. Убедитесь, что в числовых колонках нет текста, пробелов или опечаток.
- Неправильные типы колонок могут привести к пустым или некорректным данным в датасете. Проверьте, что типы данных колонок совпадают с форматом импортируемого файла.
Рекомендуем прочитать: