Завантаження даних із папки

Дозвольте встановити для вас сценарій. Ви отримуєте файл даних з автоматизованої системи, він має однакову кількість стовпців, але дані змінюються для кожного нового файлу. Будучи досвідченою особою в даних, ви вже деякий час працюєте в Excel, щоб створити шаблон, куди ви можете скопіювати нові дані, а потім автоматично всі ваші рівняння та графіки магічно працюють. Ви поплескуєте себе по спині і радісно розсилаєте свій фантастичний звіт усім, кого знаєте. Тоді завтра, коли дані знову прийдуть до вас, ви повторите той самий процес знову. Ви все ще захоплені своїм чудовим звітом, ви надсилаєте його знову, знаючи, що заощадили стільки часу, що не потрібно робити аналіз або створення звітів знову і знову. Тепер перемотуйтеся вперед на 3 місяці. Цей дурний звіт з’являється знову, і тепер вам доведеться перетягувати всі ці дані з файлу в файл, і з сумлінням ви розіслали свій звіт. Таким чином, є сховище аналітика. Ви любите дані, але ненавидите їх також. У цьому підручнику я покажу вам, як усунути біль у процесі постійного завантаження даних, завантаживши нові дані з папки.

Додому стрічка

У моєму попередньому дописі (знайденому тут) йдеться про завантаження даних із папки. У цьому посібнику ми додамо деяку логіку до цього методу, яка буде переглядати папку, але завантажуватиме лише останній доданий елемент із цієї папки.

Дані для цього підручника знаходяться за цим посиланням Щомісячний Zip-файл даних. Ці дані у файлі ZIP є щомісячною вибіркою даних з лютого 2016 року по квітень 2016 року.

Завантажте zip-файл, згаданий вище, і витягніть Щомісячні дані папку до робочого столу. Відкрийте PowerBI Desktop і натисніть на Отримати дані і виберіть Всі з лівого боку. Клацніть на пункт із міткою Папка і натисніть Підключіться продовжувати.

Виберіть нещодавно розпаковану Щомісячні дані папку, яка повинна бути на вашому робочому столі. Клацніть в порядку продовжувати. Після відкриття цієї папки ви отримаєте кілька файлів. Клацніть Редагувати для редагування запиту.

Тепер ви знаходитесь у редакторі запитів. Тут вигадливе редагування запитів буде працювати на нашу користь. Ми могли б завантажити всі дані в один великий запит. Однак, залежно від розміру наборів даних або способу подання даних, це може бути не завжди бажаним. Натомість вам можуть знадобитися дані лише з квітня, а потім із травня, коли нові дані будуть надіслані наступного місяця.

Таким чином, нашим першим кроком для початку об’єднання даних буде спочатку фільтрування файлів у послідовному порядку. У цьому випадку, оскільки я назвав файли у форматі Рік-Місяць-День, я можу сортувати файли відповідно до їх назв.

Примітка. Під час використання робочого столу PowerBI рекомендується називати файли, що починаються з імені файлу РРРР-ММ-ДД. Це робить його дуже простим при сортуванні та передачі інформації в PowerBI. Я використовував інші стовпці інформації, такі як Дата доступу або Дата створення раніше, але отримував суперечливі результати, оскільки ці дати можуть змінюватися залежно від того, коли файл було переміщено або скопійовано з одного місця в інше.

Клацніть спадне меню поруч із Ім'я і відсортуйте файли в Сортувати за спаданням.

Це розміщує файли з останнім файлом у верхній частині списку.

Потім натисніть на Дотримуйтесь рядків кнопку на Додому стрічки, виберіть Дотримуйтесь верхніх рядків.

Введіть номер 1 коли з'явиться спливаюче вікно. Клацніть в порядку продовжувати.

Тепер ви помітите, що вибрано лише один файл - наш останній файл із квітня. Клацніть на кнопку Завантажити файл, знайдену в Зміст стовпець.

Ми завершили дії в редакторі запитів і тепер можемо завантажувати дані. Клацніть Закрити та застосувати знайдено на Додому стрічка. Усі наші квітневі дані завантажені. склавши просту таблицю, ми можемо бачити всі дані, які щойно завантажились.

Тепер ми видалимо деякі дані з нашої папки на робочому столі, позначені щомісячними даними. Відкрийте папку на робочому столі з написом Щомісячні дані і видаліть поданий ярлик 2016-04-01 квітня. Тепер у вас повинна бути папка з міткою Щомісячні дані лише два файли, один на лютий і один на березень.

Поверніться до Power BI Desktop і клацніть на Оновити кнопку на Додому стрічка. Зверніть увагу, як змінилися всі наші дані. Зараз ми розглядаємо дані за березень, оскільки це найновіший файл у нашій папці на основі імені файлу.

Щоб перевірити це, ми відкриваємо редактор запитів (Клацніть на Редагувати запити на Додому стрічка). Клацніть Оновити попередній перегляд на Додому стрічки і нарешті виберіть Застосований крок, який називається Зберігаються перші ряди. Це покаже місяць березень як джерело наших даних.

Тепер кожного разу, коли ви додаєте новий файл до нашої папки та оновлюєте PowerBI, найновіший файл (на основі принципу іменування, про який ми вже говорили раніше) завжди буде завантажений.

Примітка: Цей метод чудово працює, коли джерело даних надходить з автоматизованої системи. Формат файлу завжди повинен бути однаковим, щоб це працювало надійно. Якщо конвенція про імена файлів змінюється, або змінюється кількість стовпців або розташування цих стовпців, тоді запит, швидше за все, не вдасться.